setembro 1, 2015

UNA NUOVA FRONTIERA DI STUDIO NELLA FONOLOGIA ITALIANA: LA PROSODIA, IN PROSPETTIVA SOCIOLINGUISTICA E STORICA

PDF

 

Marco Barone[1]

 

1) Dialetti e varietà: un’introduzione socio-linguistica.

Nel panorama sociolinguistico italiano, accanto allo studio dei dialetti, nella fonetica e fonologia, esiste un secondo livello di differenziazione diatopica: lo studio delle varietà locali dell’italiano orale, comunemente denominate “parlate”, fortemente influenziate dai dialetti stessi, e la cui analisi procede in parallelo con essi. Nel corso degli anni la letteratura variazionista dell’italiano si è soffermata abbondantemente sullo studio di foni e fonemi come unità adiacenti e consecutive in una successione temporale lineare, e sulla loro associazione a parti di significato, ovvero sul cosiddetto livello “segmentale” della variazione fonetica e fonologica, sia da un punto di vista puramente sincronico e descrittivo, sia nell’analisi del mutamento e del contatto, arrivando a determinare una suddivisione diatopica in macro-aree delimitate da isoglosse, che corrispondono perlopiù alle macro-aree che classificano i dialetti su base sopra-regionale.

barone10barone1

Fig 1a,b. Le aree dialettali e le due principali isoglosse italiane segmentali.

Per avere una misura della distinzione tra dialetti e varietà dell’italiano e tra varietà dell’italiano e italiano standard, possiamo considerare il seguente esempio, elaborato apposta per mostrare una certa gamma di differenze: la terna di trascrizioni fonetiche della frase italiana “Sarebbe una buona cosa se non ci andassi per niente al suo posto, in chiesa con lui. Perché non scendi un po’ prima, come sempre?” con pronuncia standard, locale e della sua traduzione nel dialetto locale.

ITALIANO STANDARD:

[sa’rɛb:e una ‘bwɔna ‘kɔza se ‘non ʧi an’das:i per ‘njɛnte al ‘suo ‘posto in ‘kjɛza kon ‘lui̯ per’ke ‘non ‘ʃendi um ‘pɔ ‘p:rima ‘kome ‘sɛmpre]

ITALIANO LOCALE (PESCARA, ITALIA ORIENTALE)

[sa’reb:e una ‘b:wɔna ‘kɔsa se ‘n:on ʧan’das:i pe ‘n:jɛnte ‘al ‘suo ‘pɔsto in ‘kjesa ko ‘l:ui̯ pe’k:e no ‘ʃɛndi um ‘pɔ ‘prima ‘kome ‘s:ɛmpre]

DIALETTO LOCALE (PESCARA)

[‘fus:ǝ na kɔsa ‘b:onǝ si nʤi ‘jis:ǝ pi ‘n:ind a lu ‘puʃta ‘su ala k:jesǝ ngi es:ǝ pik:e niŋ gilǝ nuk:unuʧ:ǝ n:anʣǝ ɲa fi simbrǝ]

Dall’esempio ci appare una enorme differenza, oltre il limite dell’intelligibilità, tra dialetto e italiano locale, e una molto meno rilevante tra italiano locale e italiano “standard”, corrispondente cioè alla norma della dizione. La trascrizione fonetica fa notare le distinzioni tra vari allofoni, come [e] in italiano locale al posto di [ɛ] standard ([‘kjesa], [sa’reb:e]) , e viceversa ([‘ʃɛndi]), [ɔ] al posto di [o] ([‘pɔsto]), [s] al posto di [z] ([‘kjesa], [‘kɔsa]), i raddoppiamenti fonosintattici, caratterizzati da consonante geminata, o “doppia”, in inizio di parola ([‘n:on], [‘s:ɛmpre]) in italiano locale che mancano nell’italiano standard e viceversa ([‘p:rima]), raddoppiamenti iniziali di altra natura ([‘b:wɔna]). Addirittura, in certi casi dialetto e italiano hanno la stessa pronuncia e la parlata locale si differenzia per ipercorrettismo (come nel caso del fonema ɔ in [‘pɔsto]). Sembrerebbe dunque, a prima vista, che i dialetti non abbiano lasciato una impronta molto profonda a fronte della impietosa standardizzazione di questa varietà locale di italiano. Vi è un elemento, tuttavia, al cui riguardo la trascrizione fonetica non è in grado di fornire alcuna informazione, che sfugge alla norma e marca invece una profonda somiglianza tra ciascuna varietà e il suo dialetto corrispondente e la cui variazione nello spazio, d’altronde, sia nei dialetti sia nelle varietà, è ben più frammentata di quanto una suddivisione geografica mediante isoglosse possa riprodurre. Si tratta dell’aspetto prosodico, o soprasegmentale della lingua.

 

2) L’accento e il livello soprasegmentale: un’introduzione tecnica alla prosodia.

Per capire la natura di questo livello linguistico dobbiamo innanzitutto analizzare la nozione di accento. L’accento di parola corrisponde in italiano a certe proprietà privilegiate di una sillaba all’interno di una parola data. Tale sillaba, che verrà detta sillaba accentata, o tonica[2], potrà ricevere un certo tipo di “risalto” rispetto alle altre, dato dalla concorrenza di tre fattori: una maggiore durata, una maggiore intensità, o volume, e infine, una diversa frequenza melodica. Nella trascrizione fonetica, la sillaba che possiede tale accento di parola è preceduta da un apostrofo. Le proprietà che ci consentono di riconoscere qual è la sillaba tonica sono dunque: 1) è quella che dura di più, 2) è pronunciata a voce più alta, ma soprattutto è l’unica su cui la voce imposta un movimento melodico speciale, diverso dalle altre. Nel grafico in basso possiamo osservare gli spettrogrammi della pronuncia in isolamento delle parole italiane “nomino” e “nominò”.

 

barone4barone3

Fig. 2 La parola “nomino” [‘nɔmino] e la parola [nomi’nɔ].

Lo spettrogramma è un grafico che tiene conto di numerose proprietà dell’emissione vocalica. Il segnale acustico arriva sotto forma di onda composta, che lo spettrogramma suddivide come somma di onde più semplici, le cui frequenze ci permettono di riconoscere le vocali e sono indicate, nel grafico, dal livello delle striature orizzontali grigio-nere nel margine basso degli spettrogrammi. La scurezza del loro colore, più o meno tendente al nero, rappresenta il volume, o intensità, e la durata temporale è data, ovviamente, dalla loro estensione orizzontale. Se le striature in grigio-nero rappresentano le frequenze di vibrazione delle cavità sopra-laringali, l’altezza della curva continua sovrapposta al diagramma rappresenta invece la frequenza di vibrazione della glottide ed è chiamata frequenza fondamentale. La frequenza fondamentale è oggetto di studio dell’intonazione: la sua altezza viene percepita come un’impressione melodica, la nostra impressione, cioè, che il parlante stia collocando su una certa sillaba una nota musicale più o meno acuta, o un certo movimento musicale, ascendente, discendente, etc. Nell’esempio riportato, nella figura di sinistra (“nòmino”) possiamo notare come le striature orizzontali siano leggermente più scure e più estese in lunghezza in corrispondenza della prima sillaba, mentre nella figura di destra (“nominò”) saranno leggermente più scure e allungate in corrispondenza della terza. Ciò lascia concludere che la sillaba tonica sia la prima, nel primo caso e l’ultima, nel secondo, ma abbiamo bisogno di un software come quello usato, oppure di un eccellente orecchio per emettere tale verdetto. La differenza più evidente tra i due segnali acustici, e la più riconoscibile da un orecchio qualunque, e senza bisogno di computer, è chiaramente cifrata nell’andamento molto diverso delle curve di frequenza: nella figura di sinistra la prima sillaba, che è quella tonica, riceve un movimento discendente, una “caduta” della nota musicale della voce, mentre sulle altre sillabe l’altezza musicale rimane piatta, invariata. Nella figura di destra, al contrario, è la terza sillaba a ricevere lo stesso andamento musicale “speciale”, ossia una caduta.

Perché non dire allora che tale movimento melodico speciale che ci consente di riconoscere la sillaba tonica è una caduta di altezza tonale e definire la sillaba tonica come “la prima sillaba a partire dalla quale tutte le altre mostrano una tonalità più bassa”? Vi sono almeno due ragioni che non ci consentono di concludere come sopra. Abbiamo mostrato degli spettrogrammi di parole pronunciate in isolamento. Ma le parole in isolamento non sono eventi linguistici reali. Chiediamoci piuttosto: cosa accade poi, davvero, in una frase? E nel discorso?

Come si vede dall’esempio della lunga frase trascritta foneticamente, tutte le parole hanno al massimo una sillaba tonica ed alcune non ne possiedono. Abbiamo detto che la sillaba tonica è l’unica che può ricevere un movimento melodico speciale di “risalto”. Nella pratica però, può accadere che neanche l’unica candidata lo riceva e che una parola dotata di sillaba tonica venga pronunciata senza alcun “movimento speciale”. Tale movimento di “risalto” si indica in prosodia con il nome di “prominenza” o “accento frasale” e verrà descritto meglio nella prossima sezione. Ad esempio, riprendendo la frase trascritta foneticamente, è raro che tutte le sillabe toniche abbiano di fatto una prominenza. Possiamo benissimo immaginare, in una parlata rapida, di pronunciare la frase lasciando molte parole senza prominenza, parole con funzione puramente grammaticale ma anche elementi lessicali come “chiesa” e “scendi”. In secondo luogo, anche quando la prominenza è presente, non sempre il movimento melodico speciale che la identifica è una caduta della frequenza, dipende invece dalla posizione della parola all’interno della frase, dalla modalità sintattico-pragmatica della frase, ma anche, soprattutto, dalla lingua o dalla varietà linguistica analizzata. Se collochiamo la nostra parola in fondo alla frase, è molto probabile che riceva un accento. Nelle dichiarative semplici, quasi tutte le varietà dell’italiano e molte lingue romanze (ma non, ad esempio, il castigliano) mostrano un comportamento della prominenza sull’ultima sillaba tonica della frase che è simile a quello della parola in isolamento, cioè un movimento discendente. Se prendiamo però un’interrogativa polare, più comunemente nota come domanda “sì o no”, possiamo osservare che le cose cambiano:

 

barone6 barone5

Fig. 3a,b Dettaglio delle parole “nomino” e “nominò” all’interno delle frasi interrogative “Non lo nomino?” (a) e “Non lo nominò?” (b)

Come si vede dal grafico, sulle rispettive sillabe toniche notiamo un primo breve movimento ascendente iniziale, seguito da un movimento discendente. Se osserviamo il grafico di sinistra, il livello si mantiene costante sulla sillaba post-tonica e risale alla fine della frase. Nella figura di destra, dove la sillaba post-tonica non è presente, la risalita è invece imminente. Vediamo dunque che in questo caso, lo speciale movimento che contraddistingue la sillaba tonica è un doppio movimento ascendente-discendente. È questa dunque la definizione di accento, ma solo per le domande polari? Possiamo dunque affermare che “la sillaba tonica è 1) la prima a partire da cui la frequenza scende, se si tratta di una dichiarativa o 2) quella su cui la frequenza sale e scende nelle interrogative polari”? La risposta è ancora no: tale definizione, complessità a parte, è limitata a una certa varietà (nel caso, Pescara) di una certa lingua (italiano), come si può vedere dalle figure in basso.

barone7barone8

Fig. 4a,b Interrogativa polare nelle varietà dell’italiano di Napoli (a) e Pisa (b)

 

barone9

Fig 4c Interrogativa polare  nel Portoghese brasiliano, varietà di Recife

A differenza di Pescara, a Napoli quello che accade sulla sillaba tonica è un movimento ascendente per quasi tutta la durata della sillaba, seguito da una discesa soltanto alla fine di essa, che dura fino al termine della frase. A Pisa troviamo addirittura, sulla sillaba tonica, una discesa, seguita da una risalita, e poi una discesa verso la fine della frase. Nel portoghese brasiliano di Recife si nota un tono piatto o lievemente discendente lungo l’ultima sillaba tonica con una salita improvvisa a fine frase. Come definire allora l’accento di parola? Dovremmo forse optare per “Quella sillaba che riceve un movimento discendente nelle dichiarative italiane, e uno ascendente-discendente nelle interrogative, se pronunciate a Pescara, ma discendente-ascendente se a Pisa?” È evidente che dobbiamo arrenderci all’idea che, per quanto possa sembrare strano, che l’unica definizione possibile di accento di parola attraverso il parametro di frequenza passa per una definizione preliminare di accento di frase, o di prominenza prosodica. Una sillaba tonica è semplicemente quella che “in certi contesti riceve una prominenza”, e una definizione più precisa di prominenza verrà data nella sezione 3.

2) Il panorama storico-linguistico dell’Italia: un’introduzione storica

A differenza di molte nazioni che vantano da secoli una unità politica consolidata, che rispecchia un’altrettanto forte omogeneità linguistica, l’Italia mostra una impressionante variazione socio-linguistica, a causa della sua storia recente come paese unificato. In epoca moderna, la penisola italiana è stata divisa in stati vari e di varie dimensioni, i più estesi dei quali furono il Regno di Napoli, che comprendeva l’intero Sud, sotto il dominio e l’influenza francese e spagnola, e lo Stato Pontificio, sede della Chiesa Cattolica. L’Italia settentrionale e centrale, tuttavia, oltre a Stati di dimensione intermedia (Granducato di Toscana, Repubblica di Venezia, Ducato di Milano, Ducato di Savoia) era intramezzata da una miriade di piccoli stati e città-stato. Uno dei più importanti tentativi di unificazione risale al 1847, quando gli stati di appartenenza dei Savoia vennero unificati sotto il Regno di Sardegna, che fu l’origine della Monarchia italiana, nel 1861.

 

barone10

Fig. 5 La suddivisione politica dell’Italia

La lingua italiana nacque, come lingua scritta, come tentativo, da parte di politici, accademici, scrittori, personaggi culturali di rilievo ed editori di testi scolastici, di creare una versione standard unica a partire dalle lingue romanze (meglio conosciute come “dialetti”) che erano parlate lungo tutta la penisola, sin da quando il tentativo di trasmissione del latino agli strati analfabeti della popolazione fallì. In fatto di regole e nella sua forma scritta, l’italiano era basato sul dialetto fiorentino, già dotato di un ricco patrimonio scritto e noto alla stampa dai tempi di Dante ed in seguito passò ad includere tratti e specificità di altre varietà dominanti, specialmente quella romana.

Tuttavia le regole di uno standard orale comune non furono mai stabilite finché non giunsero a richiederlo le prime espressioni di arte, come cinema e teatro, che cercarono, attraverso la dizione, di creare una norma nazionale in fatto di pronuncia dei fonemi e delle unità fonologiche. Tale norma raggiunse uno status ufficiale nel corso del tempo, e i dizionari finirono per convergere su di essa. Tuttavia tale norma non includeva la prosodia, e a tutt’oggi non esiste alcuna parvenza di regolamentazione o accordo su cosa dovrebbero essere dei tratti ritmico-intonativi “standard” o “corretti”, né, di fatto, è pensabile.

L’italiano arrivò nelle scuole come lingua scritta e, al momento di essere insegnato, la pronuncia dei professori locali presso ciascuna comunità, riflettevano tratti propri del rispettivo dialetto locale, soprattutto a livello dell’intonazione. Nessuno portò nelle scuole d’Italia l’intonazione fiorentina, soltanto i libri. Si vennero così a creare intonazioni locali dell’italiano, plasmate sul dialetto, in ogni singola realtà geografica.

Per rovesciare un po’ lo stereotipo e la connotazione negativa che l’espressione “dialetto” sottintende, facciamo osservare quindi che, mentre i dialetti sono lingue a tutti gli effetti, dotati di un’oralità e di un’intonazione propria, l’italiano Standard è un concetto sub-linguistico incompleto, un modello scritto e astratto, da colmare dotandolo di un’oralità e di un’intonazione. Fu dunque con estrema naturalezza che i popoli trasferirono i tratti del proprio dialetto a tale oggetto sub-linguistico creando le varietà locali dell’italiano. Ciò iniziò a cambiare, ma molto lievemente, con l’arrivo della radio e della televisione, durante il XX secolo, ma ancora oggi qualsiasi intonazione dell’italiano riflette principalmente l’intonazione del dialetto locale, sia esso ancora molto usato o quasi estinto.

Alcuni tratti soprasegmentali furono diffusi dagli annunciatori televisivi, provenienti principalmente da Roma e da Milano, in quanto sedi delle televisioni, istruiti a seguire una determinata norma segmentale, o toscani, reclutati a causa della loro naturale “correttezza”. A livello dell’intonazione, però, essi stavano diffondendo alla nazione intera tratti provenienti dalle loro realtà linguistiche d’origine. Tuttavia lo stile dell’annunciatore televisivo è molto povero dal punto di vista delle tipologie frasali, pieno di dichiarative semplici e privo invece di quasi tutte le modalità più diversamente connotate, quali interrogative, imperative, esortative.

La cultura cinematografica neorealista contribuì a far conoscere le intonazioni regionali, soprattutto attraverso i dialetti delle principali città: quelli centrali, che sono varietà dell’italiano anche a livello segmentale, quali il fiorentino e il romanesco, e quelli invece più distanti, il genovese, i dialetti siciliani, il napoletano, etc. Fu invece probabilmente grazie alle figure dei comici e del varietà, uno stile televisivo più spontaneo e interattivo, ma che al contempo deve attenersi a un criterio di intelligibilità e a una norma orale condivisa, che acquistarono fama i cosiddetti “accenti” regionali, le varietà dell’italiano orale.

In letteratura vi è una certa condivisione unanime sul fatto che la prosodia regionale italiana sia nata dal substrato dialettale: molti linguisti usano la parola “regionale” per indicare tutti i tratti di provenienza dialettale. Possiamo citare Canepari, “coloro che hanno eliminato le caratteristiche articolatorie marcatamente regionali della loro pronuncia conservano le strutture intonative della loro parlata originaria: ché sono le più difficili da modificare” (Canepari, 1979) o Pellegrini “La pronuncia dell’italiano regionale svela quasi sempre il sottofondo dialettale che fa capolino […]” (Pellegrini, 1960) o De Mauro “La persistenza della prosodia dialettale nell’uso regionale dell’italiano crea, a livello prescientifico, la possibilità facile ed immediata di riconoscere la provenienza regionale d’un parlante” (De Mauro, 1970).

Se la dialettologia e la sociolinguistica variazionista diatopica hanno investito molte energie sul livello fonetico-fonologico segmentale, non si può certo dire che altrettanta attenzione sia stata dedicata al livello soprasegmentale della fonologia, che, come abbiamo già cercato di definire, tiene conto non di “quale sia” il materiale fonico pronunciato, di quali varianti allofoniche siano preferite in ciascuna area, ma piuttosto di “come” tali fonemi e tali varianti vengano pronunciati, della distribuzione degli accenti e della natura acustica degli stessi, specialmente nella variazione di durata e di frequenza musicale dei movimenti che li compongono: in altre parole, lo studio di quella che viene comunemente denominata la “cantata” di una lingua o dei cosiddetti “accenti” locali.

4) Studi prosodici: il sistema metrico auto-segmentale e il sistema ToBI

La prosodia si basa in primo luogo sul concetto di prominenza frasale, una caratteristica che attribuiamo ad ogni sillaba che si contraddistingua acusticamente per un movimento acustico riconoscibile come volontario e che viene a “interrompere una melodia inerziale”. La prosodia si divide in due grandi ambiti di ricerca: il ritmo, che studia la distribuzione delle prominenze, cioè quante e quanto frequenti esse siano, e l’intonzione, che si occupa di descrivere la loro natura, cioè di comprendere quali prominenze esistano in una lingua e quali vengano utilizzate, a seconda dei contesti, e con quale significato. E proprio il rapporto tra fenomeno acustico e significato è oggetto di studio di quella parte dell’intonazione che prende il nome di fonologia dell’intonazione, o fonologia prosodica. In molte lingue romanze, la distinzione tra frasi come:

“Gianni mangia la mela.”

“Gianni mangia la mela?”

“Gianni mangia la mela!”

“Gianni, mangia la mela!”

“Gianni mangia la mela??”

che ortograficamente è realizzata solo attraverso la punteggiatura, a livello orale viene espressa dall’andamento musicale della voce, di quella che percepiamo come la “melodia” della frase, e che in termini tecnici è data dal grafico della frequenza fondamentale, ossia la frequenza di vibrazione della glottide, denominata con f0. A variare, soprattutto, nell’esempio in questione, è la melodia musicale che percepiamo intorno alla sillaba tonica “me” di “mela”, che ci avverte da un lato se si tratta di una domanda, di un’affermazione, di un ordine, etc. e dall’altro se presuppone sorpresa, ovvietà, etc.

Questa melodia musicale, questa nota o insieme di note musicali che percepiamo attorno alla ultima sillaba tonica della frase, spesso ci aiutano anche a distinguere i valori pragmatici tra frasi collocate in contesti come:

“Cosa mangia Gianni?”

e

“(Mi hai chiesto) cosa mangia Gianni?”

Vi sono prominenze (cioè, appunto, melodie peculiari) distinte sulla sillaba “Gian” delle due frasi, che servono a distinguere due diverse intenzioni pragmatiche, ma la differenza che distingue queste intenzioni pragmatiche varia a sua volta da lingua a lingua, o, nel nostro caso, da varietà a varietà dell’italiano. Il compito della fonologia dell’intonazione è quindi paragonabile a quello della codifica scritta di una lingua orale, in cui si cimentarono molti linguisti nell’antichità, e in tempi più moderni anche i linguisti antropologi con le lingue indigene: consiste cioè nel comprendere quali sono le unità minime e come esse si compongono.

È necessario, per fare questo, stabilire innanzitutto una “sincronizzazione” tra il livello segmentale e quello soprasegmentale, capire quali sono le unità sintattiche che possono contenere nessuna, una o più prominenze, e come descrivere in termini oggettivi queste ultime, in termini di un “alfabeto” di unità minimali. È questo il quadro teorico del sistema metrico autosegmentale e del sistema di etichettatura ToBI.

Il sistema metrico autosegmentale è un modello teorico, oltre che un metodo, per l’analisi fonologica della prosodia e della sua relazione con il materiale segmentale. Le sue origini si fanno risalire agli articoli di Bruce (1977), Goldsmith (1979) e Liberman & Prince (1977) che per primi lanciarono l’idea di un livello soprasegmentale indipendente da quello segmentale, contenente le specificazioni tonali e quelle della struttura metrica. Bruce parla di “associazione tra toni e materiale segmentale”, Goldsmith per primo parla dell’esistenza di due livelli, quello dei toni, e un altro delle “unità portatrici di toni” e di un legame tra i due. Liberman, infine, studia la relazione tra costituenza sintattica e prosodia, congetturando le prime regole e restrizioni sui suoi possibili aspetti. Egli introduce i concetti di nucleo e di accento nucleare, che è associato alla sillaba più forte, di solito l’ultima, di ciascun costituente.

Dobbiamo attendere il 1980 e la tesi di dottorato di Janet Pierrehumbert per vedere la costruzione di un vero e proprio modello di analisi dei contorni intonativi come una serie di movimenti tonali, chiamati accenti di frequenza e toni di frontiera, catalogati in un inventario finito, la cui interpolazione lineare dà approssimativamente il contorno intontivo. Ogni tono è un livello “bersaglio” di altezza melodica, di norma alto (H) o basso (L), ma vi sono anche il medio (!H) e il super-alto (¡H). L’accento di frequenza, associato a una sillaba tonica, è un movimento composto tra bersagli tonali e può essere monotonale (H*, L*) o bitonale (H+L*, H*+L, L+H*, L*+H, H+H*, L+¡H*, etc.), dove l’asterisco indica il tono che più si allinea con la vocale della sillaba tonica. I toni di confine si dividono in accenti di sintagma (H-, L-, !H-), che segnano il comportamento dopo l’accento di frequenza e fino alla fine del costituente, e toni di frontiera di frase intontiva o boundary tones (H%, L%, !H%) che costituiscono un bersaglio tonale alla fine dell’intera frase intonativa. La proposta porta alla creazione di un sistema di annotazione o trascrizione prosodica ToBI (Silverman, 1992).

Secondo il ToBI (“Tone and Break Indices”), possiamo attribuire a ogni frase un livello ortografico, o segmentale, un livello soprasegmentale che contiene gli accenti di frequenza e i toni di confine, e un livello ulteriore di comunicazione tra i due, quello dei break indices che marca i punti in cui avviene la divisione prosodica tra costituenti e il livello prosodico di ogni separazione, il cui indice può variare da “0” (nessuna separazione tra due parole), fino a “4” (frontiera dell’intero sintagma intontivo). Il confine di indice “3”, ad esempio, segna la separazione tra due “sintagmi intermedi”, ognuno dei quali deve contenere almeno un accento di frequenza e al termine dei quali troviamo l’accento di sintagma). L’ultimo sintagma intermedio all’interno di un sintagma intontivo contiene sempre l’accento nucleare, un accento di sintagma e il tono finale di frontiera intontiva.

Grazie a questo sistema di annotazione sono stati descritti i sistemi intonativi di diverse lingue, con l’inventario degli accenti e dei toni di confine delle stesse, prima fra tutte la proposta di (Beckman & Ayers 1994), per l’inglese e più recentemente, Cat_ToBI per il catalano (Prieto, 2002, Prieto et al., 2007), Sp_ToBI per lo spagnolo (Beckman et al., 2002, Face & Prieto, 2006/2007), il portoghese europeo (Frota, 2000), il francese (Jun & Fougeron, 2000), Oc_ToBI per l’occitano (Hualde, 2003, Prieto & Sichel-Bazin, 2007-2010).

Nel caso dell’italiano il sistema ToBIt (Avesani, 1995) basato sull’intonazione fiorentina, definisce un inventario di 5 possibili accenti nucleari e 4 toni di confine, come primo passo verso un sistema di trascrizione delle intonazioni italiane. Successivamente iniziano a sorgere diversi studi sulle singole varietà regionali. Il problema è trovare un inventario prosodico unico che consenta di comparare le diverse varietà, un po’ come l’alfabeto latino consente di trascrivere varie lingue. (Grice et. al, 2005) raccoglie in un unico sistema ToBI le varietà italiane di Bari, Palermo, Napoli e Firenze. Nel 2013 il lavoro di 8 ricercatori, coordinati da Barbara Gili-Fivela, del Centro per le Ricerche Interdisciplinari sul Linguaggio (CRIL) di Lecce, dà alla luce una proposta per un sistema comparativo di descrizione prosodica di 13 varietà dell’Italiano (Milano, Torino, Firenze, Lucca, Pisa, Siena, Pescara, Roma, Bari, Napoli, Salerno, Lecce, Cosenza).

Come le lettere C-A-S-A, e le sillabe CA-SA, pur essendo in sé prive di significato, si compongono a formare il valore semantico di “abitazione”, così lo studioso di fonologia dell’intonazione dirà che nell’italiano di Pescara il valore pragmatico “domanda a risposta multipla” (o domanda parziale, o domanda wh-) è associato alla sequenza di toni basso-alto-alto-basso-alto-basso (L-H-H-L-H-L), raggruppabili in unità composte come L+H* H-, L*+H L-L%. La “frase soprasegmentale”, detta anche contorno intontivo, è perciò divisa in unità soprasegmentali composte minori, detti accenti di frequenza, o usando l’espressione inglese, “pitch accents”, a loro volta composti da toni, un po’ come una parola è divisa in sillabe e poi in lettere. Si tratta perciò, per una determinata lingua o varietà linguistica, di decifrare gli alfabeti di unità intonative di due livelli, quello dei toni, relativamente semplice e l’inventario dei pitch accent, che includerà le combinazioni L+H* e L*+H.

Il lavoro più arduo, quando si tratta di dare un alfabeto comune a più varietà, è assicurarsi di differenziare tra loro tutte le possibili coppie di accenti che producono una differenza fonologica, cioè una differenza di significato, in almeno una varietà. Per capire quello che accade, immaginiamo di creare un sistema di scrittura comune all’italiano e al portoghese, tale che entrambe le lingue “si scrivano come si leggono”. Osserviamo, ad esempio, che la distinzione tra il fono corrispondente al suono [R] uvulare della parola “carro” ([kaRu]) e quello della [r] vibrante della parola “caro” ([karu]) è una distinzione fonologica in portoghese, o coppia fonologica minima, nel senso che serve a cambiare il significato delle parole (“carro” e “caro” hanno appunto due significati diversi).

In italiano, invece le pronuncie [karo] e [kaRo] corrispondono alla stessa parola (“caro”) e la seconda pronuncia può venire da un parlante che non riesce ad articolare la “r” vibrante e produce la cosiddetta “r moscia” oppure un parlante di una determinata provenienza geografica, dove il fono uvulare sostituisce di proposito quello vibrante (ex. Parma). Quindi diremo che la distinzione tra i due foni in italiano è soltanto fonetica. Per avere un alfabeto comune alle due lingue avremo dunque bisogno di due simboli distinti, poiché in almeno una delle due lingue (il portoghese), la distinzione è fonologica. Così avviene anche nel livello soprasegmentale. Nel prossimo paragrafo presenteremo i risultati dell’ultimo studio citato.

5) Un recente studio e una prospettiva geolinguistica

L’alfabeto intontivo proposto dall’equipe coordinata da Barbara Gili-Fivela nell’ultimo studio comparato sulle varietà dell’italiano include due pitch accent monotonali (H*, L*), 7 bitonali (H+L*, H*+L, L+H*, L*+H, ¡H+L*, L+ ¡H*, L+>H*) e 6 combinazioni di toni di confine (L-L%, L-H%, H-H%, H-L%, !H-!H%, !H-L%).

Nelle 13 varietà descritte, vengono analizzati 57 tipi pragmatici di frase, risultati dall’intersezione dei parametri di modalità (dichiarative, esclamative, interrogative, imperative, esortative, vocative), e per ciascuna modalità una o più sotto-connotazioni pragmatiche di presupposizione (sorpresa, dubbio, ovvietà, conferma), fuoco (ampio, ristretto, contrastivo), enfasi e altre (offerta, insistenza, retorica, etc.) Descriveremo le intonazioni di alcuni tipi frasali principali, e cercheremo di evidenziare come, a differenza di quello che avviene in dialettologia, sia molto complesso determinare dei settori geografici di continuità e tracciare delle isoglosse dell’intonazione, per la maggior parte dei tipi frasali. Ci soffermeremo, in particolar modo, sul contorno nucleare, cioè quello costituito dall’ultimo accento di frequenza (accento nucleare) e dal tono di confine finale.

Gli spettrogrammi che seguono illustreranno l’andamento di alcuni di questi movimenti. Le dichiarative semplici sono un tipo pragmatico il cui contorno intonativo (H+L*, L-L%) è comune in tutte le varietà studiate e la cui variazione in altezza dei bersagli tonali è puramente fonetica in ciascuna di esse.

 

barone11 barone12

Fig. 6a,b Dichiarativa semplice: (Pisa, H+L*, L-L%), variazione fonetica.

Anche i vocativi di chiamata, ad esempio, mostrano un comportamento omogeneo in tutto il territorio nazionale. Più interessanti sono invece le dichiarative con focus contrastivo, che si dividono in due opzioni principali: un contorno L+H*, L-L% a Milano, Torino, Firenze, Siena, Lucca, Napoli, Salerno e H*+L, L-L% a Roma, Pescara, Pisa, Cosenza, Bari, Lecce.

barone13 barone14

Fig. 7a,b Dichiarativa con focus: Firenze (a, L+H*, L-L%) e Bari (b, H*+L, L-L%)

Se cerchiamo una giustificazione geografica per questa distribuzione possiamo mappare i due contorni con colori diversi sulla cartina d’Italia e cercare di individuare le aree di continuità e i loro confini:

 

barone15

Fig.7c Distribuzione geografica delle dichiarative con focus: un’ipotesi di isoglossa

A prima vista, sembrerebbe esserci una specie di polarizzazione di tipo nord-ovest vs sud-est. Resterebbero tuttavia alcuni casi di difficile collocazione (Pisa, Roma). Se passiamo al tipo sintattico interrogativo, però, ci accorgiamo subito che la variazione intonativa è talmente grande, che qualunque tentativo di suddividere l’Italia in macro-aree, dividerebbe tra loro quasi tutte le varietà. Mostriamo qui in basso alcuni grafici della frequenza fondamentale di questo tipo frasale in molte varietà e di seguito una tabella con tutte le possibili combinazioni di accenti nucleari e toni di frontiera, in ciascuna di esse sono specificate le sigle delle varietà che la usano.

barone16 barone17

Fig. 8a,b Contorni intonativi delle interrogative polari: Bari (a, L+H* L-H%) e Lucca (b, H+L*, H-L%).

 

barone19 barone18

Fig. 8c,d Contorni intonativi delle interrogative polari: Torino (c, L*+H, H-L%) e Roma (d, H*+L, L-H*).

 

barone20 barone21

Fig. 8e,f Tabella e distribuzione geografica dei contorni intonativi delle interrogative polari.

Per semplificare la suddivisione, gli autori hanno raggruppato i possibili contorni in 4 tipologie, contrassegnate da colori distinti: ascendente-discendente, discendente-ascendente, ascendente-discendente-ascendente , discendente-ascendente-discendente. Nonostante la semplificazione, possiamo osservare che non esiste alcuna possibilità di individuare delle macro-aree, anche perché molte varietà utilizzano più di un contorno intonativo per questo tipo frasale.

Se tentiamo di applicare la stessa strategia alle domande parziali, otteniamo ancora una suddivisione estremamente complicata. Si intravede tuttavia la possibilità di eseguire una classificazione geografica basata esclusivamente sull’accento nuclare, senza tenere conto del tono di confine, che porta alla curiosa individuazione di una area centro-meridionale omogenea.

barone22 barone23

Fig.9a,b Domande parziali: Milano (a, ¡H+L* L-H%) e Pescara (b, L*+H, L-L%)

barone24 barone25

Fig. 9c,d L’accento nucleare nelle domande parziali: discendente vs ascendente. Tabella e distribuzione geografica: una parvenza di regolarità.

E così, osserviamo una variazione alta nelle esclamative, una più controllabile nelle domande polari con sorpresa, e così via.

Questo studio cerca di fornire le basi minime per poter iniziare una teoria comparativa. Le ragioni per eventuali regolarità che risulteranno da queste comparazioni saranno da ricercarsi con l’affinamento di altri metodi, come una teoria del cambiamento nell’intonazione e metodi di datazione, studi comparativi tra dialetti e varietà associate. Di fronte a uno stato della letteratura a dir poco embrionale, è auspicabile la nascita, anche a livello teorico, di un settore di studi geo-prosodici comparativi, non soltanto descrittivi, ma che indaghino le cause delle affinità e delle divergenze analizzando la reazione dell’intonazione al contatto linguistico, al cambiamento nel tempo, alla ricerca di universali che potrebbero fornire un ausilio di non poco conto agli studi di tipologia, psico e neuro-linguistici.

 

BIBLIOGRAFIA CITATA

Avesani, C. ToBIt. Un sistema di trascrizione per l’intonazione italiana. In Atti delle V giornate di Studio del Gruppo di Fonetica Sperimentale. Novembre 1994 (pp. 85-98). Trento. 1995.

Beckman, M. & Ayers, G. Guidelines for ToBI labeling, Ohio State University. 1994

Beckman, M., Díaz-Campos, M., Tevis McGory, J., & Morgan, T. Intonation accross Spanish in the Tones and Break Indeces Framework. Probus, 14. 9-36. 2002

Bruce, G. Swedish Word Accents in Sentence Perspective. Lund: Gleerup. 1977

Canepari, L. Introduzione alla fonetica. Torino: Einaudi. 1979.

De Mauro, T. Storia linguistica dell’Italia unita. Bari: Laterza. 1970.

Face, T. & Prieto, P. Rising accents in Castilian Spanish. A revision of Sp_ToBI. Journal of Portuguese Linguistics, 6(1), 117-146. 2006/2007

Frota, S. Prosody and focus in European Portuguese. Phonological phrasing and intonation. New York: Garland Publishing. 2000

Gili Fivela B., Avesani C., Barone M., Bocci G., Crocco C., D’Imperio M., Giordano R., Marotta G., Savino M., Sorianello P. Varieties of Italian and their intonational phonology. In S. Frota and P. Prieto (eds) Intonational variation in Romance, Oxford University Press. Forthcoming

Goldsmith, J. The aims of autosegmental phonology. Current approaches to phonological theory, Daniel Dinnsen (Ed.) 202-22. Bloomington: Indiana University Press. 1979

Grice, M.; D’Imperio, M; Savino, M.; Avesani, C. Strategies for intonation labeling across varieties of Italian. In: Jun, S. (ed.), Prosodic typology, Oxford: OUP, 363-389. 2005.

Hualde, J. I. Remarks on the diachronic reconstruction of intonational patterns in Romance with special attention to Occitan as a bridge language. Catalan Journal of Linguistics, 2 (Special volume on Romance Intonation, ed. by P. Prieto), 181-205. 2003.

Jun, S. & Fougeron, C. A Phonological Model of French Intonation, in Intonation: Analysis, Modeling and Technology, ed. by Antonis Botinis. Kluwer: Academic Publishers. pp.209-242. 2000.

Liberman, M. & Prince, A. On stress and linguistic rhythm. Linguistic inquiry 8.249-336. 1977

Pellegrini, G.B. Tra lingua e dialetto in Italia. Studi mediolatini e volgari. VIII, 137-153. 1960

Pierrehumbert, J. The Phonology and Phonetics of English Intonation. PhD Dissertation, MIT. 1980

Prieto, P. Entonació. Models, teoria, mètodes. Barcelona: Ariel. 2002

Prieto, P., Aguilar, L., Mascaró, I., Torres Tamarit, F.J., Vanrell, M.M. Phonetics and phonology in Iberia, Cat-ToBI. Paper presented at the workshop Transcription of Tone and Intonation in the Iberian languages. PaPI 2007, Braga, Portugal, June 27. 2007

Prieto, P. & Sichel-Bazin, R. (coords.). Atlàs interactiu de l’intonacion de l’occitan. [http:// prosodia.uab.cat/atlesintonacion/] 2007/2010

Silverman, K., Beckman, M., Pitrelli, J., Ostendorf, M., Wightman, C., Price, P., Pierrehumbert, J. & Hirschberg, J. ToBI: A Standard for Labeling English Prosody. In J. J. Ohala, T. M. Nearey, B. L. Derwing, M. M. Hodge and G. E. Wiebe, eds. ICSLP 92 Proceedings: 1992 International Conference on Spoken Language Processing. Volume 2. Department of Linguistics, University of Alberta. 867-870. 1992

 

[1] Dottore di ricerca in Matematica (Unibo) e dottore magistrale in Linguística (Pompeu Fabra, (Barcelona) , professore presso l’Università Federale di Pernambuco (UFPE).

[2] Dato che ogni sillaba possiede un unico nucleo vocalico (vocale semplice, dittongo, trittongo), diremo anche che la vocale di tale sillaba o, nel caso di nucleo vocalico, la vocale forte di tale nucleo, è tonica o accentata.