Tobi

6
ESTUDO-PILOTO DE UMA NOTAÇÃO ENTOACIONAL PARA O PORTUGUÊS BRASILEIRO: ToBI OR NOT ToBI ? Luciana LUCENTE (Universidade Estadual de Campinas) Plinio A. BARBOSA (Universidade Estadual de Campinas) ABSTRACT: This paper presents a pilot study that evaluates two prosodic transcription systems of speech - ToBI and INTSINT – based on phonetic-acoustic analysis of Brazilian Portuguese (BP). We aim to test the advantages, disadvantages and complementary aspects of each system for an intonational transcription system for BP. KEYWORDS: intonation; prosodic transcription; prosody; pitch; Brazilian Portuguese. 0. Introdução: ToBI e INTSINT . Este trabalho apresenta um estudo-piloto com a finalidade de avaliar dois sistemas de transcrição prosódica da fala (entoação e fronteiras rítmicas), a partir da análise fonético- acústica (com atenção especial para a curva de freqüência fundamental - f 0 - e o espectrograma), para a proposta de um sistema de transcrição entoacional para o português brasileiro (PB). Os sistemas de notação avaliados são: ToBI (Tone and Break Indices), de base fonológica, e o INTSINT (International System for Intonation Transcription), de base fonético-fonológica. O primeiro sistema, inicialmente desenvolvido para a notação prosódica do inglês americano, vem sendo adaptado para a transcrição de diversas línguas. Pretendemos avaliar os limites de tal sistema, o tipo de conhecimento da Fonologia Entoacional do PB que ele pressupõe, bem como a consistência entre transcritores. Quanto ao segundo sistema, o INTSINT, por se tratar de um método de transcrição automática, será avaliado a partir dos resultados de transcrição realizada pelo programa MOMEL/INTSINT, fornecido por D. Hirst, da Universidade de Provence, pesquisador que o propôs. Para que o sistema ToBI se estabeleça como um método de transcrição a partir de uma transcrição fonológica larga, ele pressupõe um inventário dos padrões tonais da língua já estabelecido. Por sua vez, o INTSINT que se considera equivalente a uma transcrição fonética estreita, pode conseqüentemente ser usado para angariar dados, através de uma transcrição automática, de línguas que ainda não foram descritas. Acreditamos que o sistema ToBI possa ser adaptado para a transcrição do PB, a partir da observação de sua aplicação na transcrição de outras línguas, possibilitando também um melhor conhecimento da organização entoacional dessa variedade do português. Por se tratarem de sistemas que privilegiam transcrições distintas, uma mais ampla e outra mais estreita, os dois sistemas acabam se interpelando e ressaltando eventos possivelmente sem interesse lingüístico-entoacional em INTSINT e eventos, significativos do ponto de vista lingüístico, possivelmente perdidos em ToBI. ToBI não pretende se estabelecer como um Alfabeto Fonético Internacional (IPA, da sigla em inglês) para a prosódia, pelo fato de a entoação e a prosódia possuírem características particulares entre diversas línguas e dialetos, mas sim um instrumento para que a pesquisa de uma determinada língua possa ter uma transcrição específica e comum entre vários trabalhos. A transcrição ToBI de uma sentença consiste minimamente na gravação da fala associada a um programa que reproduza sua freqüência fundamental (f 0 ), como o software Praat, e rótulos simbólicos para os eventos da fala dispostos em quatro camadas ( tiers) paralelas. As quatro camadas, dispostas na ordem em que aparecem nos exemplos são: tone tier, orthographic tier, break index tier e miscelaneous tier, que respectivamente assinalam tom, ortografia, força de fronteira e aspectos comunicativos diversos (ver figura 1). As camadas tone (To) e break index (BI) representam o foco da análise prosódica desse sistema. Sendo o tone tier a parte da transcrição que corresponde mais especificamente à análise fonológica do padrão de entoação da sentença. Ele consiste em um rótulo para diferentes eventos de pitch, transcritos na sentença como tons altos e baixos, respectivamente representados por H e L (do inglês hight e low). O inventário dos diferentes eventos de pitch e sua definição são baseados na análise autosegmental proposta originalmente por Pierrehumbert (1980) e em algumas modificações propostas por Ladd (1983). As seguintes camadas usadas para transcrição, break index, orthographic e miscelaneous , marcam respectivamente: o agrupamento prosódico das palavras da sentença em uma escala de números que vai de 0 (para a seqüência mais coesa) a 4 (para a mais disjunta); a transcrição ortográfica de todas as palavras da sentença; e comentários acerca de eventos importantes para a análise, como pausas, tosses, hesitações. Anais do 6º Encontro Celsul - Círculo de Estudos Lingüísticos do Sul

description

Tobi

Transcript of Tobi

Page 1: Tobi

ESTUDO-PILOTO DE UMA NOTAÇÃO ENTOACIONAL PARA O PORTUGUÊS BRASILEIRO: ToBI OR NOT ToBI?

Luciana LUCENTE (Universidade Estadual de Campinas)

Plinio A. BARBOSA (Universidade Estadual de Campinas)

ABSTRACT: This paper presents a pilot study that evaluates two prosodic transcription systems of speech - ToBI and INTSINT – based on phonetic-acoustic analysis of Brazilian Portuguese (BP). We aim to test the advantages, disadvantages and complementary aspects of each system for an intonational transcription system for BP. KEYWORDS: intonation; prosodic transcription; prosody; pitch; Brazilian Portuguese. 0. Introdução: ToBI e INTSINT. Este trabalho apresenta um estudo-piloto com a finalidade de avaliar dois sistemas de transcrição prosódica da fala (entoação e fronteiras rítmicas), a partir da análise fonético-acústica (com atenção especial para a curva de freqüência fundamental - f0 - e o espectrograma), para a proposta de um sistema de transcrição entoacional para o português brasileiro (PB). Os sistemas de notação avaliados são: ToBI (Tone and Break Indices), de base fonológica, e o INTSINT (International System for Intonation Transcription), de base fonético-fonológica. O primeiro sistema, inicialmente desenvolvido para a notação prosódica do inglês americano, vem sendo adaptado para a transcrição de diversas línguas. Pretendemos avaliar os limites de tal sistema, o tipo de conhecimento da Fonologia Entoacional do PB que ele pressupõe, bem como a consistência entre transcritores. Quanto ao segundo sistema, o INTSINT, por se tratar de um método de transcrição automática, será avaliado a partir dos resultados de transcrição realizada pelo programa MOMEL/INTSINT, fornecido por D. Hirst, da Universidade de Provence, pesquisador que o propôs.

Para que o sistema ToBI se estabeleça como um método de transcrição a partir de uma transcrição fonológica larga, ele pressupõe um inventário dos padrões tonais da língua já estabelecido. Por sua vez, o INTSINT que se considera equivalente a uma transcrição fonética estreita, pode conseqüentemente ser usado para angariar dados, através de uma transcrição automática, de línguas que ainda não foram descritas. Acreditamos que o sistema ToBI possa ser adaptado para a transcrição do PB, a partir da observação de sua aplicação na transcrição de outras línguas, possibilitando também um melhor conhecimento da organização entoacional dessa variedade do português. Por se tratarem de sistemas que privilegiam transcrições distintas, uma mais ampla e outra mais estreita, os dois sistemas acabam se interpelando e ressaltando eventos possivelmente sem interesse lingüístico-entoacional em INTSINT e eventos, significativos do ponto de vista lingüístico, possivelmente perdidos em ToBI.

ToBI não pretende se estabelecer como um Alfabeto Fonético Internacional (IPA, da sigla em inglês) para a prosódia, pelo fato de a entoação e a prosódia possuírem características particulares entre diversas línguas e dialetos, mas sim um instrumento para que a pesquisa de uma determinada língua possa ter uma transcrição específica e comum entre vários trabalhos. A transcrição ToBI de uma sentença consiste minimamente na gravação da fala associada a um programa que reproduza sua freqüência fundamental (f0), como o software Praat, e rótulos simbólicos para os eventos da fala dispostos em quatro camadas (tiers) paralelas. As quatro camadas, dispostas na ordem em que aparecem nos exemplos são: tone tier, orthographic tier, break index tier e miscelaneous tier, que respectivamente assinalam tom, ortografia, força de fronteira e aspectos comunicativos diversos (ver figura 1).

As camadas tone (To) e break index (BI) representam o foco da análise prosódica desse sistema. Sendo o tone tier a parte da transcrição que corresponde mais especificamente à análise fonológica do padrão de entoação da sentença. Ele consiste em um rótulo para diferentes eventos de pitch, transcritos na sentença como tons altos e baixos, respectivamente representados por H e L (do inglês hight e low). O inventário dos diferentes eventos de pitch e sua definição são baseados na análise autosegmental proposta originalmente por Pierrehumbert (1980) e em algumas modificações propostas por Ladd (1983). As seguintes camadas usadas para transcrição, break index, orthographic e miscelaneous, marcam respectivamente: o agrupamento prosódico das palavras da sentença em uma escala de números que vai de 0 (para a seqüência mais coesa) a 4 (para a mais disjunta); a transcrição ortográfica de todas as palavras da sentença; e comentários acerca de eventos importantes para a análise, como pausas, tosses, hesitações.

Anais do 6º Encontro Celsul - Círculo de Estudos Lingüísticos do Sul

Page 2: Tobi

Fig.1.Transcrição ToBI para a sentença “That’s what I thought”

A partir da apresentação das linhas-mestras iniciais do sistema, o aprendizado da notação se

dará com sessões de treinamentos de transcrição com diversos pesquisadores, que devem manifestar uma consistência medida a partir de uma concordância de no mínimo 80% entre as transcrições. A descrição dos treinamentos e a definição da simbologia de transcrição em ToBI estão resumidas em Beckman et al (1992) e Pitrelli, Backman e Hirsberg (1994). Para o treinamento dos transcritores nesse trabalho inicialmente usamos o guia fornecido pela universidade de Ohio, Guidelines for ToBI Labelling, Mary E. Backman e Gayle Ayers Elam (1993), posteriormente usamos da mesma metodologia para a transcrição de sentenças semi-espontâneas do PB.

O INTSINT (Hirst e Di Cristo, 1998), ao contrário do anterior, pretende, aos modos do Alfabeto Fonético Internacional (IPA), ser um sistema internacional de transcrição para entoação, como sua própria sigla sugere (INternational Transcription System for INTonation). O INTSINT pode ser avaliado a partir dos resultados de transcrição automática, através do programa MOMEL/INTSINT, quando utilizado em conjunto com o software Praat.

Fig.2. Transcrição automática (INTSINT) da sentença “That’s what I thought”

Para que o INTSINT se estabeleça como um alfabeto internacional para transcrição da entoação é necessário que um número grande de hipóteses sobre possibilidades e características

Page 3: Tobi

prosódicas significantes em diversas línguas sejam avaliadas, tal como os proponentes do sistema procuram fazer em Hirst e Di Cristo (1998) que inclui em seu conteúdo a aplicação de INTSINT para a transcrição prosódica do português brasileiro (PB), realizada por João A. de Moraes (UFRJ). A simbologia desse sistema de notação difere da notação do ToBI, enquanto o último usa quatro camadas e uma simbologia baseada somente em dois tons (alto – H – e baixo – L), o INTSINT, representa o contorno prosódico da fala com os seguintes símbolos: H (higher), L (lower), S (same ), D (downstep), U (upstep), T (top), B (botton) e M (mid), o que em si já é uma transcrição mais refinada do contorno entoacional (ver figura 2). 1. Simbologia. A proposta original de Pierrehumbert (1980) de uma notação prosódica que apresentava um elenco de sete eventos de pitch, mais frase accents e fronteiras silábicas, como mostra o esquema abaixo:

boundary tones pitch accents phrase accents boundary tones Fig.3 . Proposta original para notação entoacional do inglês americano, Pierrehumbert (1080)

Em ToBI os eventos de pitch passaram a cinco, sendo H*+L, H+L* e H*+H eliminados e substituídos por apenas H* e por H+!H* indicando downstepping. Os phrase accents e os boundary tones continuam os mesmos, apresentando a seguinte simbologia: H*, L*, L+H*, L*+H e H+!H* para pitch accents, H- e L- para phrase accents, H%, L% e %H para boundary tones, sendo que o símbolo acompanhado de asterisco representa a posição de alinhamento com a sílaba lexicalmente acentuada proeminente (observar contraste entre L+H* e L*+H nas figura 4 e 5).

Fig. 4 . Transcrição ToBI para a setença “That ones for Marianna”.

Page 4: Tobi

Fig.5 Transcrição ToBI para a sentença “There’s a lovely one in Bloomingdales”.

Em INTSINT todos os símbolos de pitch são usados para definir um ponto ou um alvo. Os símbolos H, L e S (respectivamente, hight, low e same) são usados precisamente na marcação de uma proeminência; D e U (downstep e upstep) representam queda e subida relativa de pitch precedendo uma proeminência, podem também corresponder a picos e vales, porém correspondem a uma variação na altura de pitch não tão significativa como as marcadas por H e L. Símbolos como T e B (top e bottom) se referem aos limites extremos superior e inferior da curva entoacional, sendo que M (mid) marca uma excursão intermediária. Posições iniciais e finais de pitch quando não são marcadas representam, respectivamente, M e S.

Apesar da transcrição de ambos os sistemas coincidir simbolicamente, a interpretação que fazem dos fenômenos não é a mesma, por exemplo, um evento marcado em ToBI por L+H* pode ser marcado em INTSINT por T ou H (veja figuras 6 e 7). Isso se deve ao fato de a transcrição ToBI levar em consideração, além da curva de f0, a percepção do transcritor. 2. ToBI or not ToBI? Experiências realizadas com sentenças do PB no Laboratório de Fonética e Psicolingüística (LAFAPE - Unicamp), já possibilitaram a verificação de que os dois sistemas acabam por se complementarem na análise do PB. O ToBI, por usar um inventário limitado de símbolos para uma transcrição mais larga, por vezes pode negligenciar aspectos significativos do ponto de vista lingüístico, o INTSINT, por sua vez, ao fazer uma análise muito fina da entoação da fala, acaba por descrever aspectos que não são significativos do ponto de vista de uma notação entoacional.

Por exemplo a variação não percebida pelo ouvido (ToBI) da subida marcada “U” (figuras 6 e 7). Essa variação que a transcrição do INTSINT apresenta em relação à transcrição ToBI se deve à análise fonética fina que o programa de transcrição automática realiza. O algoritmo do MOMEL (programa que executa a transcrição INTSINT), ver Hirst et al (2000), consiste na fatorização de uma curva de f0 em dois componentes: um componente microprosódico causado pela natureza dos segmentos (função de transferência) e um componente macroprosódico independente dos segmentos (fonte). A intenção é encontrar na macroprosódia os gestos da laringe correspondentes a informação entoacional da mensagem, como esses gestos são independentes dos fonemas é possível que haja um ponto-alvo em uma parte não vozeada, pois a laringe continua a se estender e distender mesmo quando não há vibração. Os pontos-alvos correspondem aos pontos onde a inclinação da curva de f0 subjacente é nula, Hirst supõe que esses pontos-alvo resumem a informação prosódica do enunciado.

A análise da transcrição da curva entoacional do PB mostra (como previsto) que devido a grande diferença entre as curvas de pitch do inglês - língua para a qual o sistema ToBI foi desenvovido - e o do PB - que se mostra menos pronunciada em relação à curva do inglês – um casamento entre os resultados mais relevantes nas duas transcrições possibilitará uma transcrição mais acurada do padrão entoacional do PB

Page 5: Tobi

Fig.6. Transcrição ToBI para a sentença do PB “Um lindo bebê calvo”.

Fig. 7. Transcrição INTSINT para a mesma sentença do PB. Observe as marcações de “U” e “T” que aparecem grifadas aqui e que não aparecem na transcrição ToBI . 3. Considerações finais. Tendo em vista o número crescente de pesquisadores analisando a organização entoacional de um certo número de línguas, incluindo várias línguas românicas como espanhol, português europeu, francês, italiano, a fim de propor um sis tema satisfatório para a transcrição da entoação, será de grande importância também um estudo nessa direção aplicado às variedades do PB, começando por aquelas circunscritas ao estado de São Paulo. Posteriormente a intenção será a aplicação dessa transcrição prosódica a casos para os quais existam fenômenos fonológicos relevantes para a pesquisa, como é o caso do fenômeno de encontro acentual no PB, entre outros. Temos conhecimento apenas do uso informal de uma notação de cunho fonológico-entoacional nos trabalhos brasileiros.

A partir desse estudo-piloto pretendemos propor uma notação entoacional mais fonológica para o PB, a qual denominaremos BP-ToBI (Brazilian Portuguese – ToBI).

Page 6: Tobi

RESUMO: Apresentamos um estudo-piloto a fim de avaliar dois sistemas de transcrição prosódica da fala - ToBI e INTSINT - a partir da análise fonético-acústica para o PB. O objetivo é testar vantagens, desvantagens e aspectos complementares de cada sistema na proposta de um sistema de transcrição entoacional para o PB. PALAVRAS CHAVE : entoação; transcrição prosódica; prosódia; pitch; português brasileiro. REFERÊNCIAS BIBLIOGRÁFICAS BECKMAN, Mary E., DIAZ-CAMPOS, M., McGORY, J.T. Intonation across Spanish, in the Tones and Break Indices Framework. Intonation in Romance Special Issue. Local: Probus, 2002. BECKMAN, Mary E., ELAM, Gayle A.,. Guidelines for ToBI Labeling. The Ohio State University Research Foundation, 1993. (Disponível em http://www.ling.ohio-state.edu/~tobi/ame_tobi/) BECKMAN, Mary E., HIRSCHBERG, J., PITRELLI, John F. Evaluation of Prosodic

Transcription Labeling Reliability in the ToBI Framework.1994 (Disponível em http://www.ling.ohio-state.edu/~tobi/ame_tobi/ )

BOTINIS, A., GRANSTRÖN, B., MÖBIUS, B. Developments and Paradigms in Intonation Research. Speech Communication , local, n. 33, 2001 HIRST, D., DI CRISTO, A. Intonational Systems, a survey of twenty languages. Cambridge: Cambridge University Press, 1998 HIRST, D., DI CRISTO, A., ESPESSER, R. Levels of Representation and Levels of Analysis for the

Description of Intonation Systems. 2000 (Disponível em http://www.lpl.univ-aix.fr/~hirst/publis.html.)

LADD, D. Robert. Intonational Phonology. Cambridge: Cambridge University Press,1996. LADD, D. Robert. Phonological features of intonational peaks . Language 59: 721-59, 1983. MADUREIRA, S. Pitch Patterns in Brasilian Portuguese: an Acoustic-Phonetic Analysis, publicação. 1994, proceedings of the Fifth Australian International Conference on Speech Science and Technology, 156-59. MORAES, J. António. F0 Declination in Brasilian Portuguese in Read and Spontaneous Speech, Proceedings of the 14 th International Congress of Phonetic Sciences, 1999 San Francisco, 2323-26. PIERREHUMBERT, J. B. The Phonology and Phonetics of English Intonation . PhD disseratition. Cambridge: Mass: MIT, 1980. SILVERMAN, K. et al. ToBI: a Standard for Labeling English Prosody. 1992 (Disponível em http://www.ling.ohio-state.edu/~tobi/ame_tobi/)