Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados...

39
Introdución a CHILDES • Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por Virginia Yip (Universidad China de Hong Kong) y Stephen Matthews (Universidad de Hong Kong).

Transcript of Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados...

Page 1: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Introdución a CHILDES

• Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por Virginia Yip (Universidad China de Hong Kong) y Stephen Matthews (Universidad de Hong Kong).

Page 2: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Vista general

• 1. ¿Qué es el sistema CHILDES?• 2. ¿Cómo instalar el programa CLAN?• 3. ¿Cómo acceder al Corpus de datos?• 4. Qué es un sistema de transcripción?• 5. Cómo usar los comando en CLAN?• 6. Cómo construir un corpus?

(una introducción breve)

Page 3: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

1. ¿Qué es el sistema CHILDES?

Page 4: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

1. Qué es el sistema CHILDES?

• El sistema CHILDES proporciona herramientas para estudiar las interacciones conversacionales.

• Estas herramientas incluyen:~ una base de datos de transcripciones~ programas para el análisis de las transcripciones c

on ordenadors. ~ métodos de codificación lingüística~ sistemas para conectar las transcripciones a las gr

abaciones digitales de audio y video.

Page 5: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

2. ¿Cómo instalar CLAN?

Page 6: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

2 . Cómo instalar el progama CLANa.) El programa CLAN está disponible para descarga gratuita en: http://childes.psy.cmu.edu/

Puedes localizar el programa en las Seccioens PROGRAM & Data

Page 7: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Para sistemas Windows pulsa el botón derecho del ratón >> guardar archivo como>> elige el directorio para el archivo descargado.

En Macintosh, haz click en el enlace y se salvará automáticamente

(b) The download page

Descarga la fuente Arial Unicode e instálala en tu PC. Luego podrás ver las fuentes Arial Unicode usadas en el corpus.

Page 8: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Para Windows: la instalación exige hacer click sobre el archivo de instalación y seguir las indicaciones dadas por InstallShield

c) Instale el programa en su PC o MAC.

Para Macintosh: la instalación exige descomprimir el archivo haciendo doble click sobre la aplicacón. Para hacer funcionar CLAN en UNIX en MacOS X, use la disstribución UNIX.

Page 9: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Reinicie Windows después de la instalación

Un icono de CLAN se encuentra en el escritorio

Page 10: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

3. ¿Cómo acceder al Corpus?

Page 11: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

3 . Cómo acceder al corpus de datos

a.) El Corpus de datos está disponible para descarga gratuita en: http://childes.psy.cmu.edu/

Puedes localizar el Corpus de Datos en las Secciones PROGRAM & Data

Page 12: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

b) La página de descarga

Puedes localizar el Corpus de Datos Bilingües en la Sección Special Type.En esta sección, sólamente están disponibles archivos cha.

Puedes descargar el Corpus de Datos Bilingües con archivos de audio en la Sección Downloadable (=descargable)

Puedes ojear el Corpus de Datos online con Internet Explores/Netscape en la Sección Directly Browsable (visible directamente)

Page 13: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

En Windows, haz click en el botón derecho del ratón >> salvar archvo como >> eige el directorio para la descarga del archivo.

En Macintosh, haz click en el enlace y se guardará automáticamente.

Page 14: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

c) Archivos CHA Si tienes el programa Winzip/Winrar, puedes descomprimir el corpus descargado haciendo click en el botón derecho del ratón >> Extraer aquí

Después de la descompresión, puedes localizar múltiples carpetas dentro de la carpeta descomprimida. Cada carpeta contiene muchos archivos da. Son las transcripciones de niños bilingües.

Page 15: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

4. ¿Qué es el sistema de transcripción?

Page 16: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Encabezados(indicados por @)

Líneas principales(comienzan con * )

Líneas dependientes(comienzan con % )

Estructura de la transcripción:Una transcripción está compuesta normalmente de tres subpartes: los encabezados las líneas principales las líneas dependientes.

4 . ¿Qué es el sistema de transcripción?

Page 17: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Coloca los archivos correspondientes de audio y cha en la misma carpeta

Abre el archivo CHA haciendo dos veces click en él. >>Mode >>Sonic El modo Audio Wave del archivo de sonido se abrirá dentro de la ventana de CLAN.

Puedes o pulsar “Esc+8” o Click Mode >> Reproducción continua

b) Cómo reproducir los archivos de audio.

Page 18: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Coloca los los archivos de vídeos correspondientes y los arvhicos cha juntos en la misma carpeta.

Puedes usar o “Esc+8” o Modo Click >> Reproducción continua en el enlace de transcripción de Vídeo

c) Cómo reproducir archivos de vídeo.

Page 19: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

5. ¿Cómo usar CLAN ?

Page 20: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

5 . Como usar Command dentro del CLAN

a.) The Command window

Ventana Window >> Commandso Ctrl+D

La ventana Command aparece.Localice la carpeta destino de los archivos .cha haciendo click el primer botón “working”. Puede hacer funcionar los commands aquí.

Page 21: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

b) La estructura de los Comandos

• freq +t*CHI 0042.cha mlu +t*MOT 0042.cha

Un comand se compone básicamente de 3 partesEl tipo de comando La(s) etiqueta(s) El archivo de destino

Comandoetiqueta(s)

(comienza con +t )El arhcivo(s) destino

(terminan con .cha o .cex )

combo +t*MOT +s"kitty^kitty" 0042.cha

kwal +sbunny -w2 +w2 0042.cha

Hay algunas opciones únicas para cada comando. Puede mirar en el manual CLAN para más detalles. Los siguientes son algunos ejemplos:

+s “xx^xx” (busca los datos para combinaciones específicas de palabras o cadenas de caracteres)

Las opciones -w y +w indica cuántas líneas de texto deberían incluirse antes y después de las palabras buscadas.

Page 22: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

c) Algunos comandos útiles

1. MLU~ Se usa principalemente para determinar la longitud media de las produccioens de un hablante concreto. ~ Proporciona también el número total de produciones y de morfemas en un archivo. ~ La proporción de morfemas en relación con las producciones (MLU) surge de aquellos dos totales. ~ Ejemplo: mlu +t*CHI *.cha

La ventana Command se abre..Localice la carpeta destino de los archivos .cha haciendo click el primer botón “working”.

Puedes ejecutar comandos

mlu +t*CHI *.cha

El resultado del comando se muestra así.

Page 23: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

2. Frecuencia~FREQ cuenta la frecuencia de palabras usadas en los archivos seleccionados. Calcula también la proporción de tipo-de-habla usada commo medida de la diversidad lexical. ~ Example: freq +t*CHI CE990722.cha Una parte del resultado del comando usado anterioremente sería la siguiente:

Page 24: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

3. Kwal

~ KWAL busca datos de palabras específicas de usuario y las muestra en el contexto. La opción +s se usa para especificar las palabras que van a ser buscadas. ~Ejemplo: kwal +t*CHI +t%mor +s”but” CE990722.chaUna muestra del resultado del comando usado antes sería el siguiente:

Page 25: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

4. Combo ~COMBO es un programa potente que busca las coincidencias de combinaciones específicas de palabras o cadenas de caracteres. ~Ejemplo: combo +t*CHI +”what^is” CE990722.cha Una muestra del resultado del comando usado antes sería lo siguiente:

Page 26: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Puede localizar el manual del programa CLAN aquí.

5. ManualEl Manual de Clan está disponible para us descarga gratuita en:http://childes.psy.cmu.edu/Instale el lector Adobe Acrobat para poder ver el manual en formato pdf.

Page 27: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

6. ¿Cómo construir un Corpus?(breve introducción)

Page 28: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Prepare un cable Mini-mini stereo

Enchufe un extremo del cable de audio a la conexión de salida en tu walkman, grabadora o mini-disc.

Asegurate de que tiene energía (baterías o conexión a la red).

Enchufa el otro extremo del cable de audio a la conexión de entrada en la tarjeta de sonido de tu ordenador PC or MAC.

1. Procesado de sonido digitala) Conecte la fuente de audio (DAT, casette, minidisk, etc.) al ordenador.

Page 29: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

b) Instala un programa de audio digital.~ Para los Macs más antiguos: Sound Edit 16 (http://www.macromedia.com/software/sound/ ) ~ Para Windows: CoolEdit ( http://syntrillium.com/ ). También, Windows proporciona grabación de sonido en Accesorios del sistema, aunque esta

característica tiene algunas limitaciones. ~ Para Mac OS X: Peak 3.0 ( http://bias-inc.com ). Hay también programas de grabación gratu

itos y copartidos (shareware), con sus limitaciones propias.

Ventana de Cool Edit 2000 Captura de pantalla de Peak 3.0

Page 30: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Una vez que termine la gración, convierte de estereo a mono.

Salva el archivo como *.aif o mp3.

Si un punto rojo o bloque rojo aparece en el área de niveles de grabación el sonido esta siendo recortado. Por ejemplo, si un niño está sentado muy cerca del micrófono y comienza a gritar los valores máximos y mínimos de la señal son suprimidos. Esto provoca una muesta digitalizada pobre.

Page 31: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

2) Transcripción en el programa Clan

Hay varias formas de realizar la transcripción en un ordenador.

Se puede usar:

Note Pad y salvar la tarnscripción com un archivo *.txt

Abre el archivo *.txt en el editor CLAN.Salvar el archivo como *.cha

MS Word and salvar la transcripción como *.doc,.Pega tu texto en el Editor CLANSalvar el archivo como *.cha

Editor CLANSalvar el archivo como *.cha

Page 32: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

3.) Transcribir

~ Si no tiene la grabación digitalizada, puede usar una grabadora/reproductora de cintas. Reproduzca la cinta y transcriba el texto. Sin embargo, deberá rebobinar muchas veces en los solapamientos y las grabaciones poco claras.~ Si usa mini disk (MD) par ala grabación, podrá usar la búsqueda digital para llegar a la parte exacta que desea transcribir.~ Si ha digitalizado la fuente de audio, puede usar un reproductor externo en PC o Mac (e.g. Quicktime, Window Media Player o Winamp) para reproducir el sonido. Para rebobinar e ir hacia adelante rápidamente, necesita mover la barra de desplazamiento de cada programa.

Page 33: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Haz click en MODE >> SONIC MODE >> Elige el archivo de sonido relacionado >> OK

La onda sonora del archivo de sonido aparecerá dentro de la ventana de CLAN.

Selecciona la onda de sonido que quieras reproducir del archivo de sonido.

~ O puedes usar el modo sonic en CLAN.

Page 34: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

4. Comentarios:

a) Participantes

La etiqueta de un participante, use una única abreviatura de 3-letras para identificar a los participantes por su nombre (p.e. MAR por Maria, NIÑ por niño o niña, etc.) y especifique sus papeles adecuadamente. Los papeles son categorías de clase cerrada en CLAN, use, por tanto, alguna de los siguientes:

Target_Child, Target_ Adult, Child, Mother, Father, Brother, Sister, Sibling, Grandmother, Grandfather, Aunt, Uncle, Cousin

Family_Friend, Playmate, Visitor, Student, Teacher, Babysitter, Housekeeper

Investigator, Examiner, Observer, Clinician, Therapist, InformantCamera_Operator, Doctor, Nurse, Patient, Client Subject

Unidentified, Adult, Teenager, Boy, Girl, Non_Human, Toy,OffScript, Text Narrator, PlayRole, Activity

Page 35: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

d) Letras mayúsculas

No utilice letras mayúsculas en ninguna expresión excepto para NOMBRES PROPIOS y EL PRONOMBRE DE PRIMERA PERSONA DEL SINGULAR “YO”, de lo contrario cualquier expresión de palabra se etiquetarácomo nombres propios.

*CHI: esto es un libro.*MOT:María, qué estas haciendo?*CHI: Yo estoy leyendo.

P.S. etiquetar es un proceso en el que se asigna a cada palabra su componente de habla.

Page 36: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

b) Delimitadores

Cada fila en la línea principal debe terminar con un único delimitador de expresión. Para evitar problemas generados en el proceso de comprobación, sitúe un espacio antes de cada delimitador como se muestra a continuación:

(el subrayado _ indica el espacio anterior al delimitador)

*CHI: qué es esto _ ??*MOT:un perro _ .. *CHI: un perro _ !!

Asegúrate que añades un delimitador “ .” después de los delimitadores comunes a excepción de “+…”. Pon un espacio entre el delimitador final y los delimitadores comunes. *MOT:*MOT: en efecto -:en efecto -:__..

Page 37: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

4) Otros delimitadores comunes son:

*LIN: esto es +/ . interrupción

*CHI un libro. MOT: bueno hay +… frase incompleta

*MOT: mira esto. frases con comillas/imitación directa*CHI: +” mira esto.

[=! Action]*CHI: 0 [=! riéndose] . información paralingüística*CHI: no [=! llora] .

<frase repetida>[/] *CHI: quiero <éste>[/] éste. Auto-repetición

Page 38: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

<frase original>[//] frase siguiente.*INV: <lei1>[//] ngo5 aa1. auto-corrección

<frase 1>[>]<frase 2>[<]*MOT: tienes que <parar de hacer eso>[>] Superposición*CHI: <no me>[<] gusta este .

www o xxx*CHI: viene www. producciones ininteligibles.*CHI: &gook segmento fonético, pero ininteligible.

[?]*CHI: no tenes [?]. código para producciones no claras

Page 39: Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Preguntas & respuestas- fin -

prepared byUta Lam, CUHK

Traducido por: Jesús Vera

[email protected] November 2005