ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández...

38
ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González Baixauli

Transcript of ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández...

Page 1: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE

EDUCATIVO

Autor: Felipe Fernández DomínguezTutores: Miguel Ángel Laguna SerranoBruno González Baixauli

Page 2: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 3: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Objetivos

Comprender el proceso de síntesis de voz desde un punto de vista teórico y los sintetizadores disponibles.

Estudio en profundidad de las interfaces animadas, centrándonos en Microsoft Agent.

Realización de una aplicación que sirva como introducción al mundo del PC para niños de educación primaria.

Page 4: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 5: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Software educativo

Diferentes enfoques dependiendo del alumno al que vaya dirigido

– Educación infantil: estimulación sensorial y conocimiento del entorno

– Educación primaria: basado en el desarrollo de capacidades como memoria, concentración, razonamiento lógico

– Educación especial: Proyecto Fressa

Page 6: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Proyecto Fressa

Page 7: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 8: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Síntesis de voz

Visión teórica Alternativas disponibles

Page 9: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Visión teórica

Front-end– Toma como entrada un texto y produce una

representación lingüística fonética– Normalizacion de texto o preprocesado– Texto a fonema

Back-end– Toma como entrada la representación lingüística

y produce una forma de onda sintetizada

Page 10: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Síntesis de voz

Visión teórica Alternativas disponibles

Page 11: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Alternativas disponibles

Festival Flite FreeTTS MBROLA

Page 12: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Festival

El proyecto de Festival comenzó en 1994 en el centro de tecnologías del habla de la universidad de Edimburgo.

Festival esta diseñado para permitir añadir nuevos módulos, fácil y eficientemente, sin que el desarrollador tenga que recorrer camino ya andado

Page 13: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Flite

Flite fue diseñado como una alternativa a Festival que mejorara cuestiones claves para su uso en dispositivos móviles.

Mejor portabilidad, tamaño y velocidad, al estar escrito completamente en C(no en C++ o Scheme)

Page 14: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

FreeTTS

Supera los problemas de Flite de dependencia con las plataformas y sus compiladores.

Reescrito totalmente en Java, mantiene la arquitectura de Flite.

Page 15: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

MBROLA

El proyecto MBROLA tiene un sintetizador de voz basado en la concatenación de difonos.

Una de las bases de datos de difonos disponibles en español fue desarrollada por profesores de la UVA.

Page 16: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 17: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Interfaces de Usuario con personajes animados

– Los agentes animados con interfaces conversacionales proporcionan un paradigma intuitivo de interacción ya que el usuario no necesita adquirir nuevos conocimientos.

– Los usuarios encuentran estos sistemas más amigables y cooperativos.

Page 18: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Características de Microsoft Agent

Está disponible en la red para descargarlo gratuitamente y puede ser empleado por los desarrolladores en sus aplicaciones sin coste de derechos de autor.

Page 19: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Características de Microsoft Agent

La interfaz de programación de aplicación (API) de Microsoft Agent proporciona servicios de programación entre los que destacan: la habilidad de cargar un personaje, ejecutar una animación, hablar usando un sintetizador de voz y aceptar entrada de voz del usuario.

Page 20: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 21: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Desarrollo de la aplicación

Análisis del sistema. Definición del Análisis del sistema. Definición del problemaproblema

Diseño Implementación Pruebas

Page 22: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Resultados de las entrevistas

Los entrevistados fueron estudiantes de la facultad de Magisterio y monitores de ocio y tiempo libre.

Necesidad de una aplicación amena e intuitiva.

Page 23: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Diagrama general de casos de uso

Page 24: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Diagrama inicial de clases

Page 25: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Jugar cuento

Page 26: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Jugar imágenes

Page 27: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Diseño Implementación Pruebas

Page 28: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Diagrama de clases final

Page 29: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Jugar ingles

Page 30: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Demostración de gestos

Page 31: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Implementación Pruebas

Page 32: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Implementación

Entorno de desarrollo: Microsoft Visual Studio.Net

Lenguaje de programación:C# Paquete de servicios:Microsoft Agent 2.0

Page 33: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Microsoft Agent 2.0

Character.Show(null); Character.MoveTo(50,50,null); Character.Speak("Hola buenas tardes",null ); Character.Hide(5);

Page 34: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Desarrollo de la aplicación

Análisis del sistema. Definición del problema Diseño Implementación Pruebas

Page 35: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Pruebas

Page 36: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Índice

Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones

Page 37: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Dificultades encontradas

Las opciones disponibles en síntesis de voz no son tantas.

Si encima añades idioma español,bajo Windows y libre las dificultades son mayores.

La portabilidad de sistemas desarrollados en Linux a Windows no es trivial.

Page 38: ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González.

Posibles mejoras

Reconocimiento del habla Desarrollo en aplicaciones web Introducción de nuevo elementos.