Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje...
Transcript of Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje...
![Page 1: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/1.jpg)
Računalno jezikoslovlje
Damir ĆavarSveučilište u Zadru, Odjel za lingvistiku u.o.
![Page 2: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/2.jpg)
Plan izlaganja
Jezične tehnologije
Govor (speech)
Jezik (language)
Uloga jezikoslovlja
![Page 3: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/3.jpg)
Govor
Prepoznavanje govora (speech recognition)
Sinteza govora (speech synthesis)
![Page 4: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/4.jpg)
Prepoznavanje govora
Tehnološko stanje:
Standard: Prepoznavači govora u svim sustavima: Windows XP/Vista, Mac OS X, Linux
Profesionalni sustavi za telefonske servere, npr. Nuance (kupili SpeechWorks), Microsoft, itd.
Otvoreni i slobodni alati za modeliranje i generiranje prepoznavača (npr. HTK)
![Page 5: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/5.jpg)
Prepoznavanje govora
Tehnologija:
Skriveni Markovljevi modeli
Neuronske mreže
Sustavi:
Operativni sustavi
npr. IBM ViaVoice, Dragon NaturalySpeaking
![Page 6: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/6.jpg)
U Hrvatskoj
npr. FER:
Laboratorij za sustave i signale
doc. dr.sc. Davor Petrinović
![Page 7: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/7.jpg)
Govor kao sučelje
Skoro svatko čuje i zna govoriti
ukidanje tehnološke barijere
Interfejs u situacijama bez mogućnosti manualne instrukcije ili manipulacije strojevima
![Page 8: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/8.jpg)
PrimjenaNaredbe
Strojevi
Elektronski uređaji
Automobili i zrakoplovi
Telefonske aplikacije i informacijski sistemi
Diktiranje i prevođenjeStudije i usvajanje stranih jezikaSustavi za invalide
![Page 9: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/9.jpg)
Sinteza govoraSinteze:
Difon modeli, baze sa frazama, skriveni Markovljevi modeli
Primjeri:
OS X, AT&T Natural Voices
Virtualni govornici ili izlagači:
Charamel.de
![Page 10: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/10.jpg)
Jezik
ima središnje mjesto: komunikacija je jezik
za gospodarstvo
za politiku i nacionalnu sigurnost
znanstveni rad
svakodnevni život
![Page 11: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/11.jpg)
JezikTekst kao:
komunikacijsko sredstvo
arhivirana informacija i znanje
Problemi:
kvantiteta
kvaliteta (informacija vs. znanje)
![Page 12: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/12.jpg)
Jezik i komunikacijaProblemi:
Višejezičnost
Specifične domene jezika i teksta
Količina i kvaliteta
Dinamika jezika
itd.
![Page 13: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/13.jpg)
Klasi!ne teme elektronske obrade
podataka:
mre!na tehnologija, memorija, dostupnost
podataka, ...
Tehnologije i infrastruktura za:
prikazivanje, izlu"ivanje,
memoriranje informacije,
"svjesnost" o tipu podataka sa
informacijama
Tehnologije za:
neovisnost o tipu kodiranja za informaciju i
specifi"nog jezika, identifikaciju znanja
i rendundantnih i neistinitih
informacija
Elektroni"ka
obradba
podataka
poticaj: kvantiteta,
kvaliteta, u"inkovito
pronala!enje,
transparentnost
poticaj: zatrpanost
informacijama, redundancije,
proturje"nost, pouzdanost,
sa!imanje
Elektroni"ka
obradba
informacija
Elektroni"ka
obradba znanja
![Page 14: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/14.jpg)
Jezik i komunikacijaRješenje
Računalno jezikoslovlje:
rječnici, tezaurusi, snimke, ...
modeli jezika na svim razinama
alati za analizu jezika (a i vizualnih i akustičkih informacija)
za SemanticWeb itd.
![Page 15: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/15.jpg)
Računalno jezikoslovlje
Zadatci:
Stvaranje baze jezičnih podataka
rječnike, korpuse, gramatike, itd.
Stvaranje osnovne tehnologije
prepoznavanje jezika, obilježavanje riječi, sintaktička analiza rečenica, semantičko obilježje
![Page 16: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/16.jpg)
Osnove
Standard:
Prepoznavanje jezika, pravopis (Spell-checker), obilježje i morfologija (tagger), gramatika (grammar checker)
Nema u standardnim sustavima:
Prepoznavanje imena (named entity recognition), semantička analiza, klasifikacija teksta, itd.
![Page 17: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/17.jpg)
Hrvatski
Ima:
rječnike, korpuse, donekle alate za strojno prevođenje
Nema:
formalne gramatike za jezičnu tehnologiju, osnovne otvorene i dostupne tehnologije
![Page 18: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/18.jpg)
Hrvatski
Što radimo (u suradnji s Institutom za hrvatski jezik i jezikoslovlje):
korpus (jedno- i višejezični)
rječnike (jedno- i višejezične)
alate
gdje: Hrvatska jezična riznica
![Page 19: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/19.jpg)
Primjeri
Prevođenje dokumenata
Pretraživanje i ekstrakcija podataka
Meta-obilježje
Klasifikacija dokumenata
![Page 20: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/20.jpg)
Pilot
WebServiceServer
Java WebService
Prva analizaStatistička analiza
lingvističke komponente
Prepoznavanje jezikaObilježje
LematizacijaPrepoznavanje imena
MS Word
.NETC# & Word Automation
VB Makro
SOAP
Tekst
Ključne riječi, tema...
MS Word
.NETC# & Word Automation
VB Makro
Tekst
RDF ...
Batch anotacija
.NETJava
Tekst
RDF ...
![Page 21: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/21.jpg)
K-Net
![Page 22: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/22.jpg)
Istraživanja
Kvalitativna i kvantitativna analiza jezika:
Usvajanje jezika
Evolucija jezika
Dijalektološke studije
Baze za psihološka i kognitivna istraživanja
![Page 23: Ra unalno jezikoslovlje - Damir Cavar’s Homepagedamir.cavar.me/Pubs/CompLing.pdf · Prepoznavanje govora Tehnološko stanje: Standard: Prepoznavači govora u svim sustavima: Windows](https://reader033.fdocuments.in/reader033/viewer/2022042211/5eb260707735211fb44c2544/html5/thumbnails/23.jpg)
Istraživanja
Interdisciplinarno povezano:
Jezik
Računarstvo
Psihologija i kognitivne znanosti