Proiect de traducere simbolică. UNL – exemple de reprezentări Mary broke the window...
-
date post
21-Dec-2015 -
Category
Documents
-
view
217 -
download
3
Transcript of Proiect de traducere simbolică. UNL – exemple de reprezentări Mary broke the window...
UNL – exemple de reprezentări
Mary broke the window
agt(break(icl>do).@entry.@past, "Mary")
obj(break(icl>do).@entry.@past, window(icl>thing).@def)
UNL – exemple de reprezentări
Mary walks with John.
agt(walk(icl>do).@entry.@present, "Mary")
cag(walk(icl>do).@entry.@present, "John")
UNL – exemple de reprezentări
Lions and leopards chase gazelles
agt(chase(icl>do).@entry.@present, lion(icl>thing).@pl)
and(lion(icl>thing).@pl, leopard(icl>thing).@pl)
obj(chase(icl>do).@entry, gazelle.@pl)
UNL – exemple de reprezentăriThis product features a number of sophisticated functions
ensuring superior reception and operation
aoj(feature(icl>state).@entry.@present,product(icl>thing).@def)
obj(feature(icl>state).@entry.@present,function(icl>abstract thing).@pl)
qua(function(icl>abstract thing).@pl,several)mod(function(icl>abstract thing).@pl,sophisticated)agt(ensure(icl>do).@present,function(icl>abstract
thing).@pl)obj(ensure(icl>do).@present,:01)and:01(operation(icl>action).@indef.@entry,reception(i
cl>action,obj>signal).@indef)mod(:01,superior(mod<thing))
All are designed for the easiest possible use, but many are not self-explanatory
obj(design(icl>do).@present.@complete,function(icl>abstract thing):01.@topic.@pl)
qua(function(icl>abstract thing):01.@topic.@pl, all(mod<thing))
pur(design(icl>do).@present.@complete,use(icl>action).@def)
mod(use(icl>action).@def,easy(mod<thing))man(easy(mod<thing),most)aoj(require(icl>state).@entry.@present.@unexpected-
consequence, function(icl>abstract thing):02.@pl)qua(function(icl>abstract thing):02.@pl,
many(mod<thing))obj(require(icl>state).@entry.@present.@unexpected-
consequence, explanation(icl>action).@pl)and(require(icl>state).@entry.@present.@unexpected-
consequence, design(icl>do).@present.@complete)
You can select the tuning method by changing the length of time you press the A button
agt(select(icl>do).@entry.@possibility,you)
obj(select(icl>do).@entry.@possibility,method.@def)
mod(method.@def,tuning(icl>action))
met(select(icl>do).@entry.@possibility, change(icl>do))
obj(change(icl>do),time(icl>abstract thing).@def)
agt(press(icl>do).@present,you)
obj(press(icl>do).@present,button(icl>thing).@def)
nam(button(icl>thing).@def,"A")
dur(press(icl>do), time(icl>abstract thing).@def)
Etichetarea la parte de vorbire
Leii şi leoparzii vînează gazele.
leudefpln
şiconj
leoparddefpln
vîna3plv
gazelăindef
pln
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
defpln
def pln
vîna3plv
gazelăindef
pln
şiconj
Exemple în corpus
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
3 plv
gazelăindef
pln
Exemple în corpus
def pln
Căutare de exemple în corpus
Leii şi leoparzii vînează gazele.
3 plv
indef pln
Exemple în corpus
def pln
Cantitatea de exemple găsite dictează relaţiile
Leii şi leoparzii vînează gazele.
şiconj
Exemple în corpus
defpln
def pln
3 plv
indef pln
Cantitatea de exemple găsite dictează relaţiile
Leii şi leoparzii vînează gazele.
leudefpln
leoparddefpln
vîna3plv
gazelăindef
pln
obj
şiconj
and
agt
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs funcţii sofisticate
o funcţionare o recepţie
prezintă cîteva asigurăcare
şi superioară
Acest produs funcţii sofisticate
o funcţionare o recepţie
prezintă cîteva asigurăcare
şi superioară
cîteva funcţii sofisticate
o funcţionare şi o recepţie
Acest produs prezintă care asigură
superioară
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
aoj
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
qua
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
mod
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
obj
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
agt
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
and
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
and
mod
Cantitatea de exemple găsite dictează relaţiile
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.
Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară
and
obj
Lexicul
Crearea resursei Dicţionar pentru română • Wordnetul englezesc se va alinia cu
ontologia de concepte UNL – MD• Se va genera dicţionarul românesc din
wordnetul românesc, care este aliniat cu wordnetul englezesc
• Se va lucra cu Language Dictionary Builder
Flexionarea cuvintelor: analizăCrearea unui analizor de forme flexionate
• Se va rula POS-taggerul pt. limba română• Se va rula programul de flexionare AnMor• Se vor pune în corespondenţă:
– reprezentările morfo-sintactice ale flexionărilor AnMor
– setul de trăsături generate de POS-tagger
– setul de restricţii specifice UNL
• Din AnMor se va extrage un modul de analiză
Flexionarea cuvintelor: generareCrearea unui generator de forme flexionate
• Se va rula POS-taggerul pt. limba română• Se va rula programul de flexionare AnMor• Se vor pune în corespondenţă:
– reprezentările morfo-sintactice ale flexionărilor AnMor
– setul de trăsături generate de POS-tagger
– setul de restricţii specifice UNL
• Din AnMor se va extrage un modul de generare
Reprezentarea UNL
Crearea unui editor cu facilităţi grafice de descriere a reprezentărilor UNL
• Se vor inventaria editoarele grafice cunoscute• Se va construi un editor care va permite:
– reprezentarea grafică a liniilor de cod UNL
– proiectarea direct grafică a reprezentărilor UNL
– generarea de linii UNL din reprezentările grafice
Dezambiguarea semantică
Crearea unui pachet de funcţii capabil să determine cel mai probabil sens pe care îl are un cuvînt într-un context
• Inventarul de sensuri este cel al dicţionarului UNL• Se vor utiliza tehnici vectoriale de învăţare din
context a sensurilor cuvintelor• Pentru învăţare şi evaluare se va folosi volumul
literei V din DLR
Selecţia lexicală
Crearea unui pachet de funcţii capabil să aleagă cel mai bun cuvânt în locul unui UW
• Se va lucra cu wordnetul românesc şi cu corpusul
românesc• Se va utiliza alinierea creată între ierarhia de sensuri
UNL şi wordnet pentru regăsirea synsetului• Se va utiliza corpusul pentru găsirea acelui sinonim care
să exprime cel mai adecvat sensul în contextul curent (prin căutarea de exemple)
Recunoaşterea relaţiilor UNL
Crearea unui pachet de funcţii capabil să determine prin metode statistice relaţiile UNL între cuvinte
• Se va utiliza corpusul de cuvinte româneşti colectat• Se vor dezvolta algoritmi de regăsire a colecţiilor de
exemple ce satisfac anumite criterii în corpus• Relaţiile vor fi descoperite prin interpretarea acestor
colecţii• Comportamentul general al acestui pachet va fi unul
gen bootstrap (cu cît rulează pe mai multe exemple, cu atît comportamentul va fi mai bun)
Generarea de grupuri de cuvinte
Crearea unui pachet de funcţii capabil să genereze grupuri
• Se va utiliza corpusul de cuvinte româneşti colectat• Se vor dezvolta algoritmi de regăsire a colecţiilor de
exemple ce satisfac anumite criterii în corpus• Grupurile vor fi:
– întîi generate, prin algortimul de generare morfologică, plecînd de la restricţii
– apoi rafinate, prin armonizarea cu exemple găsite în corpus
Evaluarea
Stabilirea criteriilor de evaluare pentru fiecare modul în parte şi rularea de teste asupra acestora
• Se vor studia metode de evaluare utilizate în NLP• Se vor stabili criteriile şi procedurile de evaluare
pentru fiecare modul în parte• Se vor crea colecţii de date de test• Vor fi rulate programe de evaluare pentru fiecare
modul• Se vor prezenta aprecieri calitative şi cantitative asupra
modulelor sistemului