Proiect de traducere simbolică. UNL – exemple de reprezentări Mary broke the window...

42
Proiect de traducere simbolică
  • date post

    21-Dec-2015
  • Category

    Documents

  • view

    217
  • download

    3

Transcript of Proiect de traducere simbolică. UNL – exemple de reprezentări Mary broke the window...

Proiect de traducere simbolică

UNL – exemple de reprezentări

Mary broke the window

agt(break(icl>do).@entry.@past, "Mary")

obj(break(icl>do).@entry.@past, window(icl>thing).@def)

UNL – exemple de reprezentări

Mary walks with John.

agt(walk(icl>do).@entry.@present, "Mary")

cag(walk(icl>do).@entry.@present, "John")

UNL – exemple de reprezentări

Lions and leopards chase gazelles

agt(chase(icl>do).@entry.@present, lion(icl>thing).@pl)

and(lion(icl>thing).@pl, leopard(icl>thing).@pl)

obj(chase(icl>do).@entry, gazelle.@pl)

UNL – exemple de reprezentăriThis product features a number of sophisticated functions

ensuring superior reception and operation

aoj(feature(icl>state).@entry.@present,product(icl>thing).@def)

obj(feature(icl>state).@entry.@present,function(icl>abstract thing).@pl)

qua(function(icl>abstract thing).@pl,several)mod(function(icl>abstract thing).@pl,sophisticated)agt(ensure(icl>do).@present,function(icl>abstract

thing).@pl)obj(ensure(icl>do).@present,:01)and:01(operation(icl>action).@indef.@entry,reception(i

cl>action,obj>signal).@indef)mod(:01,superior(mod<thing))

All are designed for the easiest possible use, but many are not self-explanatory

obj(design(icl>do).@present.@complete,function(icl>abstract thing):01.@topic.@pl)

qua(function(icl>abstract thing):01.@topic.@pl, all(mod<thing))

pur(design(icl>do).@present.@complete,use(icl>action).@def)

mod(use(icl>action).@def,easy(mod<thing))man(easy(mod<thing),most)aoj(require(icl>state).@entry.@present.@unexpected-

consequence, function(icl>abstract thing):02.@pl)qua(function(icl>abstract thing):02.@pl,

many(mod<thing))obj(require(icl>state).@entry.@present.@unexpected-

consequence, explanation(icl>action).@pl)and(require(icl>state).@entry.@present.@unexpected-

consequence, design(icl>do).@present.@complete)

You can select the tuning method by changing the length of time you press the A button

agt(select(icl>do).@entry.@possibility,you)

obj(select(icl>do).@entry.@possibility,method.@def)

mod(method.@def,tuning(icl>action))

met(select(icl>do).@entry.@possibility, change(icl>do))

obj(change(icl>do),time(icl>abstract thing).@def)

agt(press(icl>do).@present,you)

obj(press(icl>do).@present,button(icl>thing).@def)

nam(button(icl>thing).@def,"A")

dur(press(icl>do), time(icl>abstract thing).@def)

Etichetarea la parte de vorbire

Leii şi leoparzii vînează gazele.

leudefpln

şiconj

leoparddefpln

vîna3plv

gazelăindef

pln

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

defpln

def pln

vîna3plv

gazelăindef

pln

şiconj

Exemple în corpus

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

3 plv

gazelăindef

pln

Exemple în corpus

def pln

Căutare de exemple în corpus

Leii şi leoparzii vînează gazele.

3 plv

indef pln

Exemple în corpus

def pln

Cantitatea de exemple găsite dictează relaţiile

Leii şi leoparzii vînează gazele.

şiconj

Exemple în corpus

defpln

def pln

3 plv

indef pln

Cantitatea de exemple găsite dictează relaţiile

Leii şi leoparzii vînează gazele.

leudefpln

leoparddefpln

vîna3plv

gazelăindef

pln

obj

şiconj

and

agt

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs funcţii sofisticate

o funcţionare o recepţie

prezintă cîteva asigurăcare

şi superioară

Acest produs funcţii sofisticate

o funcţionare o recepţie

prezintă cîteva asigurăcare

şi superioară

cîteva funcţii sofisticate

o funcţionare şi o recepţie

Acest produs prezintă care asigură

superioară

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

aoj

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

qua

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

mod

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

obj

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

agt

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

and

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

and

mod

Cantitatea de exemple găsite dictează relaţiile

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară.

Acest produs prezintă cîteva funcţii sofisticate care asigură o funcţionare şi o recepţie superioară

and

obj

Lexicul

Crearea resursei Dicţionar pentru română • Wordnetul englezesc se va alinia cu

ontologia de concepte UNL – MD• Se va genera dicţionarul românesc din

wordnetul românesc, care este aliniat cu wordnetul englezesc

• Se va lucra cu Language Dictionary Builder

Flexionarea cuvintelor: analizăCrearea unui analizor de forme flexionate

 • Se va rula POS-taggerul pt. limba română• Se va rula programul de flexionare AnMor• Se vor pune în corespondenţă:

– reprezentările morfo-sintactice ale flexionărilor AnMor

– setul de trăsături generate de POS-tagger

– setul de restricţii specifice UNL

• Din AnMor se va extrage un modul de analiză

Flexionarea cuvintelor: generareCrearea unui generator de forme flexionate

 • Se va rula POS-taggerul pt. limba română• Se va rula programul de flexionare AnMor• Se vor pune în corespondenţă:

– reprezentările morfo-sintactice ale flexionărilor AnMor

– setul de trăsături generate de POS-tagger

– setul de restricţii specifice UNL

• Din AnMor se va extrage un modul de generare

Reprezentarea UNL

Crearea unui editor cu facilităţi grafice de descriere a reprezentărilor UNL

 • Se vor inventaria editoarele grafice cunoscute• Se va construi un editor care va permite:

– reprezentarea grafică a liniilor de cod UNL

– proiectarea direct grafică a reprezentărilor UNL

– generarea de linii UNL din reprezentările grafice

Dezambiguarea semantică

Crearea unui pachet de funcţii capabil să determine cel mai probabil sens pe care îl are un cuvînt într-un context

 • Inventarul de sensuri este cel al dicţionarului UNL• Se vor utiliza tehnici vectoriale de învăţare din

context a sensurilor cuvintelor• Pentru învăţare şi evaluare se va folosi volumul

literei V din DLR

Selecţia lexicală

Crearea unui pachet de funcţii capabil să aleagă cel mai bun cuvânt în locul unui UW

 • Se va lucra cu wordnetul românesc şi cu corpusul

românesc• Se va utiliza alinierea creată între ierarhia de sensuri

UNL şi wordnet pentru regăsirea synsetului• Se va utiliza corpusul pentru găsirea acelui sinonim care

să exprime cel mai adecvat sensul în contextul curent (prin căutarea de exemple)

Recunoaşterea relaţiilor UNL

Crearea unui pachet de funcţii capabil să determine prin metode statistice relaţiile UNL între cuvinte

 • Se va utiliza corpusul de cuvinte româneşti colectat• Se vor dezvolta algoritmi de regăsire a colecţiilor de

exemple ce satisfac anumite criterii în corpus• Relaţiile vor fi descoperite prin interpretarea acestor

colecţii• Comportamentul general al acestui pachet va fi unul

gen bootstrap (cu cît rulează pe mai multe exemple, cu atît comportamentul va fi mai bun)

Generarea de grupuri de cuvinte

Crearea unui pachet de funcţii capabil să genereze grupuri

 • Se va utiliza corpusul de cuvinte româneşti colectat• Se vor dezvolta algoritmi de regăsire a colecţiilor de

exemple ce satisfac anumite criterii în corpus• Grupurile vor fi:

– întîi generate, prin algortimul de generare morfologică, plecînd de la restricţii

– apoi rafinate, prin armonizarea cu exemple găsite în corpus

Evaluarea

Stabilirea criteriilor de evaluare pentru fiecare modul în parte şi rularea de teste asupra acestora

 • Se vor studia metode de evaluare utilizate în NLP• Se vor stabili criteriile şi procedurile de evaluare

pentru fiecare modul în parte• Se vor crea colecţii de date de test• Vor fi rulate programe de evaluare pentru fiecare

modul• Se vor prezenta aprecieri calitative şi cantitative asupra

modulelor sistemului

Arhitectura sistemuluiGen. lexicului

Ana. morf.

Gen. morf.

Editor UNL

Dez. semantică

Rec. relaţiilor Gen. text

Evaluare

lexic românesc

reprezentare UNL

POS-taggerAnMor

corpus

Selecţia lex.DLR

litera V