Word2vec 4 all

15
Word2vec 4 All Oscar García Peinado

Transcript of Word2vec 4 all

Page 1: Word2vec 4 all

Word2vec 4 All

Oscar García Peinado

Page 2: Word2vec 4 all

Word embedding - Word2vec

Page 3: Word2vec 4 all

Documento:Camera porpoise dolphin SeaWorld Paris Camera.

Vocabulario:Subconjunto de palabras únicas

Page 4: Word2vec 4 all

Que es word2vec?Es un modelo matemático desarrollado por el equipo de investigación sobre análisis lingüístico de Google y liderado por Tomas Mikolov y publicado en 2013.

En dos líneas:

Word2vec se encarga de representar cada una de las palabras del vocabulario de un texto en un espacio vectorial de N-Dimensiones.

Paper google: (https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf)

Page 5: Word2vec 4 all

Literalmente ¿que hace word2vec?Cuando el modelo proyecta el vocabulario sobre el espacio N-dimensional intenta dejar cerca todas las palabras que aparecen en el mismo contexto.

cochemoto casa

cocinabaño

parque

cine

árbol

Page 6: Word2vec 4 all

¿Parecido por contexto?

Xin Rong - word2vec: https://www.youtube.com/watch?v=D-ekE-Wlcds&t=1852s

Page 7: Word2vec 4 all

Operaciones en el espacio vectorial

vec(“Berlin”) - vec(“Germany”) + vec(“France”) = ???

Page 8: Word2vec 4 all

¿Por dentro?

Page 9: Word2vec 4 all
Page 10: Word2vec 4 all

Red neuronal -Entrada: Vector con los valores de la palabra que estamos tratando (skip-gram ,CBOW)

-Salida: Vector de las palabras relacionadas con el vector de entrada dependiendo del modelo de input utilizado (skip-gram, CBOW)

Page 11: Word2vec 4 all

CBOW

La entrada sería el conjunto que rodea al target y la salida sería el target.

Page 12: Word2vec 4 all

Skip-gram

El input es la palabra que estamos procesando y la salida es el contexto.

Page 13: Word2vec 4 all

Demo online

https://ronxin.github.io/wevi/

Page 14: Word2vec 4 all

Referenciashttps://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf

https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf

https://docs.google.com/presentation/d/1yQWN1CDWLzxGeIAvnGgDsIJr5xmy4dB0VmHFKkLiibo/pub?start=false&loop=false&delayms=3000&slide=id.ge79682746_0_245

https://www.youtube.com/watch?v=D-ekE-Wlcds&t=1852s

Page 15: Word2vec 4 all

Fin