Skillex Exploiter la structure des réseaux lexicaux...

Post on 14-Oct-2020

2 views 0 download

Transcript of Skillex Exploiter la structure des réseaux lexicaux...

SkillexExploiter la structure des réseaux lexicaux

extraits de ressources lexicalespour la modélisation en sciences cognitives

Bruno Gaume

Axe CARTEL

12 Octobre 2015

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 1 / 45

Travaux réalisés en collaboration avec Karine Duvignau (DidAPs)

Motivation

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 2 / 45

Artefact Cognitif

QuestionLes dictionnaires peuvent-ils être utilisés pour modéliser une partie du fonctionnementcognitif du lexique ?

Motivation

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 3 / 45

Réponse du conseil scienti�que d'un appel àprojet (2000) :

Plan

1 Structure des réseaux lexicaux

2 Un score d'habilité lexicale: Skillex

3 Perspectives

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 4 / 45

Plan

1 Structure des réseaux lexicaux

2 Un score d'habilité lexicale: Skillex

3 Perspectives

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 4 / 45

⇐=

1 Structure des réseaux lexicaux : Problème

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45

Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa

1 Structure des réseaux lexicaux : Problème

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45

Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa

Incompatible avec :

Hypothèse : La synonymie re�ète la structuresémantique du lexique commune aux membres d'unemême communauté linguistique

1 Structure des réseaux lexicaux : Problème

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 5 / 45

Constat : Il existe de nombreux désaccords entre lesmembres d'une même communauté linguistique :

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2 et vice et versa

Hypothèse : La synonymie re�ète la structuresémantique du lexique commune aux membres d'unemême communauté linguistique

Résoudre cette contradiction apparente

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45

bavarder : parler, discourir, causercauser : parler, discuter, bavarder, provoquer, exciterdiscourir : parler, palabrer, pérorer, bavarderdiscuter : parler, palabrer, causer, pérorerexciter : causer, provoquerpalabrer : parler, discourir, pérorer, discuterparler : palabrer, discourir, causer, pérorer, discuter, bavarderpérorer : parler, palabrer, discourir, discuterprovoquer : causer, exciter

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45

bavarder : parler, discourir, causercauser : parler, discuter, bavarder, provoquer, exciterdiscourir : parler, palabrer, pérorer, bavarderdiscuter : parler, palabrer, causer, pérorerexciter : causer, provoquerpalabrer : parler, discourir, pérorer, discuterparler : palabrer, discourir, causer, pérorer, discuter, bavarderpérorer : parler, palabrer, discourir, discuterprovoquer : causer, exciter

G = (V,E) où E ⊆ PV2

V ={bavarder, causer, discourir, discuter, exciter, palabrer, parler, pérorer, provoquer

}E =

{{bavarder, parler}, {bavarder, discourir}, {bavarder, causer} {causer, discuter},

{causer, parler}, {causer, provoquer}, {causer, exciter}, {discourir, parler},{discourir, palabrer}, {discourir, pérorer}, {discuter, parler}, {discuter, palabrer},{discuter, pérorer}, {exciter, provoquer}, {palabrer, parler}, {palabrer, pérorer},{parler, pérorer}

}Un graphe de n = |V | sommets et m = |E | arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 6 / 45

G = (V,E) où E ⊆ PV2

V ={bavarder, causer, discourir, discuter, exciter, palabrer, parler, pérorer, provoquer

}E =

{{bavarder, parler}, {bavarder, discourir}, {bavarder, causer} {causer, discuter},

{causer, parler}, {causer, provoquer}, {causer, exciter}, {discourir, parler},{discourir, palabrer}, {discourir, pérorer}, {discuter, parler}, {discuter, palabrer},{discuter, pérorer}, {exciter, provoquer}, {palabrer, parler}, {palabrer, pérorer},{parler, pérorer}

}Un graphe de n = |V | sommets et m = |E | arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 7 / 45

Structures des graphes de terrain

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 8 / 45

Structures des graphes de terrain

I Les graphes Lexicaux

I Les graphes d'accointance d'un groupe d'humains

I Le graphe des appels téléphoniques aux USA

I Le graphe du World Wide Web

I Le graphe des collaborations cinématographiques

I Le graphe de Caenorhabditis elegans

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 9 / 45

Structures des graphes de terrain

I Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45

Structures des graphes de terrain

Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45

Structures des graphes de terrain

Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

- Les graphes Lexicaux

- Les graphes d'accointance d'un groupe d'humains

- Le graphe des appels téléphoniques aux USA

- Le graphe du World Wide Web

- Le graphe des collaborations cinématographiques

- Le graphe de Caenorhabditis elegans

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 10 / 45

Structures des graphes de terrain

Réseaux Petits Mondes Hiérarchiques ClusterisésI Faible densité

I Chemins courts

I Distribution des degrés à queue lourde (loi de puissance)

I Fort coe�cient de clustering : zones denses en arêtes

Réseaux lexicaux construits à partir de ressources électroniques

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 11 / 45

Les réseaux Lexicaux extraits des dictionnaires sont des Réseaux PetitsMondes Hiérarchiques Clusterisés

[Gaume, 2004, Steyvers and Tenenbaum, 2005, De Deyne and Storms, 2008,

Morais et al., 2013]

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

G1 = (V1,E1)

G2 = (V2,E2)

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

G1 = (V1,E1)

G2 = (V2,E2)

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

G1 = (V1,E1)

G2 = (V2,E2)

G ′1 =

(V ′ = (V1 ∩ V2),E ′

1 = E1 ∩ (V ′ × V ′))

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

G1 = (V1,E1)

G2 = (V2,E2)

G ′1 =

(V ′ = (V1 ∩ V2),E ′

1 = E1 ∩ (V ′ × V ′))

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 12 / 45

G1 = (V1,E1)

G2 = (V2,E2)

G ′1 =

(V ′ = (V1 ∩ V2),E ′

1 = E1 ∩ (V ′ × V ′))

G ′2 =

(V ′ = (V1 ∩ V2),E ′

2 = E2 ∩ (V ′ × V ′))

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45

G′1

=(V′,E′

1

)

G′2

=(V′,E′

2

)

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45

G′1

=(V′,E′

1

)

G′2

=(V′,E′

2

)

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45

G′1

=(V′,E′

1

)

G′2

=(V′,E′

2

)GED(G ′1,G′2) =

|E ′1∩E ′

2|+|E ′2∩E ′

1||E ′

1|+|E ′2| ∈ [0, 1]

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45

G′1

=(V′,E′

1

)

G′2

=(V′,E′

2

)GED(G ′1,G′2) =

|E ′1∩E ′

2|+|E ′2∩E ′

1||E ′

1|+|E ′2| ∈ [0, 1]

GED(Lar ′,Rob′) = 0.47

Comparer E1 et E2 comme des �sacs de liens�

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 13 / 45

G′1

=(V′,E′

1

)

G′2

=(V′,E′

2

)GED(G ′1,G′2) =

|E ′1∩E ′

2|+|E ′2∩E ′

1||E ′

1|+|E ′2| ∈ [0, 1]

GED(Lar ′,Rob′) = 0.47

Nombreux désaccords entre Larousse et Robert

Hypothèse

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45

Hypothèse

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45

Nombreux désaccords au niveau des arêtes

Hypothèse

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45

Nombreux désaccords au niveau des arêtes

G1 = (V ,E1) G2 = (V ,E2)

Aucune arête commune entre ces deux graphes.

Hypothèse

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45

Nombreux désaccords au niveau des arêtes

G1 = (V ,E1) G2 = (V ,E2)

Aucune arête commune entre ces deux graphes.

GED(G1,G2) = 1

Hypothèse

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 14 / 45

Nombreux désaccords au niveau des arêtes

G1 = (V ,E1) G2 = (V ,E2)

Aucune arête commune entre ces deux graphes.

GED(G1,G2) = 1

Mais

Bon accord au niveau des clusters...

Métaphore

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 15 / 45

Métaphore

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 16 / 45

La photo d'un chat

Chaque pixel impair est peint en blanc

Chaque pixel pair est peint en blanc

Métaphore

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45

Pair =

Métaphore

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45

Pair = Impair =

Métaphore

Aucun pixel communImages distantes (au niveau des pixels)

Cependant ces deux images se ressemblent

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45

Pair = Impair =

Métaphore

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 17 / 45

Pair = Impair =

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45

causerallumer

amenerapporter

attirer

avoir pour effet

bavarder

blaguer

cancaner

commérer

confabuler

conférer

converser

créer

deviser

dialoguer

discourir

discuter

disserter

donner

déclencherdéterminer

engendrer

entraîner

exciterfairefaire naître fomenter

former

giberner

inspirer

jaboter

jacasser

jaserjaspiner

jeter

motiver

occasionner

papoterparler

parloterpotiner

procurerproduire

provoquer

s'entretenir

soulever

susciter

valoir

être cause de

être à l'origine de

Réseaux Petits Mondes HiérarchiquesI Faible densité

I Chemins courts

I Distribution des degrés à queue lourde

I Fort coe�cient de clustering : zones denses

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 18 / 45

causerallumer

amenerapporter

attirer

avoir pour effet

bavarder

blaguer

cancaner

commérer

confabuler

conférer

converser

créer

deviser

dialoguer

discourir

discuter

disserter

donner

déclencherdéterminer

engendrer

entraîner

exciterfairefaire naître fomenter

former

giberner

inspirer

jaboter

jacasser

jaserjaspiner

jeter

motiver

occasionner

papoterparler

parloterpotiner

procurerproduire

provoquer

s'entretenir

soulever

susciter

valoir

être cause de

être à l'origine de

Réseaux Petits Mondes HiérarchiquesI Faible densité

I Chemins courts

I Distribution des degrés à queue lourde

I Fort coe�cient de clustering : zones denses

Marches AléatoiresI Idée: si (u, v) sont dans un même �cluster� , alors beaucoup de

chemins mènent de u à v (même si ils ne sont pas adjacents).

I Un marcheur aléatoire a tendance a être capturé par les �clusters�

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

1

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

0,2 0,2

0,2

0,2

0,2

0,2

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

0,13 0,16

0,21

0,09

0,12

0,16

0,03

0,03

0,05

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

0,13 0,16

0,17

0,10

0,12

0,15

0,07

0,06

0,06

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

Marches Aléatoires

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

0,13 0,16

0,17

0,10

0,12

0,15

0,07

0,06

0,06

1 État initial (t=0)

2 t = 1

3 t = 2

4 t = 3

La Proxémie : P t

G(u, v)

Dans G , probabilité d'être sur v à l'instant t en partant de u

Marches Aléatoires

1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher

Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

La Proxémie : P t

G(u, v)

Dans G , probabilité d'être sur v à l'instant t en partant de u

Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)

Marches Aléatoires

1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher

Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

La Proxémie : P t

G(u, v)

Dans G , probabilité d'être sur v à l'instant t en partant de u

Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)

Marches Aléatoires

1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher

Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

La Proxémie : P t

G(u, v)

Dans G , probabilité d'être sur v à l'instant t en partant de u

Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)

Marches Aléatoires

1) dépouiller* 11) dévoiler 21) arracher 31) tailler 41) dire2) défaire* 12) dégager 22) délacer* 32) développer 42) ouvrir3) démunir* 13) étaler* 23) voler 33) déchirer 43) déployer4) déshabiller* 14) ôter* 24) dénouer 34) déchausser 44) dépiauter5) dévêtir* 15) enlever 25) desserrer 35) vider 45) déposséder6) révéler 16) défrusquer 26) médire* 36) peler 46) frustrer7) découvrir* 17) a�cher 27) débarrasser 37) dépourvoir 47) indiquer8) montrer* 18) désa�ubler 28) exposer 38) défubler 48) démontrer9) dénuder* 19) écorcher* 29) couper 39) priver 49) manifester10) dégarnir* 20) démasquer* 30) exhiber* 40) trahir 50) détacher

Table: Les cinquante verbes qui ont la plus forte probabilité d'être atteints en 4 pasdepuis déshabiller (sur 10000 verbes).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 19 / 45

La Proxémie : P t

G(u, v)

Dans G , probabilité d'être sur v à l'instant t en partant de u

Liste ordonnées des verbes selon leur score de proxémie à partir de déshabiller(t = 4)

Con�uence

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45

Con�uence

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45

I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :

limt→∞ PtG (u, v) = degG (v)∑

r∈VdegG (r) = πG (v)

Con�uence

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45

I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :

limt→∞ PtG (u, v) = degG (v)∑

r∈VdegG (r) = πG (v)

I Marches courtes: forte probabilité de rester dans un cluster:

• Pt

G (u, v) > πG (v) si u et v sont dans un même cluster• Pt

G (u, v) < πG (v) sinon

Con�uence

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45

I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :

limt→∞ PtG (u, v) = degG (v)∑

r∈VdegG (r) = πG (v)

I Marches courtes: forte probabilité de rester dans un cluster:

• Pt

G (u, v) > πG (v) si u et v sont dans un même cluster• Pt

G (u, v) < πG (v) sinon

0 20 40 60 80 100

t : Longueur des marches10−5

10−4

10−3

10−2

10−1

y

G = Rob : {eplucher,depecer} ∈ ELar

P tG(eplucher, depecer)

P tG(eplucher, sonner)

0 20 40 60 80 100

t : Longueur des marches10−5

10−4

10−3

10−2

y

G = Lar : {eplucher,depecer} /∈ ELar

P tG(eplucher, depecer)

P tG(eplucher, sonner)

Con�uence

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 20 / 45

I Marches longues: la probabilité d'atteindre un sommet v ne dépend quedu degrés de v :

limt→∞ PtG (u, v) = degG (v)∑

r∈VdegG (r) = πG (v)

I Marches courtes: forte probabilité de rester dans un cluster:

• Pt

G (u, v) > πG (v) si u et v sont dans un même cluster• Pt

G (u, v) < πG (v) sinon

t = 5 : CONFG(u, v) =P5

G(u,v)

P5G

(u,v)+πG(v)

CONFG est une mesure de proximité normalisée basée sur les marchesaléatoires courtes dans G :

I Beaucoup de chemins courts entre u et v : CONFG (u, v) > 0, 5;

I Peu de chemins courts entre u et v : CONFG (u, v) < 0, 5;

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1

GRa = (V ,ER

a )

GR

b= (V ,ER

b) GR

c = (V ,ERc )

ER

b∩ ER

c = ∅⇒GED(GR

b,GR

c ) = 1

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1

GRa = (V ,ER

a )

GR

b= (V ,ER

b) GR

c = (V ,ERc )

ER

b∩ ER

c = ∅⇒GED(GR

b,GR

c ) = 1

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1

GRa = (V ,ER

a )

GR

b= (V ,ER

b) GR

c = (V ,ERc )

ER

b∩ ER

c = ∅⇒GED(GR

b,GR

c ) = 1

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

Gb/Gc

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 21 / 45

Ga = (V ,Ea)

Gb = (V ,Eb) Gc = (V ,Ec)

Eb ∩ Ec = ∅⇒GED(Gb,Gc) = 1

GRa = (V ,ER

a )

GR

b= (V ,ER

b) GR

c = (V ,ERc )

ER

b∩ ER

c = ∅⇒GED(GR

b,GR

c ) = 1

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

Gb/Gc

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

GR

b /GRc

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

Gb/Gc

GED(Gb,Gc) = 1

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

GR

b /GRc

GED(GR

b,GR

c ) = 1

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

Gb/Gc

GED(Gb,Gc) = 1

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

GR

b /GRc

GED(GR

b,GR

c ) = 1

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)

Con�uence: Expérience contrôlée

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 22 / 45

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

Gb/Gc

GED(Gb,Gc) = 1

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

200

400

600

800

1000

Freq

uenc

e

GR

b /GRc

GED(GR

b,GR

c ) = 1

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)

µ(Gb,Gc) = 0.74 µ(GR

b,GR

c ) = 0.49

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)Robert / Larousse

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)Robert / Larousse

GED(G ′Rob

,G ′Lar

) = 0.47 GED(G ′RRob

,G ′RLar

) = 0.47

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)Robert / Larousse

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

5000

10000

15000

20000

25000

Freq

uenc

e

GED(G ′Rob

,G ′Lar

) = 0.47

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

5000

10000

15000

20000

25000

Freq

uenc

e

GED(G ′RRob

,G ′RLar

) = 0.47

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 23 / 45

µ(G1,G2) =

1

|E1∩E2|+|E2∩E1|

(∑{u,v}∈(E2∩E1) CONFG1({u, v}) +

∑{u,v}∈(E1∩E2) CONFG2({u, v})

)Robert / Larousse

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

5000

10000

15000

20000

25000

Freq

uenc

e

GED(G ′Rob

,G ′Lar

) = 0.47

0.0 0.2 0.4 0.6 0.8 1.0

Valeur0

5000

10000

15000

20000

25000

Freq

uenc

e

GED(G ′RRob

,G ′RLar

) = 0.47

µ(G′Rob

,G′Lar

) = 0.80 µ(G′RRob

,G′RLar

) = 0.24

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45

Applications sur les Réseaux lexicaux

Table: Pédigrés de quelques graphes lexicaux

Graphes lexicaux n m 〈k〉 C Llcc λ (r2)

Lar

Adjectifs 5510 21147 7,68 0,21 4,92 -2,06 (0,88)Noms 12159 31601 5,20 0,20 6,10 -2,39 (0,88)Verbes 5377 22042 8,20 0,17 4,61 -1,94 (0,88)

Rob

Adjectifs 7693 20011 5,20 0,14 5,26 -2,05 (0,94)Noms 24570 55418 4,51 0,11 6,08 -2,34 (0,94)Verbes 7357 26567 7,22 0,12 4,59 -2,01 (0,93)

Jdm

Adjectifs 9859 30087 6,10 0,16 5,44 -2,24 (0,90)Noms 29213 56381 3,86 0,14 6,48 -2,66 (0,93)Verbes 7658 22260 5,81 0,14 5,06 -2,08 (0,89)

Wik

Adjectifs 6960 6594 1,89 0,15 8,48 -2,46 (0,95)Noms 43206 37661 1,74 0,13 10,56 -2,51 (0,89)Verbes 7203 7497 2,08 0,25 9,22 -2,28 (0,92)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45

Applications sur les Réseaux lexicaux

Table: Mesurer la similarité structurelle entre réseaux lexicaux

GED (µ) (µR) sur les paires de graphes

G1/G2 RobA JdmA WikALarA 0, 45 (0, 76) (0, 34) 0, 47 (0, 71) (0, 38) 0, 75 (0, 41) (0, 06)RobA 0, 51 (0, 70) (0, 29) 0, 71 (0, 42) (0, 05)JdmA 0, 54 (0, 43) (0, 03)

G1/G2 RobN JdmN WikNLarN 0, 48 (0, 70) (0, 20) 0, 48 (0, 70) (0, 19) 0, 72 (0, 31) (0, 03)RobN 0, 47 (0, 70) (0, 13) 0, 71 (0, 29) (0, 02)JdmN 0, 46 (0, 32) (0, 01)

G1/G2 RobV JdmV WikVLarV 0, 48 (0, 73) (0, 40) 0, 46 (0, 70) (0, 39) 0, 78 (0, 25) (0, 05)RobV 0, 47 (0, 70) (0, 37) 0, 78 (0, 25) (0, 06)JdmV 0, 55 (0, 31) (0, 04)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45

Applications sur les Réseaux lexicaux

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 24 / 45

causer

amener

entraîner

faire

conférer

donner

apporter

produire

exciter

provoquersoulever

déclencheroccasionnersusciter

déterminerengendrer

procurer

motiver

parler

valoir

jaser

bavarder

jacasserpapoter

converser

cancanercommérer

potiner

deviser

dialoguer

discuter

créer

jeters'entretenir

disserter

jaspiner

parloter

causer

donner

engendrer

créerfaire

amener

entraîner

exciterapporter

parler

attirer

discuter

provoquerproduire

susciter

déterminer

occasionner

motiver

former

se procurer

conférer

bavarder

cancaner

jaser

potiner

être cause deconverser

confabulerdevisers'entretenir

faire naître

disserter

causer

procurer

déterminer

donner

jacasser

attirer

entraîner

coûter

occasionner

disserterproduire

papoter

apportercréer

amener

bavarder

susciter

valoir

engendrer

détruireparlers\'entretenir

causer apporter

occasionner

générer

Larousse Robert

Jeux de mots Wiktionary

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45

Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique

Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2

I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45

Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique

Incompatible ?

Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2

I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45

Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique

Incompatible ?

Constat : Il existe de nombreux désaccords entre membres d'unemême communauté linguistique:GED(G1,G2) ≈ 0.50

I Beaucoup de paires de mots sont synonymes pour l'individu I1 et pas pourl'individu I2

I Beaucoup de paires de mots sont synonymes pour l'individu I2 et pas pourl'individu I1

Non

Parceque : Ces désaccords sont des désaccords faibles :µ(G1,G2) ≈ 0.70 (accord au niveau structurel)

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 25 / 45

Hypothèse : La synonymie re�ète la structure sémantique dulexique commune aux membres d'une même communautélinguistique

L'analyse d'une relation lexicale doit être faite au niveau dela structure globale dessinée par la relation. C'est ce que lamesure µ peut faire: avec un niveau de représentationadéquat, elle réconcilie les jugements portés par deux jugesdi�érents sur une même relation lexicale.

1 Structure des réseaux lexicaux

2 Un score d'habilité lexicale: Skillex

3 Perspectives

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 26 / 45

⇐=

Le protocole Approx [Duvignau et Gaume, 2004]

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45

Le protocole Approx [Duvignau et Gaume, 2004]

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45

�Qu'est-ce qu'elle a fait la dame ?�

�Ce qu'elle a fait la dame, dis le moi d'une autre manière, avec d'autresmots�

Le protocole Approx [Duvignau et Gaume, 2004]

Exemple

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 27 / 45

Le protocole Approx [Duvignau et Gaume, 2004]

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 28 / 45

Approx : premiers résultats [Duvignau, 2008]

2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%

Table: Résultats (à la main)

Les productions des enfants typiques :

I Des verbes plus génériques que les adultes typiques.

Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .

I Des verbes plus approximatifs que les adultes typiques.

Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45

Approx : premiers résultats [Duvignau, 2008]

2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%

Table: Résultats (à la main)

Les productions des enfants typiques :

I Des verbes plus génériques que les adultes typiques.

Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .

I Des verbes plus approximatifs que les adultes typiques.

Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45

Approx : premiers résultats [Duvignau, 2008]

2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%

Table: Résultats (à la main)

Les productions des enfants typiques :

I Des verbes plus génériques que les adultes typiques.

Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .

I Des verbes plus approximatifs que les adultes typiques.

Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45

Approx : premiers résultats [Duvignau, 2008]

2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%

Table: Résultats (à la main)

Les productions des enfants typiques :

I Des verbes plus génériques que les adultes typiques.

Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .

I Des verbes plus approximatifs que les adultes typiques.

Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45

Approx : premiers résultats [Duvignau, 2008]

2-5 ans 18-40 ans% d'approximations 37% 6%% de verbes spéci�ques 40% 84%

Table: Résultats (à la main)

Les productions des enfants typiques :

I Des verbes plus génériques que les adultes typiques.

Hypothèses H1 : Le degrés : la généricité du verbe u est corrélée à deg(u) .

I Des verbes plus approximatifs que les adultes typiques.

Hypothèses H2 : La con�uence: la proximité sémantique entre u et v estcorrélée à CONFG (u, v).

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 29 / 45

Zone lexico-semantique d'une action

A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):

I(∆(Fi )

)vla probabilité que le verbe v soit utilisé par un échantillon de

population pour décrire l'action du �lm Fi

Français Mandarin24-59 mois 74 2918-40 ans 76 60

Table: Populations étudiées (Duvignau & Cheung)

I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45

Zone lexico-semantique d'une action

A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):

I(∆(Fi )

)vla probabilité que le verbe v soit utilisé par un échantillon de

population pour décrire l'action du �lm Fi

Français Mandarin24-59 mois 74 2918-40 ans 76 60

Table: Populations étudiées (Duvignau & Cheung)

I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45

Zone lexico-semantique d'une action

A chaque �lm Fi est associé une zone lexico-sémantique dans le graphe desynonymie (départ de la balade aléatoire) ∆(Fi ):

I(∆(Fi )

)vla probabilité que le verbe v soit utilisé par un échantillon de

population pour décrire l'action du �lm Fi

Français Mandarin24-59 mois 74 2918-40 ans 76 60

Table: Populations étudiées (Duvignau & Cheung)

I échantillon de population = 25 adultes et 25 enfants (aucun avantage à unequelconque population =⇒ pas de biais méthodologique)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 30 / 45

Scores de Degrés et de Con�uence

Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):

I Un score de Degrés : degG (v)

I Un score de Con�uence : CONFG (∆(Fi ), v)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45

Scores de Degrés et de Con�uence

Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):

I Un score de Degrés : degG (v)

I Un score de Con�uence : CONFG (∆(Fi ), v)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45

Scores de Degrés et de Con�uence

Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):

I Un score de Degrés : degG (v)

I Un score de Con�uence : CONFG (∆(Fi ), v)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45

Scores de Degrés et de Con�uence

Deux mesures sont associées à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):

I Un score de Degrés : degG (v)

I Un score de Con�uence : CONFG (∆(Fi ), v)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 31 / 45

Populations

Français Mandarin24-59 mois 74 2918-40 ans 76 60

Table: Populations étudiées (Duvignau & Cheung)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 32 / 45

Hypotèse H1 (Moyenne des degrés)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45

Hypotèse H1 (Moyenne des degrés)

Children Adults

4080

120

FRENCH (DEGREE)●

Children Adults1020

3040

MANDARIN (DEGREE)

Figure: Scores de degrés pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45

Hypotèse H1 (Moyenne des degrés)

Children Adults

4080

120

FRENCH (DEGREE)●

Children Adults1020

3040

MANDARIN (DEGREE)

Figure: Scores de degrés pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45

Man-Whitney-Wilcoxon testW (150) = 5389; p < 0.001

Hypotèse H1 (Moyenne des degrés)

Children Adults

4080

120

FRENCH (DEGREE)●

Children Adults1020

3040

MANDARIN (DEGREE)

Figure: Scores de degrés pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45

Man-Whitney-Wilcoxon testW (150) = 5389; p < 0.001

Man-Whitney-Wilcoxon testW (89) = 1243; p < .001

Hypotèse H1 (Moyenne des degrés)

Children Adults

0.01

00.

020

FRENCH (RECIPROCAL DEGREE)

Children Adults0.02

0.04

0.06

0.08

MANDARIN (RECIPROCAL DEGREE)

Figure: (Inverse des scores de degrés pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 33 / 45

Hypothèse H2 (Moyenne des Con�uences)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45

Hypothèse H2 (Moyenne des Con�uences)

Figure: Scores de Con�uence pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45

Hypothèse H2 (Moyenne des Con�uences)

Figure: Scores de Con�uence pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45

Fisher testF (150) = 13.58; p < .001

Hypothèse H2 (Moyenne des Con�uences)

Figure: Scores de Con�uence pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 34 / 45

Fisher testF (150) = 13.58; p < .001

Fisher testF (89) = 79.41; p < .001

Score Skillex

Le score Skillex est associé à chaque participant p qui produit le verbe v pourdécrire l'action du �lm Fi de zone lexico-semantique ∆(Fi ):

I SkillexG (∆(Fi ), v) = CONFG (∆(Fi ),v)degG (v)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45

Score Skillex

Children Adults0.00

00.

010

0.02

0

FRENCH (SKILLEX)

●●

Children Adults0.02

0.04

0.06

MANDARIN (SKILLEX)

Figure: Scores Skillex pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45

Score Skillex

Children Adults0.00

00.

010

0.02

0

FRENCH (SKILLEX)

●●

Children Adults0.02

0.04

0.06

MANDARIN (SKILLEX)

Figure: Scores Skillex pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45

Man-Whitney-Wilcoxon testW (150) = 5756; p < .001

Score Skillex

Children Adults0.00

00.

010

0.02

0

FRENCH (SKILLEX)

●●

Children Adults0.02

0.04

0.06

MANDARIN (SKILLEX)

Figure: Scores Skillex pour le Français et pour le Mandarin

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 35 / 45

Man-Whitney-Wilcoxon testW (150) = 5756; p < .001

Man-Whitney-Wilcoxon testW (89) = 1670; p < .001

Classi�cation automatique: jeunes enfants VS Adultes

Est-ce que le score Skillex permet une classi�cation automatiqueenfants VS adultes des participants au protocole Approx ?

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45

Classi�cation automatique: jeunes enfants VS Adultes

Figure: Scores Skillex selon l'age des participants au protocole Approx

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45

Classi�cation automatique: jeunes enfants VS Adultes

Figure: Scores Skillex selon l'age des participants au protocole Approx

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45

Score Precision κDegree .91 .81Conf .61 .21Skillex .96 .92

Table: 2-means clustering: French

Classi�cation automatique: jeunes enfants VS Adultes

Figure: Scores Skillex selon l'age des participants au protocole Approx

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 36 / 45

Score Precision κDegree .91 .81Conf .61 .21Skillex .96 .92

Table: 2-means clustering: French

Score Precision κDegree .64 .17Conf .84 .62Skillex .91 .80

Table: 2-means clustering: Mandarin

Robustesse

Les �lms sont sans biais culturels [Cheung et al., 2010]:Analyses statistiques d'un protocole culturel [Cheung et al., 2010]:

I 20 participants Français (Duvignau);

I 20 participants Taiwanais (Cheung);

Les scores de degrés, ni de con�uence ne sont sensibles à la variabilité des réseauxlexicaux pour une langue donnée [Gaillard et al., 2011, Gaume et al., 2014]

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 37 / 45

Robustesse

Figure: Scores Skillex selon l'age des participants au protocole Approx

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 38 / 45

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 39 / 45

Artefact Cognitif

Bilan

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 39 / 45

Artefact Cognitif

1 Structure des réseaux lexicaux

2 Un score d'habilité lexicale: Skillex

3 Perspectives

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 40 / 45

⇐=

Travaux futurs : typologieAutres langues et autres catégories d'actions

I Etendre les analyses à d'autres langues⇒ typologie des dynamiques d'acquisition lexicale selon les langues

I Etendre le protocole à d'autres catégories d'actions(i.e. verbes de mouvement)

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 41 / 45

Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45

Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45

Travaux futurs : cliniqueAide au diagnostic de troubles provoquant des troubleslangagiers

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 42 / 45

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 43 / 45

Merci谢谢

Thank you

Cheung, H., Desalle, Y., Duvignau, K., Gaume, B., Chang, C.-H., and Magistry, P. (2010).

The use of a cultural protocol for quantifying cultural variations in verbs semantic betweenchinese and french.

In Proceedings of 24th Paci�c Asia Conference on Language, Information andComputation: Workshop on Model and Measurement of Meaning (M3), Sendai, Japan.

De Deyne, S. and Storms, G. (2008).

Word associations: Network and semantic properties.

Behavior Research Methods, 40(1):213�231.

Duvignau, K. (2008).

Acquisition du lexique verbal par proximité sémantique: premiers pas avec les troublesspéci�ques du langage oral et ouverture sur la dyslexie.

ANAE: Revue de Neuropsychologie du Développement et des Apprentissages,20(96�97):65�70.

Gaillard, B., Gaume, B., and Navarro, E. (2011).

Invariant and variability of synonymy networks: Self mediated agreement by con�uence.

In Proceedings of the TextGraph-6 Workshop, pages 15�23. Association for ComputationalLinguistics.

Gaume, B. (2004).

Balades aléatoires dans les petits mondes lexicaux.

Information Engineering Sciences, 4(2):39�96.

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 44 / 45

Gaume, B., Navarro, E., Desalle, Y., and Gaillard, B. (2014).

Mesurer la similarité structurelle entre réseaux lexicaux.

In Réseaux Lexicaux et Traitement des Langues Naturelles, TALN 2014, Marseille, France.TALN.

Morais, A., Olsson, H., and Schooler, L. (2013).

Mapping the structure of semantic memory.

Cognitive Science, 27(1):125�145.

Steyvers, M. and Tenenbaum, J. B. (2005).

The Large Scale Structure of Semantic Networks: Statistical Analyses and Model ofSemantic Growth.

Cognitive Science, 29:41�78.

Bruno Gaume ( Axe CARTEL) Skillex 12 Octobre 2015 45 / 45