Cartolabe, un système d'information par apprentissage ...

2
HAL Id: hal-03248104 https://hal.archives-ouvertes.fr/hal-03248104 Preprint submitted on 3 Jun 2021 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Cartolabe, un système d’information par apprentissage automatique Anne-Catherine Letournel, Philippe Caillou, Jean-Daniel Fekete, Jonas Renault, Michèle Sebag To cite this version: Anne-Catherine Letournel, Philippe Caillou, Jean-Daniel Fekete, Jonas Renault, Michèle Sebag. Car- tolabe, un système d’information par apprentissage automatique. 2018. hal-03248104

Transcript of Cartolabe, un système d'information par apprentissage ...

HAL Id: hal-03248104https://hal.archives-ouvertes.fr/hal-03248104

Preprint submitted on 3 Jun 2021

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, estdestinée au dépôt et à la diffusion de documentsscientifiques de niveau recherche, publiés ou non,émanant des établissements d’enseignement et derecherche français ou étrangers, des laboratoirespublics ou privés.

Cartolabe, un système d’information par apprentissageautomatique

Anne-Catherine Letournel, Philippe Caillou, Jean-Daniel Fekete, JonasRenault, Michèle Sebag

To cite this version:Anne-Catherine Letournel, Philippe Caillou, Jean-Daniel Fekete, Jonas Renault, Michèle Sebag. Car-tolabe, un système d’information par apprentissage automatique. 2018. �hal-03248104�

Cartolabe, un système d’information par apprentissage automatique  cartolabe.frCartolabe, un système d’information par apprentissage automatique  cartolabe.fr

P. Caillou, J-D. Fekete, AC. Letournel, J. Renault, M. Sebag

Résumé

Décembre 2018

Cartolabe permet de visualiser le contenu d'un grand ensemble de documents. Une de ses fonctionalités est de représenter les compétences d'un ensemble de personnes en s'appuyant sur leurs articles scientifiques (ou autres documents disponibles).Cartolabe crée une distance ou similarité entre documents, permettant de projeter les documents proches sur des points proches de la carte.

Architecture

Serveurs HAL

Tex t

pro

cess

ing

Lat e

n t P

roje

cton

Sco r

i ng

+ di

s ta n

c e =

neig

h bo r

s

2D P

r oj e

c to n

Clu s

t er in

g

Cartolabe-data Cartolabe-vis

Mongo-db

Cartolabe-data

Hea

tmap

s

Labe

ls

Sear

ch e

ngin

e

Rest

API

d3fc_labels_layout

Backend Frontend

Espace original Espace latent 2 dimensions

+ voisins

+ voisins

+ voisins

+ voisins

+ voisins

+ voisins

Clients

Cartolabe intègre aussi des données de plus haut niveau (auteurs, institutions, laboratoires) et les place dans la même carte. Il génére aussi automatiquement un clustering de thématiques afin de nommer des régions.En donnant une vue d’ensemble, les institutionnels, les industriels ou les scientifiques l’utilisent pour des recherches d’interlocuteurs, d’experts ou des identifications de couvertures thématiques.

InnovationsFonctionalités- Un workflow dynamique basé sur des API requétables pour l'extraction des données ;- Les points projetés sont de natures différentes ;- La classification utilisée (clusters) est dynamique ;- Le pipe-line d'analyse de données (python) est conçu pour être transposable à d'autres corpus ;- La partie visualisation est adaptable à d'autres résultats d'analyse.

- La carte est zoomable ;- Des interactions visuelles nombreuses : hover, clic, filtres...- Un moteur de recherche sur les termes exacts ou sur la similarité de sacs de mots ;- Un clustering sémantique automatique ;- La superposition de sous-groupes dans la carte.

Scikitlearn(or doc2vec)

LSA (or LDA)

Direct,Biased for high scores, Or indirect via articles

UMAP(or LargeViz) kmeans datashader

Mongodb(or elasticsearch)

D3.JS

Le LRIdans la cartede HAL

www.lri.fr

API

Exp

ort