Hotel Online Reviews for Customer Satisfaction’s...
Transcript of Hotel Online Reviews for Customer Satisfaction’s...
![Page 1: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/1.jpg)
Hotel Online Reviews
for Customer
Satisfaction’s Analysis
Asma Ameur
Encadré par :
Mr Dhafer Malouche
Ecole Polytechnique de Tunisie
(EPT)
Unité MASE- Ecole Supérieure
de la Statistique et Analyse de
l’Information
Mr Dhafer Malouche
Colloque CiDE.21:
04- 06- Avril 2019 – Djerba
![Page 2: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/2.jpg)
Introduction généraleContexte du Techniques de Text MiningApplication
Conclusion et perspectivesIntroduction générale
du projetTechniques de Text MiningApplicationConclusion et perspectives
![Page 3: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/3.jpg)
Introduction
généralegénérale
![Page 4: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/4.jpg)
La réputation
Le mot réputation provient du latin « reputatio
considération.
Selon le dictionnaire Larousse : « Opinion favorable
quelque chose », « manière dont quelqu’un,
public »public »
La réputation
reputatio » qui veut dire réflexion, examen ou
favorable ou défavorable attachée à quelqu'un ou à
quelqu’un, quelque chose est connu, considéré dans un
![Page 5: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/5.jpg)
Réputation vers
Avec internet, les réseaux sociaux, les téléphones
pour s’installer sur la toile.
La réputation est peu contrôlable à l’ère du Web
Réputation vers E-réputation
téléphones portables, la réputation sort du monde réel
Web et des médias sociaux.
![Page 6: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/6.jpg)
E-réputation
E-réputation = réputation numérique
C’est l’image que les internautes se font
établissement touristique à partir de ce qu’ils lisent
E-réputation multiplie les informations, leurs canaux
sources et leurs producteurs.
Une accélération de la distribution des commentaires
et d'espace.
réputation
réputation numérique
font d’une marque, d’un
/ écrivent sur Internet.
canaux de diffusion, leurs
commentaires en termes de temps
![Page 7: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/7.jpg)
Contexte
du projetdu projet
![Page 8: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/8.jpg)
E-réputation dans le domaine hôtelierréputation dans le domaine hôtelier
![Page 9: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/9.jpg)
Importance de l’e-réputation
Pouvoir différencier
d’un hôtel et son positionnement
le secteur hôtelier.
Pour le marketing de l’hôtel:
permet l’hôtelier de connaitre l’image
de son hôtel dans le marché.
Pour l’internaute: Permet
d’exprimer son opinion et
d’obtenir une idée sur les avis
des autres internautes envers un
hôtel.
de son hôtel dans le marché.
réputation d’un hôtel
différencier les concurrents
positionnement dans
Permet de « contrôler » et de gérer
son e-réputation et donc d’éviter
de se retrouver avec une mauvaise
réputation
Optimiser la gestion d’image de
l’hôtel sur Internet: Il suffit d’un
client insatisfait pour que toute la
planète, ou presque, le sache.
réputation
![Page 10: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/10.jpg)
Sites d’opinions en hôtellerie
Tripadvisor Expedia
Booking.
com Trivago
Sites d’opinions en hôtellerie
Trivago
TripAdvisor est devenu la référence pour les
voyageurs: 460 millions de visiteurs par mois
![Page 11: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/11.jpg)
ProblématiqueProblématique
Comment peut on évaluer ce que disent
les internautes et mesurer leurs
satisfactions envers un hôtel?
Comment peut on déterminer la position
d’un hôtel dans le marché à partir les
commentaires des internautes?
![Page 12: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/12.jpg)
Techniques
deText Mining deText Mining
![Page 13: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/13.jpg)
Données non structurées
Irrégulières
Structure très complexe
et non standard
sont d’ordre textuel
Données non structurées
![Page 14: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/14.jpg)
Data Mining et
Données structurées et simples
Analyse des données numériques et catégoriques
Data Mining
Text Mining = Etude statistique des données textuelles
C’est l’ensemble
des Technologies
et méthodes:
*...destinées au traitement automatique des
*…en vue d’en structurer et analyser ce contenu
*…dans une perspective de découverte
alors de prise automatique de décision
Data Mining et Text Mining
Analyse des données numériques et catégoriques
Etude statistique des données textuelles
*...destinées au traitement automatique des données textuelles
*…en vue d’en structurer et analyser ce contenu
découverte d’informations cachées et
décision
![Page 15: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/15.jpg)
Opinion Mining
Un sous-domaine de la fouille
Permet d’analyser les textesliées aux opinions et aux sentiments
Opinion
Mining
Opinion Mining
fouille de textes (Text Mining)
textes afin d’en extraire des informationssentiments.
![Page 16: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/16.jpg)
: Bag of
S Une technique permettant d’extraire l'information
Un processus de « tokenization »: découpage
mots/( plus particulièrement aux mots.) Méthode
11 - Récupérer les mots (tokens) presents
3 - Les mots
2 - Ces mots permettent
4
: Bag of Words (Bow)
Sl'information du texte pour une modélisation statistique
découpage d’un flux de caractère en phrases, symboles,
Méthode sac de mots
(tokens) presents dans le document
Les mots deviennent des descripteurs
permettent de constituer le dictionnaire
- Associer l’absence ou la presence des
mots à chaque document: Cela peut etre
aussi le nombre d’apparition (pondération)
![Page 17: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/17.jpg)
: Support
Support Vector Machine (SVM) est un algorithme
L’objectif de SVM est de trouver un classificateur
les données en maximisant la marge entre les
Le classificateur linéaire est appelé hyperplan
: Support Vector Machine
algorithme d’apprentissage automatique supervisé.
classificateur (une frontière de décision ) pour séparer
les classes.
hyperplan. Il permet de séparer l’espace en deux régions.
![Page 18: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/18.jpg)
ApplicationApplication
![Page 19: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/19.jpg)
Présentation du logiciel R
Un logiciel de développement scientifique spécialisé
Un langage de programmation et de traitement
Gratuit et libre (open source)
Performant pour la manipulation des données
Très puissant et multiplateforme (Linux, Mac, Très puissant et multiplateforme (Linux, Mac,
Riche en modules statistiques et de procédures
rvest: Outil facile de
tm: Un framework
openNLP: Collection d'outils de traitement du langage naturel
ggplot2 : Système de création de graphiques
Packages
utilisés
Présentation du logiciel R
spécialisé dans le calcul et l’analyse statistique
traitement de données qui est de plus en plus répandu
données, le calcul et l’affichage des graphiques.
Mac, Windows)Mac, Windows)
procédures d’analyse
: Outil facile de scraping
framework pour les applications de text mining
: Collection d'outils de traitement du langage naturel
ggplot2 : Système de création de graphiques
![Page 20: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/20.jpg)
Extraction des données avec Extraction des données avec TripAdvisor
Hôtels à Hammamet
![Page 21: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/21.jpg)
Prétraitement des données
Nettoyage
!!!!!!
Corpus
non
nettoyé
Prétraitement des données
Données
Hétérogènes
!!!!
![Page 22: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/22.jpg)
Supprimer tous les symboles inutiles
Supprimer les mots vides (stopwords
Supprimer tous les symboles inutiles
Réduire les caractères blancs à un seul
Supprimer les nombres
Indexer les termes du corpus avec l’utilisation
du Document Terme Matrice (DTM)
stopwords)
Réduire les caractères blancs à un seul
Indexer les termes du corpus avec l’utilisation
du Document Terme Matrice (DTM)
![Page 23: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/23.jpg)
DTM et fréquences des mots
• C’est une matriceMathématique qui décrit lafréquence des termesexistants dans le corpus.
DTM = Document
Terme Matrice
DTM et fréquences des mots
matricela
termes
![Page 24: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/24.jpg)
Visualisations graphiques
Nuage de mots
Score lexical
Une façon simple de présenter les idées en
utilisant DTM
Visualisation graphique du contenu des
documents avec une graduation de
couleurs et une différenciation de
polices
Visualisations graphiques
Co-occurrence
Présenter les associations entre
deux unités linguistiques.
Mettre en valeur le présence
simultané de deux ou de
plusieurs mots dans le même
contexte.
![Page 25: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/25.jpg)
Nuages
des mots
![Page 26: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/26.jpg)
Co-occurrence
![Page 27: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/27.jpg)
Méthodologie du score de satisfactionMéthodologie du score de satisfaction
![Page 28: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/28.jpg)
Calcul du score avec la méthode Bow
Considerer le corpus comme
Découper le corpus en mots
Construire un dictionnaire lexical
Vérifier si le matching entre les termes et le dictionnaire
est vrai
Tenir compte du nombre d'occurrence de chaque mot
Calculer le score pour chaque hôtel
Calcul du score avec la méthode Bow
un “ sac de mots”!!
mots
Construire un dictionnaire lexical
entre les termes et le dictionnaire
est vrai
Tenir compte du nombre d'occurrence de chaque mot
Calculer le score pour chaque hôtel
![Page 29: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/29.jpg)
Les résultats du BowLes résultats du Bow
![Page 30: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/30.jpg)
Calcul du score avec la méthode SVMCalcul du score avec la méthode SVM
![Page 31: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/31.jpg)
Les résultats de SVMLes résultats de SVM
![Page 32: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/32.jpg)
Validation du modèle
Indicateurs
La phase de validation est une étape primordiale
En s’appuyant sur la matrice de confusion
réelles avec celles prédites, on a calculé ces
Taux de bon classement
Rappel
Précision
Validation du modèle
Pour la base test
primordiale pour déterminer la qualité d’un modèle.
confusion qui permet de confronter les valeurs
ces indicateurs suivants:
81%
75%
79%
77%
![Page 33: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/33.jpg)
Conclusion
Ce travail sert à:
Présenter l’importance de l’e-réputation
Fournir une introduction pour certains
textuelle des commentaires des internautestextuelle des commentaires des internautes
Mettre en place un outil d’aide à
satisfaction des internautes envers un
Conclusion
réputation dans le domaine hôtelier.
certains techniques utilisées pour une analyse
internautes.internautes.
à la décision permettant de comparer la
un hôtel donné.
![Page 34: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/34.jpg)
Perspectives
Evaluer les commentaires des internautes
Elargir le volume des données exploités
Exploiter d’autres techniques d’Opinion Mining Exploiter d’autres techniques d’Opinion Mining
Modéliser les commentaires filtrés par type de clientèle
Traduire les émoticons des sentiments
Perspectives
internautes pour plusieurs languages
exploités: différents zones géographiques d'hôtel
techniques d’Opinion Mining et comparer les résultatstechniques d’Opinion Mining et comparer les résultats
filtrés par type de clientèle
les émoticons des sentiments au sein des commentaires en un score
![Page 35: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/35.jpg)
Merci pour votre
attentionattention
![Page 36: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/36.jpg)
![Page 37: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/37.jpg)
![Page 38: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/38.jpg)
![Page 39: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/39.jpg)
Observation en ligne d'hôtels pour
l’analyse de la satisfaction de la
clientèle
Asma Ameur
Encadré par :
Ecole Polytechnique de Tunisie
(EPT)
Unité MASE- Ecole Supérieure
de la Statistique et Analyse de
l’Information
Mr Dhafer Malouche
Colloque CiDE.21:
04- 06- Avril 2019 – Djerba
![Page 40: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/40.jpg)
Hotel Online Reviews for
Customer Satisfaction’s
Analysis
Asma Ameur
Colloque CiDE.21:
04- 06- Avril 2019 – Djerba
Asma Ameur
Ecole Polytechnique de Tunisie
(EPT)
Unité MASE- Ecole Supérieure
de la Statistique et Analyse de
l’Information
Encadré par :
Mr Dhafer Malouche
![Page 41: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/41.jpg)
![Page 42: Hotel Online Reviews for Customer Satisfaction’s …europia.org/cide21/wp-content/uploads/2019/04/Asma-Ameur...deText Mining Données non structurées Irrégulières Structure très](https://reader036.fdocuments.in/reader036/viewer/2022081612/5f3736fe644b9a39367d9bd6/html5/thumbnails/42.jpg)