Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 ·...

86
Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ Ανάλυση της αποχώρησης των συνδρομητών μιας τηλεφωνικής εταιρίας με το λογισμικό 8Ρ88 Clementine Ειρήνη Κάλφα Hidden Nodes ΝΟΕΜΒΡΙΟΣ 2012 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ Ιωάννης Γεροντίδης Εκπονηθείσα πτυχιακή εργασία απαραίτητη για την κτήση του βασικού πτυχίου

Transcript of Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 ·...

Page 1: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ

ΤΜΗΜΑΔΙΑΧΕΙΡΙΣΗΣ

ΠΛΗΡΟΦΟΡΙΩΝ

Ανάλυση της αποχώρησης των συνδρομητών μιας τηλεφωνικής εταιρίας με το λογισμικό 8Ρ88 Clementine

Ειρήνη Κάλφα

H id d e nN odes

ΝΟΕΜΒΡΙΟΣ 2012

ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ Ιωάννης Γεροντίδης

Εκπονηθείσα πτυχιακή εργασία απαραίτητη για την κτήση του βασικού πτυχίου

Page 2: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Πρόλογος

Οι εταιρείες παγκοσμίως αντιμετωπίζουν μία πρόκληση, την απώλεια ενός μεγάλου όγκου των πελατών τους. Το πρόβλημα αυτό πρέπει να αντιμετωπιστεί προκειμένου να επιβιώσουν σε ένα όλο και πιο ανταγωνιστικό περιβάλλον. Γ ι’αυτό το λόγο όλο και περισσότερες επιχειρήσεις στρέφονται στην ανάλυση αποχώρησης των συνδρομητών με σκοπό να διατηρήσουν και να αυξήσουν τα κέρδη τους έχοντας βελτιώσει και ενισχύσει τη σχέση τους με τους πελάτες. Η παρούσα πτυχιακή εργασία αφορά την ανάλυση αποχώρησης των συνδρομητών μιας τηλεπικοινωνιακής εταιρίας με τη χρήση του λογισμικούβΡββ Clementine.

Αναλυτικότερα το πρώτο κεφάλαιο της εργασίας αναφέρεται σε θεωρητικούς ορισμούς για το πώς ορίζεται η απώλεια πελατών, τις αιτίες που προκαλούν την απώλεια των πελατών και ποιοί παράγοντες είναι αυτοί που επηρεάζουν τους συνδρομητές.

Έπειτα στο δεύτερο κεφάλαιο περιγράφεται η εξόρυξη δεδομένων και η ανάλυση αποχώρησης των πελατών. Όπου αναφέρονται τα πρότυπα εξόρυξης δεδομένων, οι τύποι των δεδομένων που χρησιμοποιούνται για μία έρευνα σε έναν τηλεπικοινωνιακό όμιλο καθώς και εφαρμογές εξόρυξης δεδομένων.

Στο τρίτο κεφάλαιο γίνεται αναφορά στα Συστήματα Διαχείρισης Σχέσεων Πελατών (CRM). Αυτές οι πρακτικές marketing βασίζονται στη χρήση τεχνικών εξόρυξης δεδομένων για να εντοπίσουν εκείνους τους πελάτες οι οποίοι είναι πιθανό να σταματήσουν να χρησιμοποιούν τις υπηρεσίες της εταιρίας και έχουν ως σκοπό να προβλέπουν τις μελλοντικές απώλειες.

Στη συνέχεια στο τέταρτο κεφάλαιο γίνεται λόγος για τα Νευρωνικά Δίκτυα όπου ξεκινάει μία ιστορική αναδρομή για το πώς ξεκίνησαν και ποιές ήταν οι πρώτες εφαρμογές, για να καταλήξει στο σήμερα, πώς αυτά χρησιμοποιούνται στη στατιστική ανάλυση και πως αποτελούν μία από τις μεθόδους μοντελοποίησης.

Στο τέλος αυτής της εργασίας χρησιμοποιείται το λογισμικό SPSS Clementineόπου μετά από μία περιγραφή στο γραφικό περιβάλλον του λογισμικού και αναφορά στους λόγους τους οποίους έκαναν να δημιουργηθεί αυτό το λογισμικό πραγματοποιείται μία έρευνα με πραγματικά δεδομένα μιας τηλεπικοινωνιακής εταιρίας όπου γίνεται ανάλυση των δεδομένων με τη χρήση των εργαλείων του Clementines στο τέλος παρατίθενται τα αποτελέσματα.

Κάλφα Ειρήνη

Νοέμβριος 2012

Σελ. 1 από 85

Page 3: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Περιεχόμενα

Κεφάλαιο 1 - Αποχώρηση-Απώλεια Πελατών από τον κλάδο των Τηλεπικοινωνιών

1.1 Ορισμός της απώλειας πελατών..........................................................................51.2 Προσέγγιση απώλειας πελατών....................................................................... 61.2.1 Διαχείριση απώλειας πελατών........................................................................ 71.2.2 Πρόβλεψη για ενδεχόμενη αποχώρηση............................................................8

1.2.3 Αιτίες απώλειας πελατών.................................................................................101.2.4 Διατήρηση πελατών........................................................................................121.2.5 Αξιολόγηση πελατών μιας επιχείρησης............................................................141.3 Τα αίτια της αποχώρησης ενός συνδρομητή.................................................... 161.3.1 Διαχωρισμός πελατών με βάση τη συμπεριφορά...............................................161.3.1.1 Αφοσιωμένοι πελάτες.................................................................................... 171.3.1.2 Χαμένοι πελάτες........................................................................................... 181.3.2 Παράγοντες απώλειας πελατών...................................................................... 201.3.2.1 Δυσαρέσκειαπελατών.................................................................................. 211.3.2.2 Κόστος αλλαγής εταιρίας...........................................................................22

1.3.2.3 Χρήση υπηρεσιών........................................................................................22

Κεφάλαιο 2 - Εξόρυξη Δεδομένων και Ανάλυση Αποχώρησης

2.1 Τι είναι εξόρυξη δεδομένων................................................................................ 232.1.1 Είσοδος και έξοδος συστήματος εξόρυξης δεδομένων..................................... 242.1.2 Τ αξινόμηση των συστημάτων εξόρυξης δεδομένων.......................................252.1.3 Πρότυπα εξόρυξης δεδομένων.........................................................................262.2 Εξόρυξη δεδομένων στις τηλεπικοινωνίες......................................................... 272.2.1 Τ ύποι δεδομένων τηλεπικοινωνιών.................................................................. 282.2.1.1 Δεδομένα ανάλυσης κλήσεων........................................................................302.2.1.2 Δεδομένα δικτύου..........................................................................................312.2.1.3 Δεδομένα πελατών........................................................................................322.2.2 Εφαρμογές εξόρυξης δεδομένων.......................................................................322.2.2.1 Μβ^θΐι^τηλεπικοινωνιών............................................................................322.2.2.2 Εντοπισμός απάτης....................................................................................... 332.2.2.3 Σφάλμα δικτύου, απομόνωση και πρόβλεψη................................................34

Σελ. 2 από 85

Page 4: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 3 - Διαχείριση πελατειακών σχέσεων (CRM)

3.1 Εισαγωγή............................................................................................................363.2 Στρατηγική σημασία του CRM........................................................................... 373.2.1 Αναγκαιότητα του CRM................................................................................... 373.2.2 Οφέλη του CRM..............................................................................................383.2.3 Παράγοντες επιτυχίας του CRM......................................................................383.2.4 Αίτια αποτυχίας του συστήματος......................................................................393.2.5 Η σημασία του CRMστον κλάδο των τηλεπικοινωνιών.................................... 393.3 Μελέτες περιπτώσεων Ελληνικών εταιρειών τηλεφωνίας................................... 403.3.1 Ο.Τ.Ε...............................................................................................................413.3.2 QTelecom....................................................................................................... 423.3.2.1 Αποτύπωση της κατάστασης πριν την εφαρμογή CRM................................ 423.3.2.2 Το όραμα της εταιρίας για το CRM .............................................................. 423.3.2.3 Αποτελέσματα μετά την εφαρμογή του CRM.................................................433.3.3 Wind................................................................................................................433.3.3.1 Αποτύπωση της κατάστασης πριν την εφαρμογή CRM................................ 433.3.3.2 Το όραμα της εταιρίας για το CRM............................................................... 433.3.3.3 Αποτελέσματα μετά την εφαρμογή CRM...................................................... 44

Κεφάλαιο 4 - Νευρωνικά Δίκτυα

4.1 Εισαγωγή........................................................................................................... 454.2 Ιστορική αναδρομή............................................................................................. 454.2.1 Πως ξεκίνησαν................................................................................................. 454.2.2 Πρώτες εφαρμογές.......................................................................................... 474.3 Τι είναι τα νευρωνικά δίκτυα.................................................................................494.3.1 Βιολογικά νευρωνικά δίκτυα............................................................................. 51

Η δομή του νευρώνα....................................................................................... 52Η λειτουργία των νευρώνων............................................................................. 54

4.3.2 Τεχνητά νευρωνικά δίκτυα............................................................................... 54Ένα απλό νευρωνικό δίκτυο............................................................................56Το μοντέλο του τεχνητού νευρώνα...................................................................57Η μετάδοση του σήματος μέσα στο νευρωνικό δίκτυο..................................... 57Εκπαίδευση νευρωνικού δικτύου......................................................................58

4.3.3 Σύγκριση βιολογικών και τεχνητών νευρωνικών δικτύων.................................594.4 Τοπολογίες Νευρωνικών Δικτύων.....................................................................614.4.1 Επίπεδα Νευρωνικού Δικτύου...........................................................................61

Σελ. 3 από 85

Page 5: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 5 - Εισαγωγή στο λογισμικό SPSSClementine

5.1 Εισαγωγή στο ΟΙθπθπϊΙπθ...................................................................................645.1.1 Ιστορική αναδρομή...........................................................................................655.1.2 Βασικά χαρακτηριστικά.................................................................................... 655.1.3 Γ ραφικό περιβάλλον.........................................................................................675.2 Βασικές λειτουργείες........................................................................................... 715.2.1 Κόμβοι εισόδου................................................................................................715.2.2 Κόμβοι διαχείρισης εγγραφών......................................................................... 725.2.3 Κόμβοι εξόδου................................................................................................. 725.3 Ανάλυση πελατών αποχώρησης με το βΡββ...................................................... 735.4 Σχέση ποιότητας και ανάλυση κερδοφορίας........................................................ 745.5 Παράδειγμα εφαρμογής...................................................................................... 75

Κατανόηση δεδομένων....................................................................................... 75Προετοιμασία δεδομένων....................................................................................76Μοντελοποίηση...................................................................................................77Ανάπτυξη........................................................................................................... 82Συμπεράσματα................................................................................................... 82

5.6 Μελλοντικές τάσεις............................................................................................. 83

Βιβλιογραφία........................................................................................................... 84

Σελ. 4 από 85

Page 6: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 1

Αποχώρηση-Απώλεια από τον κλάδο των Τηλεπικοινωνιών

1.1 Ορισμός της απώλειας πελατών

Η απώλεια πελατών (customer churn) ορίζεται ως η κλίση των πελατών να

διακόπτουν τις σχέσεις και συναλλαγές τους με μία εταιρία σε κάποια χρονική

περίοδο και αποτελεί μία από τις κύριες προκλήσεις που οι επιχειρήσεις σήμερα

καλούνται να αντιμετωπίσουν. Η αποχώρηση είναι ένα συνηθισμένο φαινόμενο που

συμβαίνει στην βιομηχανία των τηλεπικοινωνιών. Είναι εκείνοι οι πελάτες που θα

αφήσουν την εταιρία στο εγγύς μέλλον. Αν είμαστε σε θέση να προβλέψουμε εκ των

προτέρων, τα χαρακτηριστικά των πελατών τους οποίους πρόκειται να χάσουμε στο

εγγύς μέλλον μπορεί κανείς να λάβει διορθωτικά μέτρα, ώστε να μπορούμε να

ελαχιστοποιήσουμε αυτό το φαινόμενο. Στην παροχή υπηρεσιών διαδικτύου, τα

ετήσια ποσοστά απώλειας πελατών κυμαίνονται από 21% έως και 63.2%. Στην

ασύρματη τηλεφωνία, τα αντίστοιχα ποσοστά κυμαίνονται από 23.4% έως 46%

(Telephony Online, 2002). Τα ποσοστά αυτά μπορεί να ποικίλουν ανάλογα με την

εταιρία και τον κλάδο, αλλά όλες όμως οι επιχειρήσεις αυτές χάνουν τουλάχιστον ένα

τέταρτο από τους πελάτες τους από τον ένα χρόνο στον άλλο λόγω αυτού του

φαινομένου.

Καθώς η βιομηχανία ωριμάζει, ο ρυθμός κίνησης αυξάνεται και θα υπάρξει πιθανώς

μια στιγμή για κάθε πελάτη στην οποία θα σκεφτεί και θα πραγματοποιήσει την

αποχώρηση. Στα πλαίσια αυτά συνεπώς, και λόγω του έντονου ανταγωνισμού που

παρουσιάζει, ο χώρος των τηλεπικοινωνιών αντιμετωπίζει σε μεγάλο εύρος το

συγκεκριμένο φαινόμενο. Ο κλάδος παρουσιάζει δυναμικό χαρακτήρα, με καινούριες

υπηρεσίες, αναδυόμενες τεχνολογίες, και νέες εταιρίες οι οποίες συνεχώς αλλάζουν

το επιχειρηματικό τοπίο. Οι επιχειρήσεις, προκειμένου να υπερτερούν έναντι των

ανταγωνιστών τους, κάνουν προσφορές στους πελάτες σε εβδομαδιαία βάση,

ελπίζοντας να κρατήσουν τους ήδη υπάρχοντες και να δελεάσουν νέους

συνδρομητές.

Η ωρίμανση της αγοράς και η αύξηση του ανταγωνισμού θέλουν τις εταιρείες να

επικεντρώνονται στους υφιστάμενους πελάτες τους και στο πώς θα τους κρατήσουν

για να καταστούν πιο κερδοφόρες. Όπως γνωρίζουμε η απόκτηση ενός νέου πελάτη

είναι πιο ακριβή από ό,τι η διατήρηση ενός ήδη υφιστάμενου συνδρομητή. Στην

πραγματικότητα κοστίζει από 6 έως 10 φορές περισσότερο το να αποκτήσεις έναν

Σελ. 5 από 85

Page 7: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

νέο πελάτη. Ο έλεγχος της απώλειας πελατών αποτελεί σημαντικό παράγοντα στις

τηλεπικοινωνιακές επιχειρήσεις.

Για καλύτερη κατανόηση του προβλήματος, ας ληφθεί υπόψη ότι το μηνιαίο ποσοστό

απώλειας πελατών σε έναν τηλεπικοινωνιακό πάροχο στην Ευρώπη ή την Βόρεια

Αμερική το 1998 ήταν στα επίπεδα του 2-3% της πελατειακής βάσης της εταιρίας.

Λαμβάνοντας υπόψη ότι το μέσο κόστος απόκτησης ενός νέου πελάτη ήταν περίπου

$400, η απώλεια πελατών κόστιζε στη βιομηχανία σχεδόν $6.3 δισεκατομμύρια.

Επιπλέον, η συνολική ετήσια απώλεια έφτανε τα $9.6 δισεκατομμύρια λαμβάνοντας

υπόψη τα χαμένα μηνιαία έσοδα από τις ακυρώσεις των συνδρομητών και αυτό 14

χρόνια πριν, όταν τα επίπεδα του ανταγωνισμού στην αγορά ήταν πολύ χαμηλότερα.

Σήμερα, είναι γνωστό στον τομέα του μάρκετινγκ ότι κοστίζει περίπου 5 φορές

περισσότερο σε μία εταιρία να κερδίσει ένα νέο πελάτη, από το να διατηρήσει έναν

ήδη υπάρχοντα . Επιπλέον, έχει αποδειχτεί ότι, αν μία εταιρία δεν αποκτήσει νέους

πελάτες, ο μέσος χρόνος ζωής ενός ήδη υπάρχοντος πελάτη ισούται με 1/c, όπου c

το ετήσιο ποσοστό απώλειας πελατών. Για μία εταιρία με 25% ποσοστό, ο μέσος

χρόνος ζωής ενός πελάτη είναι 4 χρόνια, ενώ για μία εταιρία με 50% ποσοστό

απώλειας πελατών, ο μέσος χρόνος ζωής ενός πελάτη είναι 2 χρόνια. Είναι φανερή

λοιπόν η σημαντικότητα της διαχείρισης απώλειας πελατών (churn management)

προκειμένου οι επιχειρήσεις να σταθεροποιήσουν τη θέση τους στην αγορά και να

διατηρήσουν ή και να αυξήσουν την αποδοτικότητα και κερδοφορία τους.

1.2 Προσέγγιση απώλειας πελατών

Από την οπτική του τμήματος μάρκετινγκ μιας επιχείρησης, υπάρχουν δύο βασικές

προσεγγίσεις στη διαχείριση της απώλειας πελατών (churn management), οι

στοχευμένες (targeted) και οι μη στοχευμένες (untargeted) προσεγγίσεις. Οι μη

στοχευμένες προσεγγίσεις βασίζονται στη μαζική διαφήμιση για να αυξήσουν την

αφοσίωση στη μάρκα και να διατηρήσουν τους ήδη υφιστάμενους πελάτες. Οι

στοχευμένες προσεγγίσεις βασίζονται στην αναγνώριση πελατών οι οποίοι είναι

πιθανότερο να αποχωρήσουν από την επιχείρηση, και μετά είτε τους παρέχεται ένα

άμεσο κίνητρο, είτε προσαρμόζεται στα μέτρα τους ένα πλάνο εξυπηρέτησης

προκειμένου να αποφευχθεί η φυγή τους. Επιπλέον, υπάρχουν δύο είδη

στοχευμένων προσεγγίσεων: reactive και proactive.

Σελ. 6 από 85

Page 8: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Με την reactive προσέγγιση, η εταιρία περιμένει μέχρις ότου ο πελάτης

επικοινωνήσει για να διακόψει τη συνδρομή του, και στη συνέχεια του προσφέρει ένα

κίνητρο, π.χ. μία έκπτωση, για να τον πείσει να μείνει.

Με την proactive προσέγγιση, η εταιρία προσπαθεί να εντοπίσει πελάτες οι οποίοι

είναι πιθανό να αφήσουν την επιχείρηση σε μελλοντική χρονική περίοδο. Η εταιρία

στη συνέχεια στοχεύει σε αυτούς τους πελάτες με ειδικά προγράμματα ή προσφορές

για να προλάβει την απώλειά τους. Τα στοχευμένα proactive προγράμματα έχουν το

πλεονέκτημα να διαθέτουν λιγότερο δαπανηρά κίνητρα, αφού τα κίνητρα αυτά δεν

είναι τόσο δραστικά, και άρα δαπανηρά, όσο θα ήταν στην περίπτωση που ο

πελάτης έχει ήδη πάρει την απόφαση να φύγει και άρα θα έπρεπε να δελεαστεί την

τελευταία στιγμή προκειμένου να μείνει. Παρόλα αυτά, τα συγκεκριμένα συστήματα

μπορεί να είναι ανούσια εάν οι προβλέψεις απώλειας πελατών είναι ανακριβείς και

λανθασμένες, επειδή με αυτό τον τρόπο οι εταιρίες θα σπαταλούσαν χρήματα για να

κρατήσουν πελάτες οι οποίοι δεν είχαν σκοπό να εγκαταλείψουν. Συνεπώς, σκοπός

είναι η υψηλή ακρίβεια στην πρόβλεψη της απώλειας πελατών.

1.2.1 Διαχείριση απώλειας πελατών

Μέσα από τις δύο προσεγγίσεις που παρουσιάστηκαν προκύπτουν εύλογοι

προβληματισμοί, οι οποίοι και αποτελούν παραμέτρους που πρέπει να ληφθούν

υπόψη κατά τη διαχείριση απώλειας πελατών: Γνωρίζει τελικά μία εταιρία ότι ένας

πελάτης πρόκειται να την εγκαταλείψει; Αν όχι, μπορεί να μάθει τη στάση που έχουν

οι πελάτες απέναντί της; Είναι όλοι οι πελάτες συμφέρον να διατηρηθούν; Και πώς

μπορεί να διατηρήσει τους πελάτες της;

Πριν απαντηθούν οι προβληματισμοί αυτοί, καλό είναι να γίνει αναφορά σε μία έννοια

που συνδέεται στενά με την απώλεια πελατών και δεν είναι άλλη από την αφοσίωση

των πελατών (customer loyalty). Οι αφοσιωμένοι πελάτες παραμένουν σε μία εταιρία

περισσότερο και εμφανίζουν πρόθεση επαναγοράς υπηρεσιών. Αυτή η συμπεριφορά

οφείλεται στη θετική στάση και επιθυμία τους να συνεχίσουν να έχουν

επιχειρηματικές σχέσεις με μια εταιρία, η οποία κατά συνέπεια αποκτά σημαντικό

πλεονέκτημα στην αύξηση εσόδων. Για να γίνει πιο αντιληπτή η σχέση μεταξύ

Αφοσίωσης και απώλειας πελατών αρκεί να ληφθεί υπόψη ότι ο όρος απώλεια

πελατών περιγράφει τον αριθμό ή ποσοστό των πελατών που σταματούν τις σχέσεις

τους με έναν παροχέα υπηρεσιών, και άρα ισχύει μια σχέση της μορφής:

Σελ. 7 από 85

Page 9: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Αφοσίωση πελατών=1-ποσοστό απώλειας πελατών

Έρευνα που πραγματοποιήθηκε σε πρόσωπα του επιχειρηματικού τομέα το

Δεκέμβριο του 2004, στα πλαίσια της διαδικτυακής κοινότητας επιχειρηματιών

CRMGuru (www.customerthink.com) έδειξε τα παρακάτω αποτελέσματα όσον αφορά

στην έννοια της αφοσίωσης (σχήμα 1): Το 64% των ερωτηθέντων όρισε την

αφοσίωση ως συμπεριφορά πρόθεσης επαναγοράς, το 58% ως συμπεριφορά

καταναλωτών που προτείνουν μια εταιρία σε φίλους και γνωστούς και το 54% ως τη

συναισθηματική δέσμευση του πελάτη σε μία εταιρία. Μόνο το 32% των

ερωτηθέντων όρισε την αφοσίωση ως τη συμπεριφορά του πελάτη εκείνου που

ξοδεύει όλο και περισσότερο μέσα στο χρόνο.

Σχήμα 1: Αποτελέσματα έρευνας για τον ορισμό της αφοσίωσης πελατών (Thompson,

2005)

Η αφοσίωση, όπως χαρακτηρίστηκε από τον Reichheld (1996), είναι μία γεννήτρια κερδών.

1.2.2 Πρόβλεψη για μία ενδεχόμενη αποχώρηση

Στα σημερινά δεδομένα της τόσο ανταγωνιστικής αγοράς δεν είναι εύκολο να γίνει

αντιληπτή η πρόθεση ενός πελάτη να εγκαταλείψει μια εταιρία. Αυτό συμβαίνει

αφενός επειδή μόνο ένα μικρό ποσοστό των πελατών εκφράζει τα παράπονά του.

Σελ. 8 από 85

Page 10: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Μία τυπική για παράδειγμα επιχείρηση ακούει μόνο το 4% των δυσαρεστημένων

πελατών της, ενώ το υπόλοιπο 96% απλά αποχωρεί. Επίσης ο τομέας στον οποίο

ανήκει η επιχείρηση και οι σχέσεις που διατηρεί με τους πελάτες της επηρεάζει το

πως εντοπίζονται οι πελάτες που επιθυμούν να φύγουν. Στην ασύρματη τηλεφωνία,

ένας πελάτης μπορεί να αλλάξει εταιρία και να κρατήσει το ίδιο νούμερο τηλεφώνου,

οπότε σε αυτή την περίπτωση η πρώτη εταιρία θα καταλάβει τι συμβαίνει μόνο τη

στιγμή που ο πελάτης θα αποσυνδέσει το λογαριασμό του.

Για να προβλέψουμε μία πιθανή αποχώρηση πρέπει να υπάρχουν κάποια

απαιτούμενα στοιχεία για την ανάλυση. Οι βασικές απαιτήσεις είναι:

• Στοιχεία από το αρχείο χαρακτηριστικών των πελατών όπως η ηλικία, το φύλο

κλπ.

• Στοιχεία από το αρχείο του λογαριασμού υπηρεσιών, όπως η σύμβαση

τιμολόγησης, τα δεδομένα ενεργοποίησης, ταυτοποίησης της σύμβασης κλπ.

• Τα δεδομένα από το σύστημα τιμολόγησης, όπως ο αριθμός των κλήσεων, ο

χρόνος αναμονής, ο χρόνος σταθερής τηλεφωνίας, το συνολικό ποσό που

δαπανήθηκε, οι κλήσεις που πραγματοποιούνται προς το κέντρο εξυπηρέτησης

πελατών, ενδεχόμενη αλλαγή στο σχέδιο των τιμών κλπ.

Για να αντιμετωπιστεί αυτή η κατάσταση έχουν γίνει πολλές έρευνες εντοπισμού

πράξεων που μπορεί να θεωρηθούν δείκτες. Ενδεικτικά αναφέρεται μία τέτοια έρευνα

(Τήοπρεοπ, 2005) σε 200 εταιρίες για την αφοσίωση πελατών, η οποία κατέληξε

στην ακόλουθη λίστα των 6 δεικτών που δείχνουν ότι ένας πελάτης είναι έτοιμος να

εγκαταλείψει όταν:

• Η αποδοχή των προσφορών από τον πελάτη καθυστερεί.

• Η ροή των δεδομένων του πελάτη επιβραδύνεται.

• Τα μελλοντικά σχέδια γίνονται σταδιακά βραχυπρόθεσμα.

• Ένα ή περισσότερα προϊόντα ή υπηρεσίες διακόπτονται.

• Ο όγκος των συναλλαγών του πελάτη με την εταιρία μειώνεται.

Σελ. 9 από 85

Page 11: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

1.2.3 Αιτίες απώλειας πελατών

Ανεξάρτητα με το μέγεθος μιας εταιρίας, πρέπει να γνωρίζει γιατί οι πελάτες της

μένουν ή αποχωρούν. Αυτή η οπτική προσανατολισμένη στον πελάτη θα διευκολύνει

τη διαχείριση της συμπεριφοράς των πελατών κατά τρόπο ώστε τελικά να

δημιουργηθεί μια στρατηγική αφοσίωσης που θα αποφέρει κέρδη. Εδώ παρατίθενται

ορισμένοι οδηγοί αφοσίωσης, δηλαδή παράγοντες που έχουν μεγάλη συσχέτιση με

τη συμπεριφορά αφοσίωσης, οι οποίο σκοπό έχουν να δείξουν που μπορεί να

οφείλεται η τάση απώλειας πελατών (Thompson, 2005):

• Στάση-για την επωνυμία, την ποιότητα και την εστίαση στον πελάτη

• Εικόνα της επωνυμίας-ως ηγέτης βιομηχανίας, αξιόπιστη εταιρία και καινοτόμο

πάροχο

• Εμπειρία πελάτη-με την ποιότητα του προϊόντος, τη διαδικασία αγοράς και την

τεχνική υποστήριξη

Αξίζει να σημειωθεί ότι έρευνες πάνω στο θέμα έδειξαν ότι η τιμή συσχετίζεται με την

αφοσίωση υπό τη μορφή του πως οι πελάτες αντιλαμβάνονται την αξία του

προϊόντος που αγόρασαν ή των υπηρεσιών που χρησιμοποίησαν, δηλαδή υπό τη

μορφή αντιλαμβανόμενης αξίας. Από μόνη της η τιμή ενός προϊόντος ή μιας

υπηρεσίας δε συνεισφέρει στην αφοσίωση του πελάτη (Thompson, 2005).

Εξαιρουμένων των μονοπωλειών, οι σημερινοί πελάτες μπορούν να αποκτήσουν

παρόμοια προϊόντα και υπηρεσίες σε παρόμοιες τιμές, από διάφορους παρόχους,

και στο παρόν σενάριο αγοράς δεν υπάρχουν πολλές διαφοροποιήσεις στις

προσφορές, τις τιμές και τις υπηρεσίες που προσφέρονται λόγω του ισχυρού

ανταγωνισμού. Συνεπώς οι υπηρεσίες εξυπηρέτησης πελατών και οι υπηρεσίες

προστιθέμενης αξίας (value-added) λαμβάνουν μεγάλη σημασία στην αντίληψη του

πελάτη. Αν μια επιχείρηση δεν προβλέπει αγοραστικές ανάγκες ή δεν παρέχει

υπηρεσίες προστιθέμενης αξίας, οι οποίες όμως προσφέρονται από ανταγωνιστές,

τότε ο πελάτης είναι πολύ πιθανό να προτιμήσει μια ανταγωνιστική εταιρία. Με βάση

την παρούσα κατάσταση της αγοράς λοιπόν, έχει αποδειχτεί ότι το συναίσθημα είναι

αυτό που διαδραματίζει ρόλο μεγαλύτερο ακόμα και από την τιμή ή την ποιότητα

στην απόφαση διακοπής σχέσεων με μία εταιρία και η φτωχή εξυπηρέτηση πελατών

είναι ο κύριος ένοχος για τη δημιουργία αρνητικών συναισθημάτων. Πρακτικά, οι

περισσότεροι άνθρωποι φεύγουν από μία εταιρία επειδή νιώθουν ότι δεν τους έχουν

συμπεριφερθεί σωστά, σύμφωνα με τον Thompson (2005), η διοίκηση όμως

Σελ. 10 από 85

Page 12: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

συνήθως πιστεύει ότι ο λόγος που φεύγουν είναι η τιμή (και φυσικά αυτό αληθεύει σε

κάποιες περιπτώσεις).

Έρευνα που πραγματοποιήθηκε το Νοέμβριο του 2004, στα πλαίσια της

διαδικτυακής κοινότητας επιχειρηματιών CRMGuru (www.customerthink.com) έδειξε

(σχήμα 2): Από τους ερωτηθέντες πελάτες που δήλωσαν ότι σταμάτησαν να

χρησιμοποιούν ένα προϊόν/υπηρεσία, το 74% έδωσε την εξυπηρέτηση πελατών ως

το σημαντικότερο παράγοντα για αυτή την απόφαση. Το δεύτερο πιο συχνό

πρόβλημα ήταν η ποιότητα που επιλέχτηκε από το 32% των ερωτηθέντων, και το 25%

δήλωσε ως λόγο την τιμή. Η λειτουργικότητα του προϊόντος/υπηρεσίας επιλέχτηκε ως

σημαντικός παράγοντας από το 14% των ερωτηθέντων. Η αντίστοιχη έρευνα που

έγινε σε διευθυντικά στελέχη επιχειρήσεων έδειξε ένα σημαντικό χάσμα. Τα ανώτερα

στελέχη έδωσαν την τιμή ως τον πιο κρίσιμο παράγοντα στην απώλεια πελατών με

49%, ακολουθεί η αλλαγή των αναγκών του πελάτη με 36% και η εξυπηρέτηση

πελατών επιλέχτηκε μόλις από το 22% των ερωτηθέντων.

Σχήμα 2: Αποτελέσματα έρευνας για τους λόγους απώλειας πελατών (Thompson, 2005)

Η ανακάλυψη του προβλήματος μπορεί να είναι δύσκολη, και εδώ βοηθούν οι έρευνες και οι αναλύσεις. Αλλά δεν είναι δυνατόν πάντα να γίνονται έρευνες στους πελάτες, και αν γίνεται αυτό, μερικές φορές είναι πολύ αργά. Εδώ εισάγεται η έννοια του marketing analytics, διαδικασία η οποία δίνει μία ακριβή εικόνα της πελατειακής βάσης, και επιτρέπει την εκτίμηση της παρελθοντικής, παρούσας, και μελλοντικής αξίας των πελατών, ενώ είναι μία cost-effective επένδυση για μεσαίες και μεγάλες

Σελ. 11 από 85

Page 13: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

επιχειρήσεις όπως και οι αλγόριθμοι εξόρυξης δεδομένων όπου θα γίνει εκτενέστερη παρουσίαση παρακάτω.

1.2.4 Διατήρηση πελατών

Την τελευταία δεκαετία, πολλές εταιρίες θεωρούν τη διατήρηση των υφιστάμενων

πελατών τους ως κεντρικό θέμα στις αποφάσεις μάνατζμεντ που παίρνουν. Η

έμφαση στη διατήρηση βασίζεται στην υπόθεση ότι υπάρχει μεγάλη σχέση μεταξύ

αυτής και της αποδοτικότητας: οι μακροχρόνιοι πελάτες αγοράζουν περισσότερο και

είναι λιγότερο δαπανηρό να εξυπηρετηθούν, ενώ η αντικατάσταση υφιστάμενων

πελατών από νέους είναι πιο ακριβή και ριψοκίνδυνη στρατηγική, αφού είναι εύκολο

να υποτεθεί ότι οι νέοι αυτοί πελάτες είναι πιο επιρρεπείς στο να συνεχίσουν την

συμπεριφορά μετακίνησής τους στο κοντινό μέλλον, και άρα χαρακτηρίζονται από

υψηλή πιθανότητα απώλειας.

Σχήμα 3: Πλαίσιο για τη διατήρηση πελατών και τη μεγιστοποίηση αποδοτικότητας(ΜοζβΓ βίβί. 2000)

Όπως φαίνεται στο σχήμα 3, η πρόβλεψη της απώλειας πελατών (churn prediction),

δηλαδή η εκτίμηση της πιθανότητας που έχει ένας πελάτης να φύγει από μια εταιρία,

είναι τμήμα του πλαισίου απόφασης για τη διατήρηση των πελατών και τη

μεγιστοποίηση του κέρδους. Τα δεδομένα μπορούν επίσης να βοηθήσουν στην

Σελ. 12 από 85

Page 14: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

ανάλυση των αιτιών για τους οποίους οι πελάτες αλλάζουν επιχειρήσεις, των κερδών

που πραγματοποιούνται σε μία χρονική περίοδο, και της ανταπόκρισης σε μία

προσφορά μάρκετινγκ. Οι επιχειρήσεις μπορούν να χρησιμοποιούν αυτούς τους

πιθανολογικούς υπολογισμούς και τις εκτιμήσεις εσόδων για να καθορίζουν τη

στρατηγική αντιμετώπισης της απώλειας πελατών και τη στρατηγική μεγιστοποίησης

των κερδών, στα πλαίσια ενός συστήματος διαχείρισης σχέσεων πελατών.

Η πρόβλεψη απώλειας πελατών χρησιμοποιεί τεχνικές εξόρυξης δεδομένων (data

mining) προκειμένου να ερευνήσει τις βάσεις δεδομένων μιας εταιρίας με σκοπό την

ανακάλυψη προηγουμένως άγνωστης και χρήσιμης γνώσης, όπως ο εντοπισμός

τάσεων και επαναλαμβανόμενων προτύπων, συσχετίσεων μεταξύ στοιχείων κ.α., η

οποία θα βοηθήσει στη λήψη αποφάσεων και θα οδηγήσει σε σημαντικά

επιχειρηματικά οφέλη. Η εξόρυξη δεδομένων χρησιμοποιεί στατιστικές διαδικασίες

και αλγορίθμους μηχανικής εκμάθησης για την κατάρτιση μοντέλων πρόβλεψης της

απώλειας πελατών, όπως τα δέντρα απόφασης (decision trees), η λογιστική

παλινδρόμηση (logistic regression), τα νευρωνικά δίκτυα (neural networks) και οι

μηχανές υποστήριξης διανυσμάτων (support vector machines).

Όταν χρησιμοποιείται μια τεχνική ταξινόμησης οι μεταβλητές εισόδου είναι οι δείκτες

που προέρχονται από τα δεδομένα των συνδρομητών, όπως:

• Ένας αριθμός Id για κάθε σύμβαση

• Ο αριθμός τηλεφώνου

• Το χρονικό διάστημα που είναι ο πελάτης στην εταιρία

• Ενδεχόμενη αλλαγή στην τιμολόγηση προγράμματος

• Χρέωση των κλήσεων

• Συνολική διάρκεια των κλήσεων

• Σύνολο εξόδων λογαριασμού

• Μη πραγματοποιήσιμες εισερχόμενες κλήσεις

• Μη πραγματοποιήσιμες εξερχόμενες κλήσεις

• Κατάσταση (ενεργός / ανενεργός)

Σελ. 13 από 85

Page 15: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Οι μεταβλητές απόφασης ορίζουν την κατάσταση του πελάτη στην περίοδο

πρόβλεψης, «churner» ή «non churner». Με την προϋπόθεση λοιπόν της ύπαρξης

μιας αξιόπιστης βάσης δεδομένων πελατών με αναλυτική και συστηματική

πληροφορία συναλλαγών, οι τεχνολογίες εξόρυξης δεδομένων μπορούν να δώσουν

αποτελεσματικές λύσεις στο πρόβλημα της κατανόησης του πελάτη: μοντέλα που

αξιολογούν (πιστωτικός κίνδυνος), προβλέπουν (πρόβλεψη απώλειας πελατών), ή

ομαδοποιούν πελάτες με χρήση σύνθετων σχημάτων σε ομάδες με υψηλό βαθμό

ομοιογένειας και τη μέγιστη απόσταση μεταξύ τους (clustering, συσταδοποίηση). Η

συστηματική χρήση των τεχνολογιών αυτών μπορεί να οδηγήσει σε σημαντική

γνώση για τους πελάτες, τις συμπεριφορές και τους διάφορους συσχετισμούς τους,

που κατ’ επέκταση εμπλουτίζουν την πελατειακή βάση παρέχοντας έτσι στη διοίκηση

της εταιρίας τη δυνατότητα για άμεση και αποτελεσματική ενημέρωση.

Υπενθυμίζεται ότι απώτερος σκοπός της διαδικασίας είναι η ανάπτυξη της

αποδοτικότητας της επιχείρησης, μέσα από τις προσπάθειες διατήρησης των

πελατών εκείνων που κινδυνεύουν να εγκαταλείψουν, και μέσα από τον περιορισμό

ή και αποφυγή περαιτέρω απωλειών. Στόχος όμως δεν είναι μόνο να γίνει πρόβλεψη

για το αν ένας πελάτης θα φύγει ή όχι από μια επιχείρηση, αλλά να υπολογιστεί η

πιθανότητα απώλειας ενός πελάτη, διαφορετικά θα ήταν δύσκολο για μια εταιρία να

εκμεταλλευτεί τα αποτελέσματα αυτά λόγω περιορισμένων πόρων.

1.2.5 Αξιολόγηση πελατών μιας επιχείρησης

Όταν αποφασίζεται η εφαρμογή μιας στρατηγικής διατήρησης πελατών, πρέπει να

καθοριστεί σε ποιους πελάτες θα πρέπει να δοθεί προσοχή: Ποιοι είναι οι πιο

πολύτιμοι για την εταιρία και θα ήταν πλήγμα να χαθούν; Η ερώτηση αυτή ουσιαστικά

απαντάται μέσα από τη λογική της πρόβλεψης απώλειας πελατών και τη

σημαντικότητα της εκτίμησης πιθανοτήτων. Με την προσεκτική επιλογή των πιο

αξιόλογων πελατών με υψηλό ρίσκο απώλειας, είναι δυνατόν να σχεδιαστούν και να

εκτελεστούν πολύ αποτελεσματικές καμπάνιες διατήρησης (retention campaigns).

Εδώ όμως πρέπει να γίνει αναφορά σε μία ακόμα έννοια που συσχετίζεται με την

απώλεια πελατών, την αξία διάρκειας ζωής του πελάτη (customer lifetime value-

CLV). Η αξία διάρκειας ζωής του πελάτη αντιπροσωπεύει τη συνολική

προσδοκώμενη συνεισφορά του πελάτη στα κέρδη της εταιρίας και βασίζεται σε

κάποια μέτρα: 1) στον προσδοκώμενο χρόνο συνεργασίας του πελάτη με την εταιρία,

Σελ. 14 από 85

Page 16: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

2) τα ανά περίοδο έξοδα (π.χ. μηνιαίως) που πληρώνει ο πελάτης στην εταιρία, 3) τα

ανά περίοδο έξοδα που κάνει η εταιρία προκειμένου να παράσχει στον πελάτη μια

υπηρεσία. Αυτά τα μέτρα συνδυάζονται μαθηματικά για κάθε πελάτη για να

παράγουν έναν αριθμό, ή σκορ αξίας διάρκειας ζωής του πελάτη. Να σημειωθεί ότι η

παράμετρος αυτή δεν είναι μια σταθερή τιμή αλλά μεταβάλλεται με το χρόνο και τη

δυναμικότητα της αγοράς, και επηρεάζεται από τις προσπάθειες μάρκετινγκ που

γίνονται από μια εταιρία. Είναι φανερό ότι το ποσοστό απώλειας πελατών, το οποίο

ορίζεται ως ο αριθμός των συνδρομητών που διακόπτουν τη χρήση μιας υπηρεσίας

διαιρεμένος με το μέσο αριθμό του συνόλου των συνδρομητών εκείνη την περίοδο,

έχει αντίκτυπο στη αξία διάρκειας ζωής του πελάτη επειδή επηρεάζει τη διάρκεια της

υπηρεσίας και τα μελλοντικά έσοδα.

Η εταιρία, μέσα από την καλύτερη κατανόηση της αξίας διάρκειας ζωής του πελάτη

μπορεί να μετρήσει τα τωρινά και τα μελλοντικά έσοδα από τους πελάτες, και να

καλλιεργήσει τη διατήρηση των πελατών και την αφοσίωσή τους που θα οδηγήσουν

σε υψηλότερη κερδοφορία. Γίνεται φανερή λοιπόν η σημαντικότητα της αξιολόγησης

των πελατών μιας επιχείρησης υπό το πρίσμα της αξίας διάρκειας ζωής του πελάτη.

Με το συνδυασμό πρόβλεψης απώλειας πελατών και ανάλυσης αξίας διάρκειας ζωής

του πελάτη μπορούν να σχεδιαστούν οικονομικά αποδοτικές στρατηγικές διατήρησης

πελατών. Αυτό επιτυγχάνεται με την επιλογή κατάλληλων κινήτρων (ατομικά για κάθε

συνδρομητή), ώστε το κόστος αυτών να μην υπερβαίνει το προβλευθέν κέρδος από

τη διατήρηση του πελάτη.

Σελ. 15 από 85

Page 17: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 4: Πλαίσιο διαδικασίας λήψης απόφασης διατήρησης πελατών(http://www.expresscomputeronline.com/20030922/indiatrends01 .shtml)

Η επιλογή των κατάλληλων πελατών μπορεί να γίνει μέσα από μία διαδικασία που

λέγεται τμηματοποίηση πελατών (customer segmentation), η οποία διαχωρίζει μια

πελατειακή βάση δεδομένων σε διακριτά, ουσιώδη, ομογενή γκρουπ βάσει

συγκεκριμένης μεθοδολογίας. Σκοπός της είναι η κατανόηση της πελατειακής βάσης,

και η απόκτηση γνώσης για τους πελάτες που θα βοηθήσει στην υιοθέτηση της

σωστής αντιμετώπισης στο σωστό σύνολο πελατών, τη σωστή στιγμή. Η χρήση της

σε συνδυασμό με άλλες τεχνικές μπορεί να οδηγήσει σε:

• ανταγωνιστικά πλεονεκτήματα μέσα από ευέλικτες, στοχευμένες δράσεις και

στρατηγικές μάρκετινγκ

• ικανοποίηση πελατών και αφοσίωση (Churn management)

• αποδοτική διαχείριση ρίσκου πελατών (Consumer Risk Management)

• αποτελεσματική παρακολούθηση απόδοσης και λήψη αποφάσεων

Σελ. 16 από 85

Page 18: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

1.3 Τα αίτια της αποχώρησης ενός συνδρομητή

Τα ποσοστά απώλειας πελατών (customer churn) είναι σήμερα υψηλότερα από ποτέ,

και οι περισσότερες επιχειρήσεις ψάχνουν τρόπους και διέξοδο από αυτό το

πρόβλημα. Οι επιχειρήσεις δηλώνουν προσηλωμένες στην αφοσίωση των πελατών

τους (customer loyalty), τα συστήματα διοίκησης και οι προϋπολογισμοί τους όμως

δεν φαίνεται να συμβαδίζουν. Σε ένα τοπίο διεθνούς ανταγωνισμού, στο οποίο

υπάρχουν πολλά παρόμοια προϊόντα, ο περιορισμός της απώλειας πελατών και η

οικοδόμηση αφοσίωσης μπορεί να αποδειχθούν σημαντικός μοχλός ανάπτυξης μιας

επιχείρησης.

1.3.1 Διαχωρισμός πελατών με βάση τη συμπεριφορά

Οι πελάτες, πρωταρχικά χωρίζονται σε αφοσιωμένους και μη (πελάτες που έχουν

εγκαταλείψει μία εταιρία), και στη συνέχεια χωρίζονται σε περεταίρω ομάδες με βάση

τη στάση και συμπεριφορά τους (σχήμα 5).

Σελ. 17 από 85

Page 19: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 5: Απώλεια πελατών με βάση τη συμπεριφορά (Kim et al. 2004)

1.3.1.1 Αφοσιωμένοι πελάτες

Συναισθηματικά αφοσιωμένοι πελάτες (emotive customers): οι πελάτες αυτοί

είναι και οι πιο αφοσιωμένοι. Νιώθουν έντονα ότι οι αγορές τους είναι οι σωστές για

εκείνους και ότι το επιλεγμένο προϊόν ή υπηρεσία είναι η καλύτερη επιλογή, ενώ

σπάνια επαναξιολογούν τις αγοραστικές τους αποφάσεις. Αυτά τα συναισθήματα

μπορεί να είναι αντίκτυπος μιας μεγάλης περιόδου καλών αποδόσεων των

προϊόντων/υπηρεσιών που έχει αγοράσει ο πελάτης. Συνήθως οι συναισθηματικοί

πελάτες ξοδεύουν παραπάνω και έχουν χαμηλότερο επίπεδο απώλειας πελατών

από άλλους.

Αφοσιωμένοι πελάτες λόγω αδράνειας (inertial customers): όπως και οι

συναισθηματικά αφοσιωμένοι, αυτοί οι πελάτες σπάνια επαναξιολογούν τις αγορές

τους, αλλά αυτή τους η απραξία είναι αποτέλεσμα του περιορισμού που νιώθουν

λόγω του υψηλού κόστους αλλαγής εταιρίας ή της έλλειψης δεσίματος με ορισμένα

προϊόντα/υπηρεσίες. Αν και αυτοί οι πελάτες δεν τείνουν να ξοδεύουν περισσότερο ή

λιγότερο από ότι συνήθως, ο επηρεασμός τους προσφέρει τόσες ευκαιρίες όσες και ο

επηρεασμός των συναισθηματικά αφοσιωμένων πελατών.

Συνειδητά αφοσιωμένοι πελάτες (deliberators): οι πελάτες αυτοί είναι

πληροφορημένοι, ενημερώνονται για τυχών αγοραστικές ευκαιρίες και επανεξετάζουν

τις επιλογές τους χρησιμοποιώντας λογικά κριτήρια, όπως η απόδοση, η τιμή και η

ποιότητα. Αυτό το είδος των πελατών αποτελεί τη μεγαλύτερη αγοραστική ομάδα,

αντιπροσωπεύοντας κατά μέσο όρο το 40% του συνόλου των πελατών. Τα οφέλη

από τον επηρεασμό αυτών των πελατών έχουν διπλάσια αξία σε σχέση με αυτά των

δύο προηγουμένων ομάδων, καθώς αυτοί είναι οι πελάτες με τις μεγαλύτερες

πιθανότητες απώλειας.

1.3.1.2 Χαμένοι πελάτες

Οι πελάτες που έχουν εγκαταλείψει μια εταιρία χωρίζονται σε εκείνους που έφυγαν

εκούσια (voluntary churn-όταν επιλέγουν οι ίδιοι οι πελάτες να αφήσουν μία εταιρία ή

να τερματίσουν ένα συμβόλαιο) και σε εκείνους που έφυγαν ακούσια (nonvoluntary

churn-όταν η ίδια η εταιρία τερματίζει ένα συμβόλαιο ή απενεργοποιεί μία υπηρεσία).

Σελ. 18 από 85

Page 20: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Η εκούσια απώλεια πελατών μπορεί να χωριστεί σε 2 κατηγορίες, τυχαία και

εσκεμμένη. Η τυχαία απώλεια πελατών συμβαίνει όταν οι περιστάσεις καθιστούν τη

χρήση μιας υπηρεσίας μη απαραίτητη. Π.χ. σε περίπτωση θανάτου, μετακόμισης

σεάλλη γεωγραφική θέση, ή ραγδαία αλλαγή στην οικονομική κατάσταση του πελάτη

ώστε να μην μπορεί να καλύψει τις οικονομικές του υποχρεώσεις. Η τυχαία απώλεια

πελατών συνήθως είναι υπεύθυνη για ένα μικρό ποσοστό της εκούσιας απώλειας. Η

εσκεμμένη απώλεια πελατών συμβαίνει όταν ένας πελάτης αποφασίζει συνειδητά να

αλλάξει εταιρία. Μερικοί λόγοι που μπορεί να οδηγήσουν στην απόφαση είναι αν ο

πελάτης π.χ. ανακαλύψει ότι μια ανταγωνίστρια εταιρία προσφέρει καλύτερα

προϊόντα, που ο τρέχον πάροχος δεν μπορεί να παρέχει, είναι η εύρεση του

προϊόντος σε χαμηλότερη τιμή και άλλοι παράγοντες όπως η ανεπαρκής κάλυψη, ή η

άσχημη εξυπηρέτηση κ.α. Οι παράγοντες που σχετίζονται με την τιμή αποτελούν τη

σημαντικότερη αιτία για την εκούσια απώλεια πελατών (σχήμα 6). Επιπλέον,

σημαντικοί είναι και παράγοντες όπως η ακαταλληλότητα των συμβολαίων σε σχέση

με τα χαρακτηριστικά των πελατών και τις ανάγκες τους, αλλά και η έλλειψη

ενημέρωσης των πελατών για νέα προϊόντα και υπηρεσίες, που μπορεί να οδηγήσει

σε μη πληροφόρηση και αβεβαιότητα.

Σελ. 19 από 85

Page 21: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Οι ακούσια χαμένοι πελάτες είναι πιο εύκολο να αναγνωριστούν, αφού είναι εκείνοι οι

πελάτες των οποίων οι υπηρεσίες διακόπηκαν από την ίδια την εταιρία. Υπάρχουν

πολλοί λόγοι για τους οποίους μια εταιρία θα μπορούσε να διακόψει τη σχέση της με

ένα πελάτη, όπως είναι η κατάχρηση μιας υπηρεσίας ή η μη κάλυψη των

οικονομικών τους υποχρεώσεων (σχήμα 7). Από την πλευρά της εταιρίας αυτό το

πρόβλημα μπορεί να οφείλεται στο ότι η ίδια δεν κατάφερε να παρακολουθεί τους

πελάτες με τη μεγαλύτερη πιθανότητα απώλειας και να παρέμβει πριν τα επίπεδα

χρεώσεών τους γίνουν πολύ μεγάλα. Η ανάλυση που πραγματοποιήθηκε έδειξε ότι οι

πελάτες που εμφάνισαν ακούσια απώλεια είχαν μεγαλύτερα επίπεδα μηνιαίας

χρήσης σε σχέση με τους ενεργούς πελάτες και ότι οι πελάτες που έχασαν την

υπηρεσία λόγω αθέτησης πληρωμών αντιμετώπισαν αυτό το πρόβλημα επειδή δεν

γνώριζαν πώς να ελέγχουν το επίπεδο της χρήσης τους, ώστε να την περιορίσουν

πριν να είναι πολύ αργά.

Σχήμα 7: Χαρακτηριστικά ακούσιας απώλειας πελατών (ϋΘββί, 2006)

Σελ. 20 από 85

Page 22: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

1.3.2 Παράγοντες απώλειας πελατών

Παρακάτω περιγράφονται συγκεντρωτικά οι παράγοντες απώλειας πελατών και ο

τρόπος επηρεασμού τους, όπως αυτοί προέκυψαν μέσα από σχετική έρευνα στον

τομέα των τηλεπικοινωνιών. Στο σχήμα 8 φαίνεται η γραφική απεικόνισή τους.

1.3.2.1 Δυσαρέσκεια πελατών

Πληθώρα ερευνών έχει δείξει ότι η δυσαρέσκεια των πελατών σχετίζεται με την

αύξηση της απώλειας πελατών. Η ποιότητα δικτύου και η ποιότητα κλήσεων είναι

οδηγοί της ικανοποίησης (ή δυσαρέσκειας) των πελατών στον τομέα των

τηλεπικοινωνιών και ότι η αποτυχία εξυπηρέτησης επιταχύνει την απόφαση ενός

πελάτη να διακόψει τη σχέση του με μία εταιρία. Παρόλα αυτά, πρέπει να σημειωθεί

ότι οι αποτυχίες κλήσεων δεν οδηγούν απαραίτητα στην απώλεια πελατών επειδή

αποδίδονται σε πολλά γεγονότα (π.χ., παρεμβολές, συσκευή, κ.α.), ενώ οι διακοπές

κλήσεων οφείλονται στον τηλεπικοινωνιακό πάροχο. Επιπλέον η δυσαρέσκεια με μία

υπηρεσία ή ένα προϊόν είναι θετικά συσχετισμένη με τη συμπεριφορά παραπόνων

των πελατών και κατά συνέπεια με την απώλεια πελατών.

Αυτό μπορεί να σημαίνει ότι είτε τα παράπονα που γίνονται στα κέντρα

εξυπηρέτησης πελατών δεν λαμβάνουν την κατάλληλη διαχείριση ή ότι κάποια από

αυτά δεν αντιμετωπίζονται άμεσα (χρειάζεται χρόνος για να διορθωθεί ένα πρόβλημα

π.χ. κάλυψης δικτύου και οι πελάτες μπορεί να μην είναι διατεθειμένοι να

περιμένουν).Σελ. 21 από 85

Page 23: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

1.3.2.2 Κόστος αλλαγής εταιρίας

Όπως αναφέρθηκε και παραπάνω, οι πελάτες διατηρούν τη σχέση τους με μία

εταιρία είτε λόγω περιορισμών (υπογραφή σύμβασης,δέσμευση συμβολαίου)είτε

λόγω αφοσίωσης (θέλουν να διατηρήσουν τη σχέση). Το κόστος αλλαγής εταιρίας

(switching cost) είναι ένας παράγοντας που δρα ως περιορισμός, εμποδίζοντας τους

πελάτες από το να αλλάζουν ελεύθερα παρόχους υπηρεσιών. Δεν υπάρχει ενιαίο

τέλος σε όλους τους παρόχους για τη φορητότητα αριθμών. Ο καθορισμός του ύψους

του τέλους αυτού εναπόκειται στην εμπορική πολιτική κάθε εταιρίας και διαφέρει

σημαντικά από εταιρία σε εταιρία.

1.3.2.3 Χρήση υπηρεσιών

Το επίπεδο χρήσης μιας υπηρεσίας, σε μηνιαία χρέωση, είναι ένας από τους πιο

σημαντικούς παράγοντες απώλειας πελατών. Παρόλα αυτά, δεν είναι ξεκάθαρο εάν η

σχέση μεταξύ της χρήσης υπηρεσιών και της απώλειας πελατών είναι θετική ή

αρνητική. Όταν ένας πελάτης χρησιμοποιεί μια υπηρεσία συχνά, αναπτύσσει θετική

στάση απέναντί της, και συνεπώς ένας πελάτης με πολλές θετικές εμπειρίες σε μία

υπηρεσία δε θα είναι ευαίσθητος σε μεμονωμένες περιπτώσεις αποτυχίας και άρα δε

θα έχει μεγάλη πιθανότητα απώλειας. Αντίθετα, οι συχνοί χρήστες είναι πιο πιθανό

να εγκαταλείψουν μια εταιρία και οι πελάτες με μεγάλο ποσοστό χρεώσεων είναι πιο

ευαίσθητοι στην τιμή και πιο επιρρεπείς στην απώλεια, ενώ οι πελάτες που δεν

τηρούν τις οικονομικές τους υποχρεώσεις δεν είναι επιρρεπείς στην απώλεια

πελατών άμεσα, καθώς δεν μπορούν να φύγουν οικειοθελώς, παρά μόνο αν

πληρώσουν ένα σημαντικό ποσοστό των οφειλών τους.

Σελ. 22 από 85

Page 24: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 2

Εξόρυξη δεδομένων και ανάλυση αποχώρησης

2.1 Τι είναι εξόρυξη δεδομένων

Εξόρυξη δεδομένων είναι η εξεύρεση μιας πληροφορίας ή προτύπων από μεγάλες

βάσεις δεδομένων με τη χρήση αλγορίθμων συσταδοποίησης ή κατηγοριοποίησης

και των αρχών της στατιστικής, της τεχνητής νοημοσύνης και των συστημάτων

βάσεων δεδομένων. Στόχος της εξόρυξης δεδομένων είναι η πληροφορία που θα

εξαχθεί και τα πρότυπα που θα προκύψουν να έχουν δομή κατανοητή προς τον

άνθρωπο έτσι ώστε να τον βοηθήσουν να πάρει τις κατάλληλες αποφάσεις.

Ο όρος εξόρυξη δεδομένων είναι μία έννοια που συνήθως παραπέμπει σε κάθε είδος

φόρμας με μεγάλη ποσότητα δεδομένων ή επεξεργασία δεδομένων (συλλογή,

εξαγωγή δεδομένων, ανάλυση δεδομένων και στατιστικής) αλλά επίσης γενικεύεται

σε κάθε είδος συστήματος υποστήριξης αποφάσεων συμπεριλαμβανομένου της

τεχνητής νοημοσύνης, της μηχανικής μάθησης και της επιχειρηματικής ευφυΐας. Στην

ορθή χρήση του όρου η λέξη κλειδί είναι η ανακάλυψη, που ορίζεται ως η ανίχνευση

κάτι καινούριου.

Η εξόρυξη γνώσης από μεγάλες αποθήκες δεδομένων έχει εξελιχθεί σε ένα από τα

βασικότερα ερευνητικά ζητήματα στον τομέα των βάσεων δεδομένων, των μηχανών

γνώσης, της στατιστικής, καθώς επίσης και ως μία σημαντική ευκαιρία για καινοτομία

στις επιχειρήσεις. Ορισμένες από τις μεθόδους εξόρυξης δεδομένων είναι:

• Η ανάλυση προτύπων δεδομένων (data/pattern analysis)

• Η αρχαιολογία δεδομένων (data archeology)

• Η συγκομιδή πληροφοριών (information harvesting)

• Η ευφυία συστημάτων επιχειρήσεων (business intelligence).

Η εξόρυξη δεδομένων είναι στενά συνδεδεμένη με την ανακάλυψη γνώσης σε βάσεις

δεδομένων (Knowledge Discovery in Databases - KDD) και πολλές φορές οι ορισμοί

των δύο αυτών διαδικασιών ταυτίζονται.

Σελ. 23 από 85

Page 25: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

2.1.1 Είσοδος και έξοδος συστήματος εξόρυξης δεδομένων

Για την επιτυχημένη και αποδοτικότερη εφαρμογή τεχνικών Εξόρυξης Δεδομένων,

δύο είναι τα σημαντικότερα στοιχεία: η ακριβής διατύπωση του προβλήματος και των

επιμέρους χαρακτηριστικών του και η επιλογή των σωστών δεδομένων που

αντιπροσωπεύουν το πρόβλημα.

Τα αρχικά δεδομένα θα χρησιμοποιηθούν ως είσοδος στο σύστημα Εξόρυξης

Δεδομένων (Σχήμα 9). Ο ρόλος των δεδομένων εκπαίδευσης είναι σημαντικός, γιατί

βάσει αυτών επιχειρείται να καθοριστεί εκ νέου ο βαθμός συσχέτισής τους, ώστε να

μπορέσει ο τελικός χρήστης να εκμαιεύσει μία πιο χρήσιμη και ολοκληρωμένη

πληροφορία.

Σχήμα 9: Διαδικασία εξόρυξης δεδομένων

Τα δεδομένα εισόδου στο σύνολό τους είναι οι τιμές των χαρακτηριστικών. Ως

χαρακτηριστικό (attribute) ορίζεται η ιδιότητα ενός αντικειμένου. Μία συλλογή

χαρακτηριστικών περιγράφει ένα αντικείμενο ή αλλιώς μια εγγραφή (record) ή ένα

παράδειγμα (example) ή μια παρατήρηση (observation) ή ένα στιγμιότυπο (instance).

Οι τιμές των χαρακτηριστικών είναι αριθμοί ή σύμβολα που τα περιγράφουν. Οι τιμές

των χαρακτηριστικών μπορεί να είναι συνεχείς (continuous) ή διακριτές (discrete).

Ορίζονται διαφορετικοί τύποι χαρακτηριστικών, όπως: ονομαστικός (nominal),

τακτικός (ordinal),διαστήματος (interval) και αναλογίας (ratio).

Ενδεικτικά παραδείγματα τύπων των γνωρισμάτων είναι και τα ακόλουθα:

Χρώμα ματιών, φύλο (ονομαστικός τύπος)

Σελ. 24 από 85

Page 26: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

• Αριθμοί οδών, βαθμίδες (τακτικός)

• Ημερομηνίες, θερμοκρασίες σε βαθμούς Κελσίου ή Fahrenheit (διάστημα)

• Νομισματικές αξίες, μήκος (αναλογίας)

Ένα σύνολο δεδομένων μπορεί να είναι υπό τη μορφή εγγράφων (καταχωρήσεις σε

πίνακες), ή ταξινομημένων πληροφοριών (χωρικά, χρονικά, ονομαστικά).

2.1.2 Ταξινόμηση των συστημάτων εξόρυξης δεδομένων

Η εξόρυξη δεδομένων είναι μια διαδικασία πολύπλευρη και σύνθετη, μέρος μιας

άλλης επαναληπτικής διαδικασίας, με σκοπό την εξαγωγή γνώσης και

συμπερασμάτων. Επιπλέον, είναι ένας διεπιστημονικός τομέας που συνδυάζει τομείς

όπως βάσεις δεδομένων, μηχανική μάθηση, στατιστική και ανάκτηση πληροφοριών.

Εμπεριέχει, λοιπόν, τεχνολογίες αιχμής (Σχήμα 10) χωρίς να τις υποβαθμίζει, αλλά

αντιθέτως τις συνδυάζει με διάφορους τρόπους.

Σχήμα 10: Τεχνολογίες γύρω από την εξόρυξη δεδομένων

Ανάλογα με τον τρόπο με τον οποίο οι διάφορες τεχνολογίες συμμετέχουν στην

εξόρυξη δεδομένων, υλοποιούνται και διαφορετικά συστήματα εξόρυξης δεδομένων.

Η κατηγοριοποίηση των συστημάτων εξόρυξης δεδομένων μπορεί να γίνει με βάση

τα ακόλουθα κριτήρια :

Σύμφωνα με το είδος της βάσης δεδομένων που χρησιμοποιείται: Όπως

αναφέρθηκε προηγουμένως, είναι δυνατή η εξόρυξη δεδομένων από διάφορους

τύπους αποθήκευσης πληροφορίας (π.χ. τα σχεσιακά δεδομένα, ταΣελ. 25 από 85

Page 27: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

αντικειμενοτραφή συστήματα βάσεων δεδομένων, οι χωροχρονικές βάσεις

δεδομένων, τα συστήματα βάσεων δεδομένων πολυμέσων κ.λπ). Για παράδειγμα,

ένα σύστημα που χρησιμοποιείται για την εξαγωγή γνώσης από αντικειμενοστραφείς

βάσεις δεδομένων καλείται αντικειμενοστραφές σύστημα εξόρυξης δεδομένων.

Σύμφωνα με τον τύπο της γνώσης που εξάγεται: Από ένα σύστημα εξόρυξης

δεδομένων μπορούν να προκύψουν είτε πρότυπα πληροφόρησης (informative

patterns), όπου περιγράφουν συσχετίσεις μεταξύ των δεδομένων και προκύπτουν με

μάθηση χωρίς επίβλεψη, είτε μοντέλα πρόβλεψης (predictive models), όπου

προβλέπουν την τιμή μιας μεταβλητής και προκύπτουν με μάθηση και επίβλεψη. Στα

πρότυπα πληροφόρησης περιλαμβάνονται οι κανόνες συσχέτισης (association rules),

τα ακολουθιακά πρότυπα (sequential patterns) και οι συστάδες (clusters), ενώ στα

μοντέλα πρόβλεψης ανήκουν οι κανόνες κατηγοριοποίησης (classification rules), τα

δέντρα απόφασης (decision trees), η μάθηση εννοιών (concept learning), η μάθηση

με βάση τα παραδείγματα, η μάθηση με βάση την θεωρία του Bayes κλπ.

Σύμφωνα με την τεχνική που θα χρησιμοποιηθεί: Οι τεχνικές μπορούν να

περιγράφουν είτε το βαθμό παρέμβασης του χρήστη (αυτόνομα συστήματα,

συστήματα οδηγούμενα από ερωτήματα, διαλογικά συστήματα κ.λ.π.) είτε από την

μέθοδο ανάλυσης των δεδομένων (συστήματα γενικής εξόρυξης, εξόρυξης

βασισμένης στα πρότυπα, OLAP, εξόρυξης βασισμένης στη στατιστική ή στα

μαθηματικά, νευρωνικά δίκτυα, κ.λπ).

Σύμφωνα με το πεδίο εφαρμογής της εξόρυξης δεδομένων: Είναι δυνατή η

ανάπτυξη συστημάτων εξόρυξης δεδομένων μόνο για συγκεκριμένου τύπου

εφαρμογές, όπως για παράδειγμα οικονομικές, χρηματιστηριακές, γενετικές κ.λπ

2.1.3 Πρότυπα εξόρυξης δεδομένων

Τα πρότυπα που προκύπτουν από μια διαδικασία ανακάλυψης γνώσης διακρίνονται

σε πρότυπα πληροφόρησης και πρότυπα πρόβλεψης.

Τα πρότυπα πληροφόρησης (informative patterns) περιγράφουν συσχετίσεις

μεταξύ των δεδομένων τις οποίες ο ειδικός του τομέα δεν γνώριζε. Η αξία τους είναι

δυσκολότερο να αξιολογηθεί καθώς εξαρτάται από το κατά πόσο προτείνουν κάποιες

ενέργειες σε αυτόν και επίσης από το κατά πόσο οι ενέργειες αυτές είναι

αποτελεσματικές. Σε αυτήν την κατηγορία ανήκουν οι κανόνες συσχέτισης

Σελ. 26 από 85

Page 28: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

(association rules) όπως επίσης και οι συστάδες (clusters) οι οποίες προκύπτουν

από την KDD διαδικασία της συσταδοποίησης (clustering).

Τα πρότυπα πρόβλεψης (predictive patterns) προβλέπουν την τιμή ενός πεδίου

με βάση τις τιμές των άλλων πεδίων. Η αξία τους δεν κρίνεται μόνο από την ποιότητα

της πρόβλεψης αλλά και από το ότι μπορούν να μεταφέρουν στον ειδικό του τομέα

μια γενική εικόνα της σχέσης που χαρακτηρίζει τα πεδία που μελετά. Τέτοιες

διαδικασίες ανακάλυψης γνώσης είναι η κατηγοριοποίηση (classification) με

κυριότερες υποπεριπτώσεις τα δέντρα κατηγοριοποίησης (classification trees) και

τους απλούς κατηγοριοποιητές Bayes, καθώς και η διαδικασία εντοπισμού

εμπειρικών σχέσεων σε μεταβλητές με παλινδρόμηση (regression).

2.2 Εξόρυξη δεδομένων στις τηλεπικοινωνίες

Ο κλάδος των τηλεπικοινωνιών ήταν ένας από τους πρώτους κλάδους όπου

υιοθέτησαν την τεχνολογία εξόρυξης δεδομένων. Αυτό συνέβει γιατί συνήθως οι

εταιρίες τηλεπικοινωνιών παράγουν και αποθηκεύουν τεράστιες ποσότητες υψηλής

ποιότητας δεδομένων, έχουν μια πολύ μεγάλη πελατειακή βάση, και λειτουργούν σε

ένα ταχέως μεταβαλλόμενο και άκρως ανταγωνιστικό περιβάλλον. Οι εταιρείες

τηλεπικοινωνιών χρησιμοποιούν την εξόρυξη δεδομένων για να βελτιώσουν τις

προσπάθειές τους στο μάρκετινγκ, για τον εντοπισμό περιπτώσεων απάτης και για

την καλύτερη διαχείριση των τηλεπικοινωνιακών δικτύων τους. Ωστόσο, οι εταιρείες

αντιμετωπίζουν μία σειρά από προκλήσεις λόγω του τεράστιου μεγέθους των

συνολικών δεδομένων στις διαδοχικές και χρονικές διαστάσεις των δεδομένων,

καθώς και την ανάγκη να προβλεφθούν πολύ σπάνια γεγονότα, όπως απάτες των

πελατών και βλάβες στο δίκτυο σε πραγματικό χρόνο. Η δημοτικότητα της εξόρυξης

δεδομένων στη βιομηχανία των τηλεπικοινωνιών μπορεί να θεωρηθεί ως επέκταση

της χρήσης έμπειρων συστημάτων στον τομέα των τηλεπικοινωνιών. Τα συστήματα

αυτά αναπτύχθηκαν για να αντιμετωπίσουν την πολυπλοκότητα που σχετίζεται με τη

διατήρηση μιας τεράστιας υποδομής του δικτύου και την ανάγκη να μεγιστοποιηθεί η

αξιοπιστία του δικτύου, ελαχιστοποιώντας ταυτόχρονα το κόστος εργασίας. Το

πρόβλημα με αυτά τα έμπειρα συστήματα είναι ότι είναι ακριβά για την ανάπτυξή

τους, επειδή είναι τόσο δύσκολο όσο και χρονοβόρο να αποσπάσουν τις

απαιτούμενες γνώσεις πάνω στον τομέα αυτό από εμπειρογνώμονες. Η εξόρυξη

δεδομένων μπορεί να θεωρηθεί ως μέσο δημιουργώντας αυτόματα ένα μέρος αυτής

της γνώσης απευθείας από τα δεδομένα.Σελ. 27 από 85

Page 29: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Οι εφαρμογές εξόρυξης δεδομένων για κάθε κλάδο εξαρτώνται από δύο παράγοντες:

τα δεδομένα που είναι διαθέσιμα και τα προβλήματα της επιχειρηματικής

δραστηριότητας που αντιμετωπίζει ο κλάδος. Αυτή η ενότητα παρέχει πληροφορίες

σχετικά με τα δεδομένα που διατηρούν οι τηλεπικοινωνιακές εταιρείες και με τις

προκλήσεις που σχετίζονται με δεδομένα τηλεπικοινωνιών εξόρυξης. Οι εταιρίες

τηλεπικοινωνιών διατηρούν δεδομένα για τηλεφωνικές κλήσεις που διέρχονται από

τα δίκτυά τους υπό τη μορφή εγγραφών με λεπτομέρειες για τις κλήσεις, που

περιέχουν περιγραφικά στοιχεία για κάθε τηλεφώνημα. Τα αρχεία αυτά φυλάσσονται

για αρκετούς μήνες, αυτό σημαίνει ότι τα δισεκατομμύρια των αναλυτικών εγγραφών

των κλήσεων είναι εύκολα διαθέσιμα για εξόρυξη δεδομένων. Τα λεπτομερή

δεδομένα των κλήσεων είναι χρήσιμα για το μάρκετινγκ και τις εφαρμογές ανίχνευσης

απάτης.

Οι εταιρείες τηλεπικοινωνιών διατηρούν, επίσης, εκτενής πληροφορίες για τους

πελάτες τους, όπως πληροφορίες χρέωσης, καθώς και πληροφορίες που

προέρχονται από τρίτα μέρη, όπως πληροφορίες για το πιστωτικό αποτέλεσμα.

Αυτές οι πληροφορίες μπορεί να είναι αρκετά χρήσιμες και συχνά συνδυάζονται με

τις τηλεπικοινωνίες συγκεκριμένων δεδομένων για να βελτιώσουν τα αποτελέσματα

εξόρυξης δεδομένων. Οι εταιρείες τηλεπικοινωνιών επίσης έχουν δημιουργήσει και

αποθηκεύσει μια μεγάλη ποσότητα των δεδομένων που σχετίζονται με τη λειτουργία

των δικτύων τους. Αυτό συμβαίνει επειδή τα στοιχεία του δικτύου σε αυτά τα μεγάλα

τηλεπικοινωνιακά δίκτυα έχουν κάποιες αυτο-διαγνωστικές ικανότητες που τους

επιτρέπουν να δημιουργήσουν κάποια μηνύματα συναγερμού. Αυτές οι κατηγορίες

των μηνυμάτων μπορεί να εξορυχθούν, προκειμένου να στηρίξουν λειτουργίες

διαχείρισης του δικτύου, δηλαδή την απομόνωση σφαλμάτων και πρόβλεψη αυτών.

2.2.1 Τύποι δεδομένων τηλεπικοινωνιών

Τα δεδομένα των τηλεπικοινωνιών θέτουν διάφορα ενδιαφέροντα θέματα για την

εξόρυξη δεδομένων.Το πρώτο αφορά το μέγεθος, καθώς οι βάσεις δεδομένων των

τηλεπικοινωνιών μπορεί να περιέχουν δισεκατομμύρια αρχεία και είναι από τις

μεγαλύτερες στον κόσμο. Ένα δεύτερο θέμα είναι ότι το ακατέργαστα δεδομένα δεν

είναι συχνά κατάλληλα για την εξόρυξη δεδομένων. Για παράδειγμα, τόσο οι

λεπτομερείς κλήσεις όσο και τα δεδομένα του δικτύου είναι χρονολογικές σειρές

δεδομένων που αντιπροσωπεύουν μεμονωμένα γεγονότα. Πριν από αυτά τα

δεδομένα μπορούν πράγματι να εξορυχθούν χρήσιμα "περίληπτικά" χαρακτηριστικάΣελ. 28 από 85

Page 30: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

που πρέπει να προσδιορίζονται και τότε τα δεδομένα θα πρέπει να συνοψιστούν

χρησιμοποιώντας αυτά τα χαρακτηριστικά. Επειδή πολλές εφαρμογές εξόρυξης

δεδομένων στη βιομηχανία τηλεπικοινωνιών περιλαμβάνουν την πρόβλεψη πολύ

σπάνιων γεγονότων, όπως η αποτυχία ενός δικτύου ή μια περίπτωση απάτης, είναι

ένα ακόμη ζήτημα που πρέπει να αντιμετωπιστεί. Το τέταρτο και τελευταίο ζήτημα

αφορά την εξόρυξη δεδομένων σε πραγματικό χρόνο απόδοσης: πολλές εφαρμογές

εξόρυξης δεδομένων, όπως η ανίχνευση της απάτης, απαιτούν πως κάθε μοντέλο-

κανόνας πρέπει να εφαρμόζεται σε πραγματικό χρόνο.

Το πρώτο βήμα στη διαδικασία εξόρυξης δεδομένων είναι να κατανοήσουμε τα

δεδομένα. Χωρίς να έχει γίνει αυτό οι χρήσιμες εφαρμογές δεν μπορούν να

αναπτυχθούν. Σε αυτή την ενότητα περιγράφονται τα τρία κύρια είδη των

τηλεπικοινωνιακών δεδομένων. Εάν τα πρωτογενή δεδομένα δεν είναι κατάλληλα για

την εξόρυξη δεδομένων, τότε τα βήματα μετασχηματισμού κρίνονται αναγκαία για τη

δημιουργία των δεδομένων που μπορούν να εξορυχθούν. Η εξόρυξη δεδομένων

μπορεί να χρησιμοποιηθεί για την εξαγωγή χρήσιμων πληροφοριών από αυτά τα

σύνολα δεδομένων.

Λήψη/ Απο φάσεων

Αναπαράσταση ~ Π ληροφορίας

lisualizaXion Techniques Εςορυςη Δεδομένω ν

information Discovery

Εξερεύνηση Δεδομένω ν

Α π οθ ή κ ες δ εδομ ένω ν / Σ υλλογές Δ εδομένοιν__________________ OLAP, ΛΙΡΑ __________________

Π ηγές Δεδομένω νPaper, Files, Inform ation Providers. D atabase Systems, O LTP

Εξόρυξη Δεδομένων και Ευφυΐα ΕταιριώνΑ υξανόμενη όυνομική για υποστήριξη εταιρικώ ν αποφάσεων Τ ελικός Χ ρήστης

ΑναλυτήςΕταιρίας

ΑναλυτήςΔεδομένω ν

Άιαχείριστ ής \ Βάσης

Σχήμα 11: Εξόρυξη Δεδομένων και Ευφυία Εταιριών

Σελ. 29 από 85

Page 31: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

2.2.1.1 Δεδομένα ανάλυσης κλήσεων

Κάθε φορά που γίνεται μια κλήση σε ένα δίκτυο τηλεπικοινωνιών, περιγράφονται

πληροφορίες σχετικά με την κλήση και αποθηκεύονται σε ένα αρχείο με αναλύσεις

κλήσεων. Ο αριθμός εγγραφών αυτών των κλήσεων που δημιουργούνται και

αποθηκεύονται είναι τεράστιος. Αυτό σημαίνει ότι δεκάδες δισεκατομμύρια αρχεία

κλήσεων θα πρέπει να αποθηκεύονται σε οποιαδήποτε στιγμή.

Οι αναλυτικές εγγραφές κλήσεων περιλαμβάνουν επαρκείς πληροφορίες για να

περιγράψουν τα σημαντικά χαρακτηριστικά της κάθε κλήσης. Κάθε κλήση

περιλαμβάνει τους αριθμούς τηλεφώνου που εκκινούν και τερματίζουν, την

ημερομηνία και την ώρα της κλήσης και τη διάρκεια της. Τα αρχεία κλήσεων

δημιουργούνται σε πραγματικό χρόνο και ως εκ τούτου θα είναι διαθέσιμα σχεδόν

αμέσως για την εξόρυξη δεδομένων. Αυτό μπορεί να έρχεται σε αντίθεση με τα

δεδομένα χρέωσης, τα οποία τυπικά διατίθενται μόνο μία φορά ανά μήνα.

Τα αρχεία αυτά δεν χρησιμοποιούνται άμεσα για την εξόρυξη δεδομένων, δεδομένου

ότι ο στόχος της εφαρμογής εξόρυξης δεδομένων είναι να εξάγει γνώση σε επίπεδο

πελάτη και όχι στο επίπεδο των μεμονωμένων τηλεφωνικών κλήσεων. Έτσι, οι

αναλυτικές εγγραφές κλήσεων που συνδέονται με έναν πελάτη, πρέπει να

συνοψίζονται σε ένα ενιαίο αρχείο που να περιγράφει τη συμπεριφορά του πελάτη. Η

επιλογή των μεταβλητών σύνοψης, δηλαδή τα χαρακτηριστικά είναι σημαντικά

προκειμένου να επιτευχθεί μια χρήσιμη περιγραφή του πελάτη. Παρακάτω είναι μια

λίστα με τα χαρακτηριστικά που θα μπορούσε κανείς να χρησιμοποιήσει κατά τη

δημιουργία συνοπτικής περιγραφής ενός πελάτης με βάση τις κλήσεις που εκτελεί και

λαμβάνει πάνω από κάποιο χρονικό διάστημα Ρ περίοδου:

1. μέση διάρκεια κλήσης

2. % Δεν απαντά κλήσεις

3. % Κλήσεις προς / από ένα διαφορετικό κωδικό περιοχής

4. % Των κλήσεων ανά ημέρα της εβδομάδας (Δευτέρα - Παρασκευή)

5. % Των κλήσεων ημέρας (9πμ - 5μμ)

6. μέσος όρος εισερχόμενων κλήσεων ανά ημέρα

7. μέσος όρος κλήσεων που πραγματοποιήθηκαν ανά ημέρα

Σελ. 30 από 85

Page 32: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

8. μοναδικοί κωδικοί περιοχής που καλέστηκαν κατά τη διάρκεια P

Αυτά τα οκτώ χαρακτηριστικά μπορούν να χρησιμοποιηθούν για τη δημιουργία ενός

προφίλ του πελάτη. Ένα τέτοιο προφίλ έχει πολλές πιθανές εφαρμογές. Για

παράδειγμα, θα μπορούσε να χρησιμοποιηθεί για να γίνει διάκριση μεταξύ των

επιχειρήσεων και των οικιακών πελατών με βάση το ποσοστό των ημερήσιων και

εβδομαδιαίων κλήσεων. Τα περισσότερα από τα οκτώ στοιχεία που παρατίθενται

ανωτέρω παρήχθησαν με άμεσο τρόπο από τα βασικά δεδομένα. Επειδή οι

περισσότεροι άνθρωποι πραγματοποιούν κλήσεις μόνο σε μερικούς κωδικούς

περιοχής πάνω από ένα εύλογο σύντομο χρονικό διάστημα (π.χ. ένα μήνα), αυτό το

χαρακτηριστικό μπορεί να βοηθήσει στον εντοπισμό telemarketers ή συμπεριφορά

telemarketing, αφού οι telemarketers θα καλέσουν πολλούς διαφορετικούς κωδικούς

περιοχής.

2.2.1.2 Δεδομένα δικτύου

Στα δίκτυα τηλεπικοινωνιών είναι εξαιρετικά πολύπλοκες οι συνθέσεις του

εξοπλισμού, που αποτελούνται από χιλιάδες διασυνδεδεμένα στοιχεία .Κάθε στοιχείο

δικτύου είναι ικανό να παράγει μηνύματα σφάλματος και κατάστασης, τα οποία

οδηγούν σε ένα τεράστιο ποσό των δεδομένων του δικτύου. Αυτά τα δεδομένα

πρέπει να αποθηκεύονται και να αναλύονται, προκειμένου να υποστηρίξουν τις

λειτουργίες διαχείρισης του δικτύου, όπως η περίπτωση απομόνωσης. Τα δεδομένα

αυτά θα περιλαμβάνουν μία ελάχιστη χρονική σήμανση που προσδιορίζει με

μοναδικό τρόπο το υλικό ή το στοιχείο λογισμικού δημιουργώντας το μήνυμα και έναν

κωδικό που εξηγεί γιατί το μήνυμα αυτό δημιουργήθηκε. Για παράδειγμα, ένα τέτοιο

μήνυμα μπορεί να υποδεικνύει ότι «ο συνδρομητής χ παρουσίασε απώλεια σύνδεσης

για 30 δευτερόλεπτα η οποία άρχισε στις 10:03 μ.μ. τη Δευτέρα 12 Μαΐου».

Λόγω του τεράστιου αριθμού των μηνυμάτων που δημιουργούνται στο δίκτυο, οι

τεχνικοί δεν μπορούν να χειριστούν κάθε ενδεχόμενο μήνυμα. Για αυτό το λόγο

έχουν αναπτυχθεί τα έμπειρα συστήματα για να αναλύουν αυτόματα τα μηνύματα και

να λαμβάνουν τα κατάλληλα μέτρα .Η τεχνολογία εξόρυξης δεδομένων τώρα μπορεί

να βοηθήσει στον εντοπισμό σφαλμάτων δικτύου με αυτόματη εξαγωγή γνώσης από

τα δεδομένα του δικτύου.

Σελ. 31 από 85

Page 33: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

2.2.1.3 Δεδομένα πελατών

Οι εταιρείες τηλεπικοινωνιών, όπως και άλλες μεγάλες επιχειρήσεις, μπορεί να έχουν

εκατομμύρια πελάτες. Κατ 'ανάγκη, αυτό σημαίνει τη διατήρηση βάσης δεδομένων με

πληροφορίες σχετικά με αυτούς τους πελάτες. Αυτές οι πληροφορίες θα

περιλαμβάνουν το όνομα, πληροφορίες για τη διεύθυνση και μπορεί να

περιλαμβάνουν και άλλες πληροφορίες, όπως το πρόγραμμα της υπηρεσίας και

πληροφορίες σχετικά με την σύμβαση, το πιστωτικό αποτέλεσμα, το οικογενειακό

εισόδημα και το ιστορικό πληρωμών. Τα στοιχεία των πελατών χρησιμοποιούνται

συχνά σε συνδυασμό με άλλα δεδομένα με σκοπό τη βελτίωση των αποτελεσμάτων.

Για παράδειγμα, τα δεδομένων των πελατών συνήθως χρησιμοποιούνται για να

συμπληρώσουν τα στοιχεία αναλυτικών κλήσεων, όταν προσπαθούν να εντοπίσουν

απάτη στο τηλέφωνο.

2.2.2 Εφαρμογές εξόρυξης δεδομένων

Ο κλάδος των τηλεπικοινωνιών υιοθέτησε από πολύ νωρίς την τεχνολογία εξόρυξης

δεδομένων. Αρκετές είναι οι τυπικές εφαρμογές που περιγράφονται στην παρούσα

ενότητα. Οι εφαρμογές αυτές χωρίζονται σε τρεις τομείς εφαρμογής: ανίχνευση της

απάτης, το μάρκετινγκ και την απομόνωση βλαβών του δικτύου.

2.2.2.1 Marketing τηλεπικοινωνιών

Οι εταιρείες τηλεπικοινωνιών διατηρούν μία τεράστια ποσότητα πληροφοριών για

τους πελάτες τους και λόγω του εξαιρετικά ανταγωνιστικού περιβάλλοντος τους,

έχουν μεγάλα κίνητρα για την αξιοποίηση αυτών των πληροφοριών. Γι 'αυτό τον λόγο

ο κλάδος των τηλεπικοινωνιών έχει ηγετική θέση στη χρήση της εξόρυξης δεδομένων

για τον εντοπισμό και τη διατήρηση των πελατών, αλλά και στη μεγιστοποίηση του

κέρδους που μπορεί να προκύψει από τον κάθε πελάτη. Μια πιο παραδοσιακή

προσέγγιση περιλαμβάνει τη δημιουργία προφίλ του πελάτη από αναλυτικές

εγγραφές κλήσεων και στη συνέχεια εξόρυξη αυτών, το συγκεκριμένο γίνεται για

σκοπούς μάρκετινγκ. Αυτή η προσέγγιση έχει χρησιμοποιηθεί να προσδιορίσει αν μια

τηλεφωνική γραμμή χρησιμοποιείται για φωνή ή φαξ και να ταξινομήσει μια

τηλεφωνική γραμμή που ανήκει σε κάποια επιχείρηση ή σε κάποιο οικιακό πελάτη.

Σελ. 32 από 85

Page 34: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κατά τη διάρκεια των τελευταίων ετών, η έμφαση σε εφαρμογές μάρκετινγκ στον

κλάδο των τηλεπικοινωνιών έχει στραφεί στον εντοπισμό νέων πελατών για τη

μέτρηση αξίας για τον κάθε πελάτη και στη συνέχεια για να λάβουν μέτρα για να

διατηρήσουν τους πιο επικερδείς πελάτες. Αυτή η μετατόπιση συνέβη διότι είναι

πολύ πιο ακριβό να αποκτήσεις ένα νέο τηλεπικοινωνιακό πελάτη από το να

διατηρήσεις τους ήδη υπάρχοντες. Έτσι, είναι χρήσιμο να γνωρίζουν τη συνολική

αξία ζωής του πελάτη, η οποία είναι το συνολικό καθαρό εισόδημα μιας εταιρίας που

μπορεί να περιμένει από τον πελάτη με την πάροδο του χρόνου.

Ένα βασικό στοιχείο της διαμόρφωσης αξίας ενός τηλεπικοινωνιακού πελάτη

υπολογίζει πόσο καιρό θα παραμείνει στον φορέα επικοινωνίας τους. Αυτό το

πρόβλημα παρουσιάζει ενδιαφέρον από μόνο του, δεδομένου ότι αν μια εταιρία

μπορεί να προβλέψει πότε ο πελάτης είναι πιθανό να φύγει, μπορεί να λάβει

προληπτικά μέτρα για να διατηρήσει αυτό τον πελάτη. Ο πελάτης αποχώρησης είναι

ένα τεράστιο ζήτημα για τον κλάδο των τηλεπικοινωνιών, όπου, μέχρι πρόσφατα,

εταιρείες τηλεπικοινωνιών προσφέρουν συνήθως μεγάλα χρηματικά κίνητρα για τους

πελάτες με σκοπό να στραφούν στους φορείς αυτούς. Πολυάριθμα συστήματα και

μέθοδοι έχουν αναπτυχθεί για να προβλέπουν τις απώλειες πελατών.

Τα συστήματα αυτά χρησιμοποιούν σχεδόν πάντα λεπτομερή στοιχεία των κλήσεων

αλλά επίσης συχνά χρησιμοποιούν και άλλα δεδομένα σχετικά με τον πελάτη

(πιστωτικό αποτέλεσμα, ιστορικό παραπόνων κλπ.), προκειμένου να βελτιώσει τις

επιδόσεις η πρόβλεψη αποχώρησης. Πρόκειται ουσιαστικά για ένα πολύ δύσκολο

πρόβλημα και, κατά συνέπεια, τα συστήματα για την πρόβλεψη αποχωρήσεων είναι

περιορισμένης αποτελεσματικότητας και αποδεικνύουν την ικανότητα να εντοπίσουν

ορισμένους από τους πελάτες.

2.2.2.2 Εντοπισμός απάτης

Η απάτη αποτελεί ένα πολύ σοβαρό πρόβλημα για τις εταιρίες τηλεπικοινωνιών, με

αποτέλεσμα να χάνονται δισεκατομμύρια δολάρια έσοδα κάθε χρόνο. Η απάτη

μπορεί να χωριστεί σε δύο κατηγορίες: στην απάτη συνδρομής και στην απάτη

εκμετάλλευσης. Απάτη Συνδρομής συμβαίνει όταν ένας πελάτης ανοίγει έναν

λογαριασμό με σκοπό να μην πληρώνει το λογαριασμό αυτό και απάτη

εκμετάλλευσης συμβαίνει όταν ένας δράστης κερδίζει παράνομη πρόσβαση στο

λογαριασμό ενός νόμιμου πελάτη. Σε αυτή την τελευταία περίπτωση, η δόλια

Σελ. 33 από 85

Page 35: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

συμπεριφορά θα έχει συχνά παράλληλη σχέση με την θεμιτή συμπεριφορά του

πελάτη. Η απάτη εκμετάλλευσης έχει ένα πολύ πιο σημαντικό πρόβλημα για τις

εταιρείες τηλεπικοινωνιών από την απάτη συνδρομής. Στην ιδανική περίπτωση και

οι δύο κατηγορίες απάτης θα πρέπει να εντοπιστούν αμέσως και οι συναφείς

λογαριασμοί πελατών να απενεργοποιηθούν ή να ανασταλούν. Ωστόσο, επειδή

συχνά είναι δύσκολο να γίνει διάκριση μεταξύ νόμιμης και παράνομης χρήσης λόγω

περιορισμένων δεδομένων, δεν είναι πάντα εφικτό να ανιχνευθούν από το ξεκίνημά

τους. Αυτό το πρόβλημα επιδεινώνεται από το γεγονός ότι υπάρχουν σημαντικές

δαπάνες που συνδέονται με την διερεύνηση των περιπτώσεων απάτης, καθώς και

έξοδα, εφόσον η χρήση λανθασμένα χαρακτηριστεί ως δόλια (π.χ., ένας ενοχλημένος

πελάτης).

Η πιο συνηθισμένη τεχνική για τον προσδιορισμό απάτης εκμετάλλευσης είναι να

συγκρίνεται ο λογαριασμός του τρέχοντος πελάτη με το προφίλ συμπεριφοράς της

χρήσης του παρελθόντος, χρησιμοποιώντας ανίχνευση απόκλισης και τεχνικές

ανίχνευσης διαφοροποιήσεων. Το προφίλ πρέπει να είναι σε θέση να ενημερώνεται

γρήγορα για τον όγκο των αναλυτικών εγγραφών κλήσεων και την ανάγκη για τον

εντοπισμό περιπτώσεων απάτης κατά τρόπο έγκαιρο. Οι αλγόριθμοι εξόρυξης

δεδομένων έχουν συχνά μεγάλη δυσκολία να ασχολούνται με την πρόβλεψη

σπάνιων γεγονότων. Για παράδειγμα, η απάτη αποτελεί μόνο 0,2% του συνόλου των

κλήσεων.

2.2.2.3 Σφάλμα δικτύου, απομόνωση και πρόβλεψη

Τα δίκτυα τηλεπικοινωνιών είναι εξαιρετικά πολύπλοκες συνθέσεις υλικού και

λογισμικού. Τα περισσότερα από τα στοιχεία αυτά έχουν την ικανότητα αυτο­

διάγνωσης και αυτά τα στοιχεία μπορούν να δημιουργήσουν κατάσταση συναγερμού

και μηνύματα κάθε μήνα. Για την αποτελεσματική διαχείριση του δικτύου οι

συναγερμοί πρέπει να αναλυθούν αυτόματα για τον εντοπισμό βλάβης στο δίκτυο ή

πρέπει να αντιληφθούν προτού να εμφανιστούν και να υποβαθμίσουν την απόδοση

του δικτύου. Λόγω του όγκου των δεδομένων και επειδή μία και μοναδική

δυσλειτουργία μπορεί να προκαλέσει πολλές και διαφορετικές βλάβες το έργο της

απομόνωσης βλαβών του δικτύου είναι αρκετά δύσκολο. Η εξόρυξη δεδομένων έχει

το ρόλο στη δημιουργία κανόνων για τον εντοπισμό σφαλμάτων.

Σελ. 34 από 85

Page 36: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Ο αναλυτής ακολουθίας συναγερμός τηλεπικοινωνιών(ΐαβα) είναι ένα εργαλείο που

βοηθά με το έργο απόκτησης γνώσης για τη συσχέτιση συναγερμού. Αυτό το

εργαλείο ανακαλύπτει αυτόματα επαναλαμβανόμενα μοτίβα των συναγερμών στα

δεδομένα του δικτύου, μαζί με τις στατιστικές ιδιότητες και τη χρήση ενός ειδικού

αλγορίθμου εξόρυξης δεδομένων. Το δίκτυο στη συνέχεια χρησιμοποιεί αυτές τις

πληροφορίες για να κατασκευάσει ένα κανόνα με βάση το σύστημα συσχετισμού

(συναγερμό), το οποίο μπορεί στη συνέχεια να χρησιμοποιηθεί σε πραγματικό χρόνο

προκειμένου να αναγνωριστούν σφάλματα.

Σελ. 35 από 85

Page 37: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 3

Διαχείριση πελατειακών σχέσεων (CRM)_________________

3.1 Εισαγωγή

To CRM (Customer Relationship Management) ή αλλιώς Διαχείριση Σχέσης Πελατών

(ΔΣΠ) σύμφωνα με την εταιρία συμβούλων επιχειρήσεων Ovum, είναι ένα σύστημα

διοίκησης που επιτρέπει στον οργανισμό να εντοπίσει, να προσελκύσει και να

αυξήσει τον αριθμό των 'αφοσιωμένων' και επικερδών πελατών του, κάνοντας ορθή

διαχείριση των πελατειακών σχέσεων (Bradshaw και Brash, 2001).

To CRM επίσης έχει οριστεί ως η δημιουργία και η διαχείριση των πελατειακών

σχέσεων από τους οργανισμούς, μέσα από την κατανόηση, την εκτίμηση και τη

διαχείριση των αναγκών των πελατών με βάση τη γνώση που έχει αποκτηθεί για

αυτούς, ώστε να αυξηθούν η αποδοτικότητα και η ικανότητα του οργανισμού και κατά

συνέπεια τα κέρδη αυτών.

Το CRM αποτελεί μία επιχειρησιακή στρατηγική που αφορά ολόκληρο τον οργανισμό.

Σύμφωνα με την εταιρία Gartner το CRM μπορεί να καθορισθεί ως μια επιχειρησιακή

στρατηγική που επιφέρει αποτελέσματα όπως: βελτιστοποίηση της κερδοφορίας, των

εσόδων και της ικανοποίησης του πελάτη μέσω της καλύτερης οργάνωσης, της

τμηματοποίησης των πελατών, της υιοθέτησης στάσεων και συμπεριφορών που

ικανοποιούν τους πελάτες και τέλος την εφαρμογή πελατοκεντρικών διαδικασιών.

Το CRM είναι μια 'ολιστική διαδικασία-προσέγγισης, απόκτησης, διατήρησης και

ανάπτυξης πελατών'. Επομένως δεν είναι απλά ένα πακέτο εφαρμογών ή ένα

λογισμικό αλλά η φιλοσοφία, ο τρόπος που λειτουργεί μια επιχείρηση ώστε να χτίζει

μακροχρόνιες σχέσεις με τους πελάτες της.

To CRM εμφανίστηκε στην Ελλάδα για πρώτη φορά πριν από 9 -10 χρόνια. Τα

πρώτα συστήματα ήταν σχεδιασμένα να υποστηρίξουν ένα μόνο τμήμα της

επιχείρησης. Όμως, κατά το δεύτερο στάδιο εξέλιξης, αναπτύχθηκαν πιο

ολοκληρωμένες λύσεις (Κρητικού και Ραχούτης, 2003).

Αργότερα η έλευση του Internet άλλαξε δραστικά την κατάσταση δεδομένου ότι το

Internet προσφέρεται για την ενσωμάτωση του CRM, εφόσον βέβαια υπάρχει η

απαραίτητη υποδομή σε μια επιχείρηση. Έτσι το CRM έγινε electronic-CRM ή e-CRM

και πλέον ο όρος e-CRM ταυτίστηκε με το CRM. Σήμερα η παγκόσμια αγορά του

Σελ. 36 από 85

Page 38: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

CRM παρουσιάζει συνεχώς ανοδικές τάσεις. Η ετήσια αύξηση της αγοράς για τη

βιομηχανία CRM προβλέπεται να είναι 10-15% και αυτό οφείλεται στην ένταξη

μεγάλων εταιριών στην αγορά όπως η Microsoft. Η Ελληνική αγορά βαδίζει στα

χνάρια της παγκόσμιας πραγματικότητας. Ο βαθμός ενημέρωσης και γνώσης είναι

υψηλός και η αναγκαιότητα για τη χρήση του συστήματος έχει αναγνωριστεί.

3.2 Στρατηγική σημασία του CRM

Eφαρμόζοντας μια αποδοτική στρατηγική CRM και άρα βασίζοντας το customer

service στη δημιουργία επιτυχημένων πελατειακών σχέσεων, στη μεταμόρφωση της

πώλησης σε αγοραστική εμπειρία για τον πελάτη και στη διαμόρφωση αξιών, όπως η

εμπιστοσύνη και η πιστότητα, οι οποίες αναμφίβολα συνεισφέρουν τα μέγιστα στη

διατήρηση της πελατειακής βάσης.

3.2.1 Αναγκαιότητα του CRM

To CRM συγκεντρώνει πληροφορίες από όλες τις πηγές δεδομένων ενός οργανισμού

και πολλές φορές και έξω από αυτόν για να δημιουργήσει μια σφαιρική εικόνα για

καθένα πελάτη σε πραγματικό χρόνο. Συνδυάζει μεθοδολογία, λογισμικό και

τεχνολογίες, τα οποία εστιάζουν στην αυτοματοποίηση και στη βελτίωση των

επιχειρησιακών διαδικασιών. To CRM στηρίζεται στην εκτεταμένη χρήση βάσεων

δεδομένων. Σε αυτές, η εταιρία τηρεί ένα πλήθος από πληροφορίες οι οποίες

μπορούν να χρησιμοποιηθούν είτε για να αυξήσουν τις πωλήσεις της είτε για να

εξυπηρετηθεί καλύτερα η ήδη υπάρχουσα πελατεία της. Αφορά την ανάλυση της

πληροφορίας σχετικά με τους πελάτες για να ληφθούν επιχειρηματικές αποφάσεις με

στόχο να καταλάβουν οι εταιρείες τις ανάγκες των πελατών τους, να

τμηματοποιήσουν την αγορά, να προβλέψουν την πιθανότητα αποχώρησής τους, να

αναλύσουν την 'αφοσίωση' (loyalty) τους καθώς και τα κέρδη.

Το CRM αρχικά εστιάζει στη δημιουργία στενών σχέσεων με τους πελάτες

επιχειρώντας να αλλάξει τη συμπεριφορά της εταιρίας απέναντι στους πελάτες βάσει

της πληροφορίας που διαθέτει η εταιρία για αυτούς. Αυτό επειδή οι υπάρχοντες

πελάτες αποφέρουν περισσότερα κέρδη από τους νέους πελάτες και επειδή έχει

υψηλό κόστος η προσέλκυση νέων πελατών. Ο απώτερος στόχος του CRM δηλαδή

είναι να αυξήσει το χρόνο παραμονής των πελατών στην εταιρία.

Σελ. 37 από 85

Page 39: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Στη σημερινή άκρως ανταγωνιστική αγορά, με την εγκατάσταση συστημάτων CRM οι

εταιρείες στοχεύουν στη βελτίωση της ευελιξίας τους, της διαδικασίας λήψης

αποφάσεων, της ποιότητας των υπηρεσιών και των προϊόντων καθώς και των

σχέσεων με τους πελάτες ώστε να διασφαλίσουν την 'αφοσίωση' τους. Επίσης

περιμένουν άμεση πρόσβαση στις πληροφορίες για τους πελάτες και

ικανοποιημένους χρήστες του συστήματος καθώς ακόμη αύξηση στα κέρδη και

μείωση στα κόστη.

3.2.2 Οφέλη του CRM

Η επιλογή του CRM πρέπει να είναι στρατηγική και να βασιστεί σε ορθά κριτήρια.

Αυτά περιλαμβάνουν λειτουργικότητα, στρατηγική της εταιρίας, συστήματα

υποστήριξης και την αρχιτεκτονική του συστήματος. Οι νέες τεχνολογίες CRM

διευκολύνουν τη συλλογή, ανάλυση και ροή της σχετικής με τον πελάτη πληροφορίας

στο εσωτερικό της επιχείρησης.

Τα οφέλη που μπορεί να έχει μια επιχείρηση από την εγκατάσταση ενός συστήματος

CRM είναι πολλά. To CRM αυτοματοποιεί κάθε σημείο επαφής της επιχείρησης με

τους πελάτες της, από την προσέλκυση των πελατών μέχρι την βελτίωση των

προϊόντων, τις πωλήσεις, την εξυπηρέτηση και τη διατήρηση των πελατών.

Η επιχείρηση μπορεί να υποστηρίξει και να οργανώσει αποτελεσματικά τις πωλήσεις

της και την προώθηση των προϊόντων/υπηρεσιών της, να κατανοήσει καλύτερα τις

ανάγκες των πελατών της, να διαμορφώσει και να συστηματοποιήσει την επικοινωνία

μαζί τους, να βελτιώσει την παροχή υπηρεσιών και εξυπηρέτησης και να ταξινομήσει

πληροφορίες σχετικές με τον ανταγωνισμό, την αγορά, τα προϊόντα και τις υπηρεσίες.

3.2.3 Παράγοντες επιτυχίας του CRM

Οι εταιρείες πρέπει να είναι σε θέση να αντιληφθούν ποιοι παράγοντες συντελούν

στην επιτυχία ενός συστήματος CRM για να το εγκαταστήσουν αποτελεσματικά. Οι

κύριοι παράγοντες επιτυχίας του CRM περιλαμβάνουν:

Διαδικασία: Το σύστημα CRM πρέπει να έχει σχεδιαστεί βάσει καλά μελετημένων

διαδικασιών. Σημαντικό είναι η εταιρία να διαθέτει διαδικασίες προς

συστηματοποίηση.

Σελ. 38 από 85

Page 40: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Ποιότητα πληροφοριών σχετικές με τους πελάτες: Αυτό συνεπάγεται

αποτελεσματική εκμετάλλευση των πηγών πληροφόρησης.

Υποστήριξη του συστήματος: η εταιρία μπορεί να επωφεληθεί μόνο αν το σύστημα

έχει εγκατασταθεί και υιοθετηθεί επιτυχώς.

Οι επιχειρήσεις κατά τον σχεδιασμό και την εγκατάσταση συστημάτων CRM πρέπει

να εστιάζουν στις ανάγκες τους και όχι στις δυνατότητες της τεχνολογίας και να

ακολουθούν συγκεκριμένη στρατηγική για να εξασφαλίσουν την επιτυχημένη

εγκατάσταση του CRM με όσο το δυνατόν χαμηλότερο κόστος και μικρότερο κίνδυνο.

3.2.4 Αίτια αποτυχίας του συστήματος

Ερευνητές υποστηρίζουν ότι οι εφαρμογές CRM αποτυγχάνουν να αποδώσουν τα

αναμενόμενα αποτελέσματα. Οι ανεπιτυχείς προσπάθειες CRM σε έναν βαθμό

προκύπτουν από την παντελή απουσία ενός ορισμού του όρου από την πλευρά της

επιχείρησης. Σημαντικά λάθη αποτελούν η υλοποίηση του CRM πριν την υιοθέτηση

μιας στρατηγικής πελατών, η εγκατάσταση πριν την ολοκλήρωση των απαιτούμενων

αλλαγών στο εσωτερικό της επιχείρησης. Ένας ακόμη λόγος αποτυχίας είναι η

έλλειψη μεθόδων εγκατάστασης του συστήματος. Επιπλέον οι εφαρμογές CRM δεν

θα πρέπει να εγκαθίστανται μόνο στα τμήματα εκείνα που έρχονται σε άμεση επαφή

με τον πελάτη αλλά και στα άλλα όπως π.χ. η παραγωγή και η τιμολόγηση.

3.2.5 Η σημασία του CRM στον κλάδο των τηλεπικοινωνιών

Πολλές επιχειρήσεις έχουν δημιουργήσει υποδομές για την υιοθέτηση συστήματος

CRM στο επιχειρησιακό τους μοντέλο. Στο μοντέλο McFarlan (Σχήμα 12)

απεικονίζονται οι κλάδοι στους οποίους βρίσκει εφαρμογή το CRM (π.χ. επικοινωνίες,

εκπαίδευση, μεταφορές) με βάση τη στρατηγική σημασία του CRMστην ανάπτυξή

τους.

Σελ. 39 από 85

Page 41: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Μοντέλο McFarlan για την εφαρμογή CRM

CCοα>Ο—

Sk—οο.Εuσ>03Ii—55

Hiah

Lew

Financial δβπκβίφCommunicator φ

, ·

RetaüAftholesale φ φ Utilities */

φ Manufacturing/

Govemmert φ φ λ Transportation

l̂ocation φ

/φ Healthcare

Low High

Propensity to Use External Service Providers

Σχήμα 12: Μοντέλο McFarlanYO την εφαρμογήΟΒΜ

Όπως φαίνεται από το μοντέλο, η εφαρμογή του ΌΡΜείναι στρατηγικής σημασίας

στον κλάδο των επικοινωνιών.

3.3 Μελέτες περιπτώσεων Ελληνικών τηλεπικοινωνιακών εταιριών

Το σύστημα CRM στις εταιρείες τηλεφωνίας μπορεί να περιλάβει όλες τις

δραστηριότητες που αφορούν τον συνολικό κύκλο ζωής των πελατών. Στο Σχήμα 13

παρουσιάζονται οι δραστηριότητες που μπορεί να περιλάβει ένα ολοκληρωμένο

σύστημα CRM στις εταιρείες κινητής και σταθερής τηλεφωνίας.

Σελ. 40 από 85

Page 42: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 13: Ολοκληρωμένο σύστημα CRMσε εταιρίες τηλεφωνίας

3.3.1 ΟΤΕ

Με την απελευθέρωση της τηλεπικοινωνιακής αγοράς τον Ιανουάριο του 2001, ο

ΟΤΕ έχασε σημαντικό μερίδιο από την ελληνική αγορά. Σε ένα άκρως ανταγωνιστικό

περιβάλλον, ο ΟΤΕ στοχεύει να γίνει πιο πελατοκεντρικός, πιο αποτελεσματικός και

επικεντρωμένος στην ικανοποίηση των αναγκών των πελατών. Για την επίτευξη

αυτού του στόχου, ένα αποτελεσματικό σύστημα CRM και οι σχετικές υποστηρικτικές

διαδικασίες έπρεπε να σχεδιαστούν ώστε να προσφέρονται στον πελάτη τα

κατάλληλα προϊόντα, τον σωστό χρόνο και να παρακολουθούνται οι αντιδράσεις τους.

Επιπλέον η ανάγκη για αποτροπή της διακοπής συμβολαίων και η πρόθεση για πιο

προσαρμοσμένες στις ατομικές ανάγκες υπηρεσίες, προσδιόρισαν την ανάγκη για

ανάπτυξη βελτιωμένων αναλυτικών διαδικασιών και υποδομών αναφοράς.

Το έργο Αναδιοργάνωσης Επιχειρηματικών Διαδικασιών του Συστήματος Διαχείρισης

Σχέσεων με τον Πελάτη (CRM-BPR) που υλοποιήθηκε από την OTEplus

περιελάμβανε: Αναδιοργάνωση Επιχειρηματικών Διαδικασιών :

• Ανασχεδιασμός των επιχειρησιακών διαδικασιών με βάση το πλαίσιο εργασιών

για τις περιοχές διαδικασιών Πωλήσεις, Διαχείρισης Παραγγελιών, Διαχείρισης

Διεπαφής με τον Πελάτη, Διαχείρισης Βλαβών, Διαχείρισης Παραπόνων,

Σελ. 41 από 85

Page 43: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Λογαριασμών & Εισπράξεων, Διαχείρισης QoS/SLAs, Διατήρησης & Αφοσίωσης,

Διαχείρισης Καμπάνιας (Campaign Management), Παροχής Υπηρεσιών

• Σχεδιασμός λειτουργικών διαδικασιών αποθήκης δεδομένων

• Ανασχεδιασμός των διαδικασιών ανάπτυξης προϊόντος και διαχείρισης του

κύκλου ζωής του

3.3.2 Q Telecom

Η Q Telecom δραστηριοποιείται στο χώρο των τηλεπικοινωνιών παρέχοντας

ολοκληρωμένες υπηρεσίες κινητής τηλεφωνίας. Η εταιρία στηρίζει την επιτυχία των

προσφερόμενων υπηρεσιών στην ποιότητα και την ανταγωνιστικότητά τους, στην

αξιοποίηση νέων τεχνολογιών, καθώς και στην απλούστευση των διαδικασιών

υποστήριξης. Το όραμα της εταιρίας είναι να τοποθετήσει τον πελάτη στο επίκεντρο

των ενεργειών της. Επιθυμεί να έχει ένα δίκτυο προσαρμοσμένο στις απαιτήσεις και

τις επιλογές του πελάτη, με υπηρεσίες, χρεώσεις και προνόμια τέτοια που να

ανταποκρίνονται στις ιδιαίτερες ανάγκες του καθενός.

3.3.2.1 Αποτύπωση της κατάστασης πριν την εφαρμογή CRM

Η βασικότερη ανάγκη που ώθησε την εταιρία να λάβει την απόφαση για την

εφαρμογή του συστήματος CRM ήταν αυτή της αποτελεσματικής επικοινωνίας με τον

πελάτη και η καταγραφή όλων των ενεργειών που άπτονται της επαφής με αυτόν,

όπως αλλαγές στοιχείων, παραμετροποίηση καρτέλας, ενεργοποίηση υπηρεσιών, με

δυνατότητα πλήρους αναφοράς (reporting).

3.3.2.2 Το όραμα της εταιρίας για το CRM

To CRM, αποτελεί για την εταιρία ένα επικοινωνιακό όπλο, ένα interface και

εντάσσεται στην αποστολή της σαν υποστηρικτικό εργαλείο. Η φιλοσοφία που

διαπνέει την εταιρία είναι να υπάρχει άμεση ανταπόκριση στα αιτήματα των πελατών

μέσω ενός κεντρικοποιημένου συστήματος.

Σελ. 42 από 85

Page 44: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

3.3.2.3 Αποτελέσματα μετά την εφαρμογή του CRM

Αυτό που ενδιαφέρει κυρίως την εταιρία είναι η επένδυση να αποβεί προς όφελος

του πελάτη. Ο βασικός στόχος της ήταν να χρησιμοποιήσει τις δυνατότητες που της

εξασφαλίζει το CRM, για να προσφέρει καλύτερη ποιότητα υπηρεσιών στον πελάτη

που είναι και το επίκεντρο των επιχειρηματικών της δραστηριοτήτων, μέσω της

βελτίωσης της απόδοσης των υπαλλήλων της και της καλύτερης εκμετάλλευσης της

ροής της πληροφορίας που διαθέτει. Εστίασε στην επικοινωνία με τον πελάτη και στη

βελτίωση της επιχειρηματικής της εικόνας. Το Κέντρο Εξυπηρέτησης Πελατών καθώς

και το Customer Care της εταιρίας έχουν λάβει τιμητικές διακρίσεις και βραβεία.

3.3.3 Wind

Είναι η πρώτη εταιρία που δημιουργήθηκε στο χώρο της κινητής τηλεφωνίας. Η

εταιρία ξεκίνησε τη δραστηριότητά της στην ελληνική αγορά με την εμπορική

επωνυμία TELESTETo 1993, οπότε και πραγματοποιήθηκε η πρώτη κλήση από

κινητό στην Ελλάδα.

3.3.3.1 Αποτύπωση της κατάστασης πριν την εφαρμογή CRM

Ο έντονος ανταγωνισμός και η προσπάθεια της εταιρίας να δώσει κάτι διαφορετικό

στους πελάτες την οδήγησαν στην ανάγκη να εγκαταστήσει σύστημα CRM. Η

διοίκηση της εταιρίας ενδιαφέρθηκε από την αρχή για το σύστημα και το υποστήριξε.

Η εταιρία πραγματοποίησε μεγάλη επένδυση με μακροπρόθεσμο ορίζοντα και οι

επενδύσεις σε CRMθεωρήθηκαν επενδύσεις υποδομής.

3.3.3.2 Το όραμα της εταιρίας για το CRM

Το όραμα για το CRMήταν η μετάβαση από το προϊόν στον πελάτη. Η εταιρία είναι

πλέον customer-oriented^ όχι product-oriented αναγνωρίζοντας έτσι ότι τα

πολυτιμότερα περιουσιακά της στοιχεία είναι όσα αφορούν τους πελάτες της.

Σελ. 43 από 85

Page 45: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

3.3.3.3 Αποτελέσματα μετά την εφαρμογή CRM

To CRM στην TIM ξεκίνησε δυναμικά, όμως κατόπιν αφενός με τα επιπρόσθετα

κόστη που επέφερε και αφετέρου με τις επιπλοκές που προκάλεσε, είχε επίδραση

στην οργανωτική λειτουργία της εταιρίας. Στις τηλεπικοινωνίες, λόγω της φύσης τους,

η εισαγωγή του CRM αποτελεί την εισαγωγή ενός ακόμη συστήματος, ή καλύτερα

μιας πλατφόρμας. Χρειάζεται να γίνει ενοποίηση όλων των συστημάτων και αυτό

είναι μεγάλο τεχνολογικό όφελος, διότι με την ενοποίηση των συστημάτων

επιτυγχάνεται πλήρης γνώση του πελάτη. Το τμήμα του Customer Service

ωφελήθηκε περισσότερο, εκεί έχει πιο σταθερή εφαρμογή και παρουσιάζει καλύτερες

προοπτικές καθώς και μεγάλα περιθώρια βελτίωσης.

Σελ. 44 από 85

Page 46: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 4

Νευρωνικά Δίκτυα

4.1 Εισαγωγή

Σε αυτό το κεφάλαιο θα γίνει μια ιστορική αναδρομή για τα νευρωνικά δίκτυα, για το

πώς ξεκίνησαν, πώς αναπτύχθηκαν και τι δυσκολίες υπήρχαν. Έπειτα θα

περιγράψουμε τι είναι τα νευρωνικά δίκτυα, από τι αποτελούνται και θα

παρουσιάσουμε τον τρόπο που λειτουργούν και το πώς γίνεται η εκπαίδευσή τους.

4.2 Ιστορική αναδρομή

Τα νευρωνικά δίκτυα είναι χρήσιμα εργαλεία τα οποία έχουν μία πληθώρα από

σύγχρονες εφαρμογές σε όλους τους τομείς της ζωής. Η ανάπτυξη των νευρωνικών

δικτύων πέρασε από πολλές φάσεις και εξελίξεις. Έρευνες πάνω στα νευρωνικά

δίκτυα είχαν ήδη αρχίσει στα τέλη του 19ου αιώνα, ως μία προσπάθεια να περιγραφεί

ο τρόπος λειτουργίας του ανθρώπινου εγκεφάλου.

4.2.1 Πως ξεκίνησαν

Το πρώτο μοντέλο νευρωνικού δικτύου το οποίο προτείνει ότι οι νευρώνες είναι η

βασική μονάδα του δικτύου παρουσιάσθηκε το 1943 από τον νευροφυσιολόγο

Warren McCulloch και τον μαθηματικό Walter Pitts. Δημοσίευσαν μια εργασία για τον

τρόπο λειτουργίας των νευρώνων. Με σκοπό την περιγραφή του τρόπου λειτουργίας

των νευρώνων του εγκεφάλου, μοντελοποίησαν ένα απλό νευρωνικό δίκτυο

χρησιμοποιώντας ηλεκτρικά κυκλώματα που μπορούσαν να εκτελέσουν

υπολογιστικές εργασίες (computational tasks). Η δουλειά τους αναγνωρίζεται ότι

αποτέλεσε την αρχή για το πεδίο των νευρωνικών δικτύων.

Το 1947 προχώρησαν σε πιο εξελιγμένο πρότυπο για την αναγνώριση σχημάτων. Το

πρότυπο αυτό περιέχει πολλά χαρακτηριστικά από τα μεταγενέστερα πρότυπα. Ο

νευρώνας θεωρείται ότι μπορεί να έχει δύο μόνον καταστάσεις: α) να δέχεται πολλές

εισόδους και β) να δίνει μία μόνον έξοδο. Οι έξοδοι από διαφορετικούς νευρώνες δεν

επιτρέπεται να ενώνονται, αλλά πρέπει υποχρεωτικά να οδηγούν σε είσοδο άλλου

νευρώνα. Οι απολήξεις των νευρώνων είναι δύο ειδών: διεγερτικές και ανασταλτικές.

Σελ. 45 από 85

Page 47: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Οι δύο καταστάσεις του νευρώνα είναι ότι είτε πυροδοτεί ή βρίσκεται σε ηρεμία. Η

ροή της πληροφορίας μέσα στον νευρώνα ελέγχεται από πύλες, οι οποίες επίσης

είναι διεγερτικές ή ανασταλτικές. Όταν ο νευρώνας πυροδοτεί, στέλνει ένα παλμό. Οι

λειτουργίες αυτές πάντα γίνονται σε διακριτό χρόνο και υποτίθεται ότι όλοι οι

νευρώνες αποκρίνονται ταυτόχρονα, δηλ. το σύστημα δρα συγχρονισμένα.

Η επόμενη μεγάλη ανάπτυξη πάνω στα νευρωνικά δίκτυα, ήρθε το 1949 με την

έκδοση του βιβλίου του Hebb με τίτλο “The Organization of Behavior”, στο οποίο

έγινε για πρώτη φορά μια ιδιαίτερη δήλωση ενός φυσιολογικού κανόνα μάθησης για

συναπτικές τροποποιήσεις.

Ο κανόνας αυτός λέει ότι κάθε φορά που το δίκτυο χρησιμοποιεί τις νευρωνικές του

συνδέσεις, οι συνδέσεις αυτές ενισχύονται και το δίκτυο πλησιάζει περισσότερο στο

να μάθει το πρότυπο το οποίο παρουσιάζεται. Όταν ο νευρώνας i επανειλημμένα

διεγείρει τον νευρώνα j, τότε συμβαίνει να αναπτύσσεται μια μεταβολική σύνδεση

στον ένα ή και στους δύο νευρώνες, έτσι ώστε η απόδοση του φαινομένου (το i

διεγείρει το j) να αυξάνεται. Αν Wj είναι το βάρος της σύνδεσης μεταξύ i και j, x, η

είσοδος στον νευρώνα j από τον νευρώνα i, Xj η έξοδος του νευρώνα j, τότε ισχύει ότι:

Wjj(new) = Wij(old) + a x x

Εδώ a είναι μία θετική σταθερά που λέγεται παράμετρος του ρυθμού εκπαίδευσης.

Το νέο λοιπόν βάρος Wj θα είναι ίσο με το παλαιό ενισχυμένο κατά μία ποσότητα

axiXj. Ο κανόνας αυτός έχει τοπικό χαρακτήρα, ισχύει δηλαδή μόνο για την σύνδεση

του νευρώνα i και j και όχι για άλλες συνδέσεις του δικτύου.

Καθώς, οι υπολογιστές εξελίσσονταν στη δεκαετία του 1950, ήταν εφικτή η

προσομοίωση ενός υποθετικού νευρωνικού δικτύου. Τα πρώτα βήματα προς αυτή

την κατεύθυνση έγιναν από τον Nathanial Rochester που εργαζόταν στα ερευνητικά

εργαστήρια της IBM. Δυστυχώς, για τον ίδιο, η πρώτη του αυτή προσπάθεια απέτυχε,

αλλά μετέπειτα εγχειρήματα ήταν επιτυχή. Ήταν η περίοδος που άνθιζαν οι κλασικοί

υπολογιστές, παραμελώντας την έρευνα για τα νευρωνικά δίκτυα. Το 1952

εκδόθηκε το βιβλίο του Ashby με τίτλο “Design for a Brain: The Origin of Adaptive

Behavior”, το οποίο εστίασε στο ότι η συμπεριφορά δεν είναι έμφυτη αλλά μαθαίνεται.

Το 1954, ο Minsky έγραψε τη διδακτορική του διατριβή με τίτλο “Theory of Neural-

Analog Reinforcement Systems and Its Application to the Brain-Model Problem” και

το 1961 ο ίδιος έγραψε μια εργασία με τίτλο “Steps Toward Artificial Intelligence”. Την

ίδια χρονιά, η ιδέα των μη γραμμικών προσαρμοζόμενων φίλτρων προτάθηκε από

Σελ. 46 από 85

Page 48: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

τον Gabor, πρωτοπόρο στη θεωρία επικοινωνιών και εφευρέτη του ολογραφήματος,

που υλοποίησε μια μηχανή στην οποία η μάθηση επιτυγχάνονταν με

τροφοδότηση δειγμάτων στοχαστικών διαδικασιών στη μηχανή, μαζί με τη

συνάρτηση-στόχο, την οποία ήταν αναμενόμενο να παράγει η μηχανή.

Το 1956, το Dartmouth Summer Research Project on Artificial Intelligence έδωσε

ώθηση στην τεχνητή νοημοσύνη και στα νευρωνικά δίκτυα. Η εργασία των Rochester,

Holland, Habit και Duda είναι ίσως η πρώτη προσπάθεια για εξομοίωση με τη χρήση

υπολογιστή ώστε να ελεγχθεί μια καλά σχηματισμένη νευρωνική θεωρία βασισμένη

στον κανόνα μάθησης του Hebb. Τον ίδιο χρόνο ο Uttley παρουσίασε την

αποκαλούμενη “διαρρέουσα ολοκλήρωση” ή “νευρώνα φωτιάς” που αργότερα

παρουσιάστηκε κι από τον Caianielo. Το ιδιαίτερο επίτευγμα ήταν το

αποκαλούμενο θεώρημα σύγκλισης αισθητηρίου (perceptron convergence theorem),

σύμφωνα με το οποίο έχει την ικανότητα να μάθει να ταξινομεί σωστά κάθε γραμμικά

διαχωρίσιμο σύνολο εισόδων.

4.2.2 Πρώτες εφαρμογές

Η πρώτη πρακτική εφαρμογή των νευρωνικών δικτύων παρουσιάστηκε στα τέλη της

δεκαετίας του ’50 με την εφεύρεση του μοντέλου του αισθητήρα (perceptron) και του

συσχετισμένου κανόνα μάθησης από τον Frank Rosenblatt. Το μοντέλο αυτό είναι

πολύ απλό. Έχει μόνο δύο επίπεδα, αυτά της εισόδου και της εξόδου. Το σήμα

προχωρά μονοδρομικά από την είσοδο στην έξοδο. Αργότερα αποκαλύφθηκε ότι το

perceptron μπορούσε να επιλύσει μόνο μια περιορισμένη κατηγορία προβλημάτων.

Το 1960, οι Bernard Widrow και Marcian Hoff από το πανεπιστήμιο του Stanford,

παρουσίασαν τον αλγόριθμο ελάχιστου μέσου τετραγώνου (least mean square -

LMS), ο οποίος χρησιμοποιείται ακόμη και σήμερα για την εκπαίδευση των

νευρωνικών δικτύων. Ο συγκεκριμένος κανόνας εκμάθησης εφαρμόστηκε για την

εκπαίδευση των προσαρμόσιμων γραμμικών νευρωνικών δικτύων (adaptive linear

neural networks), που ήταν παρόμοια στη δομή με το αισθητήριο (perceptron) που

πρότεινε ο Rosenblatt, αλλά η διαφορά τους ήταν στον τρόπο μάθησης. Τα μοντέλα

αυτά ονομάζονταν “ADALINE” και “MADALINE”. Το ADALINE αναπτύχθηκε για την

αναγνώριση δυαδικών προτύπων, ούτως ώστε όταν αυτό χρησιμοποιήθηκε στην

ανάγνωση ροής bits από μια τηλεφωνική γραμμή, μπορούσε να προβλέψει το

επόμενο bit. Το MADALINE ήταν το πρώτο νευρωνικό δίκτυο που εφαρμόστηκε σε

Σελ. 47 από 85

Page 49: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

πρόβλημα του πραγματικού κόσμου. Ήταν ένα προσαρμόσιμο φίλτρο (adaptive filter)

που εξάλειφε την ηχώ από τις τηλεφωνικές γραμμές.

Input Simple ADALINE

'^ > [Σ Κ + Ε £ Κ >

a = ρ ureitn (ΛΥ ρ+σ)

Layer cf LinearNéuioiïS Input Layer o f Linear N étironsinput

r^\ r r ̂ r

a= ΙΙΙΙΠΊΙΙΙ M|> « bi>i I I CT

Where R - numberofelements ininput vector

$ - num berofa=iitirelmiWp*b) neurons, in layer

Σχήμα 14: Πάνω μοντέλο Adeline, κάτω μοντέλο Madaline

Το 1972, ο Teuvo Kohonen και ο James Anderson, ανεξάρτητα ο ένας από τον άλλο,

ανέπτυξαν νέα παρόμοια νευρωνικά δίκτυα, που μπορούσαν να δράσουν σαν

μνήμες. Και οι δύο χρησιμοποίησαν μαθηματικούς πίνακες για να περιγράψουν την

ιδέα τους, αλλά δεν αντιλήφθηκαν ότι δημιουργούσαν έναν πίνακα με αναλογικά

ADALINE κυκλώματα. Οι νευρώνες υποτίθεται ότι ενεργοποιούσαν ένα σύνολο

εξόδων αντί για μια μόνο έξοδο. Το 1975 αναπτύχθηκε το πρώτο πολυστρωματικό

(multi-layer) δίκτυο, το οποίο ήταν ένα δίκτυο μη επιβλεπόμενης μάθησης. Επίσης,

στο ίδιο διάστημα, ο Stephen Grossberg υπήρξε πολύ δραστήριος στην έρευνα των

αυτοοργανωμένων δικτύων (self-organizing networks).

Το 1982 ο John Hopfield, ο οποίος είναι βιολόγος, παρουσίασε ένα έργο το οποίο

έδωσε μεγάλη ώθηση στην ανάπτυξη των δικτύων. Ο Hopfield έδειξε με αυστηρά

μαθηματική απόδειξη πώς ένα νευρωνικό δίκτυο μπορεί να χρησιμοποιηθεί ως

αποθηκευτικός χώρος (storage device) και πώς επίσης μπορεί ένα δίκτυο να

επανακτήσει όλη την πληροφορία ενός συστήματος έστω και αν του δοθούν μερικά

Σελ. 48 από 85

Page 50: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

τμήματα μόνο και όχι ολόκληρο το σύστημα. Η εργασία αυτή είχε ως αποτέλεσμα την

έμπνευση για πολλές άλλες ιδέες που ακολούθησαν.

Το 1986 δημοσιεύτηκε ένα άλλο σημαντικό έργο από τους McClelland και Rumelhart,

το Parallel Distributed Processing, το οποίο ανοίγει νέους δρόμους στην εκπαίδευση

των νευρωνικών δικτύων. Παρουσιάστηκε η ιδέα πώς ένα νευρωνικό δίκτυο μπορεί

να θεωρηθεί και να χρησιμοποιηθεί ως παράλληλος επεξεργαστής. Πρότειναν μία

νέα διαδικασία εκπαίδευσης, την μέθοδο της οπισθοδιάδοσης (back-propagation), η

οποία κατέληξε να είναι η πιο χρήσιμη σήμερα τεχνική εκπαίδευσης δικτύων.

Το 1988 ο Linsker περιέγραψε μια νέα αρχή για την αυτοοργάνωση σε ένα δίκτυο

αισθητηρίων. Η αρχή αυτή σχεδιάστηκε ώστε να διατηρεί μέγιστη πληροφορία

σχετικά με τα πρότυπα ενεργειών, που υπόκεινται σε περιορισμούς όπως

συναπτικές συνδέσεις και δυναμικές περιοχές σύναψης. Ο Linsker χρησιμοποίησε

αφηρημένες έννοιες πάνω στη θεωρία πληροφοριών ώστε να σχηματίσει την αρχή

της διατήρησης μέγιστης πληροφορίας. Την ίδια χρονιά οι Broomhead και Lowe

περιέγραψαν μία διαδικασία για το σχεδιασμό “προς τα εμπρός

τροφοδότησης”(feedforward) δικτύων χρησιμοποιώντας συναρτήσεις ακτινικής

βάσης(RadialBasisFunctions - RBF), που είναι μια εναλλαγή των πολυεπίπεδων

αισθητηρίων.

Οι νέες αυτές υλοποιήσεις αναζωογόνησαν το πεδίο των νευρωνικών δικτύων. Τα

τελευταία χρόνια, χιλιάδες εργασίες έχουν γραφεί και τα νευρωνικά δίκτυα έχουν βρει

πολλές εφαρμογές. Το πεδίο των νευρωνικών δικτύων έχει να επιδείξει πολλές νέες

θεωρητικές και πρακτικές εργασίες. Παρ’ όλο που είναι δύσκολο να προβλεφθεί η

μελλοντική επιτυχία των νευρωνικών δικτύων, ο μεγάλος αριθμός και η ευρεία

περιοχή εφαρμογών αυτής της νέας τεχνολογίας είναι πολύ ενθαρρυντικά.

4.3 Τι είναι τα νευρωνικά δίκτυα

Τα τεχνητά νευρωνικά δίκτυα (Artificial Neural Networks), ή απλώς νευρωνικά δίκτυα

(Neural Networks) αποτελούν μια σχετικά νέα περιοχή στις φυσικές επιστήμες. Είναι

ένα μαθηματικό μοντέλο για την επεξεργασία πληροφορίας που προσεγγίζει την

υπολογιστική και αναπαραστατική δυνατότητα μέσω συνάψεων. Το μοντέλο είναι

εμπνευσμένο από τα βιοηλεκτρικά δίκτυα που δημιουργούνται στον εγκέφαλο,

ανάμεσα στους νευρώνες (νευρικά κύτταρα) και στις συνάψεις (σημεία επαφής των

νευρικών απολήξεων). Στο μαθηματικό μοντέλο των νευρωνικών δικτύων υπάρχουνΣελ. 49 από 85

Page 51: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

κομβικά σημεία (nodes) στα οποία καταλήγουν συνδέσεις από άλλους κόμβους του

δικτύου, στις οποίες συνήθως αποδίδεται κάποιο βάρος. Τα τεχνητά νευρωνικά

δίκτυα είναι μια ερευνητική περιοχή με έντονο ενδιαφέρον για εφαρμογές στην

Ιατρική.

Οι πρώτες αρχές και λειτουργίες τους βασίζονται και εμπνέονται από το νευρικό

σύστημα των ζώντων οργανισμών (και φυσικά του ανθρώπου), αλλά η μελέτη και η

χρήση τους έχει προχωρήσει πολύ πέρα από τους βιολογικούς οργανισμούς.

Ουσιαστικά δημιουργήθηκε μία νέα περιοχή η οποία έχει αποκοπεί τελείως από την

βιολογία και σήμερα τα νευρωνικά δίκτυα χρησιμοποιούνται για να λύσουν κάθε

είδους προβλήμα με ηλεκτρονικό υπολογιστή.

Σχήμα 15: Νευρωνικό δίκτυο

Δύο ουσιαστικά χαρακτηριστικά των Τεχνητών Νευρωνικών Δικτύων είναι η

ικανότητα προσαρμογής τους και η μη γραμμική συμπεριφορά τους. Το πρώτο

συνεπάγεται ότι ένα ΤΝΔ μπορεί να διαχειριστεί ένα σύστημα βασιζόμενο μόνο στην

παρατηρούμενη συμπεριφορά του, χωρίς να απαιτείται η θεωρητική κατανόησή του.

Αυτό έχει σαν αποτέλεσμα την ανάγκη ύπαρξης ενός ικανού αριθμού δειγμάτων για

το πρόβλημα που καλείται να επιλύσει το ΤΝΔ.

Οι ιδιότητες αυτές σε συνδυασμό με την ικανότητα των ΤΝΔ να επιλύουν

προβλήματα στα οποία τα δεδομένα τους είναι ελλιπή, ή παρουσιάζουν θόρυβο, έχει

συντελέσει ώστε τα νευρωνικά δίκτυα να χρησιμοποιούνται σε ένα μεγάλο εύρος

εφαρμογών, σε περιοχές τόσο διαφορετικές μεταξύ τους όπως τα οικονομικά, η

ιατρική, η επιστήμη των μηχανικών, η γεωλογία και η φυσική. Στην πραγματικότητα,

Σελ. 50 από 85

Page 52: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

οπουδήποτε υπάρχουν προβλήματα πρόβλεψης, ταξινόμησης ή ελέγχου, τα ΤΝΔ

μπορούν εισαχθούν και να χρησιμοποιηθούν.

Τα νευρωνικά δίκτυα χωρίζονται σε δύο κατηγορίες: βιολογικά νευρωνικά δίκτυα και

τεχνητά νευρωνικά δίκτυα.

4.3.1 Βιολογικά νευρωνικά δίκτυα

Τα ΒΝΔ αποτελούν συστήματα εμπνευσμένα από τη δομή και τη λειτουργία του

ανθρώπινου εγκεφάλου, με αποτέλεσμα να κρίνεται απαραίτητη η παρουσίαση των

κυριότερων χαρακτηριστικών που αποτελούνται από πραγματικούς βιολογικούς

νευρώνες, που συνδέονται με το περιφερειακό ή το κεντρικό νευρικό σύστημα.

Πρόκειται για ομάδες νευρώνων που συνάπτονται μεταξύ τους σχηματίζοντας ένα

δίκτυο επικοινωνιών. Το νευρικό σύστημα διαιρείται ανατομικά σε δύο τμήματα, το

Κεντρικό Νευρικό Σύστημα (Κ.Ν.Σ.), που αποτελείται από τον εγκέφαλο και το

νωτιαίο μυελό, και το Περιφερικό Νευρικό Σύστημα (Π.Ν.Σ), που περιλαμβάνει τα

νευρικά κύτταρα που βρίσκονται εκτός εγκεφάλου και νωτιαίου μυελού και είναι τα

νεύρα που εισέρχονται ή εξέρχονται από το Κ.Ν.Σ.

Ο ανθρώπινος εγκέφαλος αποτελεί το σπουδαιότερο και μεγαλύτερο τμήμα του

Κ.Ν.Σ. είναι ένας πολύπλοκος, μη-γραμμικός και παράλληλος υπολογιστής ο οποίος

αποτελείται από 1012 νευρώνες οι οποίοι σχηματίζουν ένα δίκτυο επικοινωνιών.

Όλοι οι νευρώνες είναι διαφορετικοί μεταξύ τους και δεν υπάρχουν δύο ολόιδιοι

νευρώνες στο μεγάλο αυτό αριθμό. Ένας ενιαίος νευρώνας μπορεί να συνδεθεί με

πολλούς άλλους νευρώνες και ο συνολικός αριθμός νευρώνων και συνδέσεων σε ένα

δίκτυο μπορεί να είναι εξαιρετικά μεγάλος. Πρόκειται για το όργανο του ανθρώπινου

σώματος που αναπτύσσει και χρησιμοποιεί τη νόηση, καθώς και όλα όσα αυτή

συνεπάγεται όπως η ευφυΐα και τα συναισθήματα. Έχει την ιδιότητα να εκτελεί

συγκεκριμένους υπολογισμούς πολύ πιο γρήγορα από τους πιο γρήγορους

ψηφιακούς υπολογιστές που υπάρχουν. Κανένα τεχνητό μοντέλο δεν μπορεί να

προβλέψει ότι έχει σχέση με τα προσωπικά συναισθήματα και τις εμπειρίες, όπως το

ανθρώπινο μυαλό.

Βασικά χαρακτηριστικά του ανθρώπινου εγκεφάλου είναι η αναγνώριση μοτίβων

(pattern recognition), ο συνειρμός, η πολυπλοκότητα και η ανεκτικότητα στο θόρυβο,

ενώ έντονο ερευνητικό ενδιαφέρον παρουσιάζουν λειτουργίες όπως η μνήμη, η

κατάσταση του ύπνου και τα όνειρα. Κατά τη γέννησή του ο εγκέφαλος έχει τηνΣελ. 51 από 85

Page 53: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

ικανότητα να κατασκευάζει τους δικούς του κανόνες, κοινώς “εμπειρία”, η οποία

μεγαλώνει με την πάροδο του χρόνου. Κατά τα 2 πρώτα χρόνια ζωής, έχουμε τη

μέγιστη ανάπτυξη, όπου περίπου 1 εκατομμύριο συνάψεις (synapses)

δημιουργούνται στο δευτερόλεπτο.

Μερικά χαρακτηριστικά είναι τα ίδια όπως και στους υπολογιστές, λ.χ. το ηλεκτρικό

σήμα μεταδίδεται με δυαδικό τρόπο ενώ θα περίμενε κανείς ότι ως ηλεκτρικό μέγεθος

θα είχε συνεχείς τιμές. Οι υπολογιστές δεν μας παρέχουν ακριβές υλικό για να

περιγράψουμε τον εγκέφαλο (αν και είναι δυνατόν να περιγραφεί μία λογική

διαδικασία ως ένα υπολογιστικό πρόγραμμα, ή να προσομοιωθεί ένας εγκέφαλος

χρησιμοποιώντας έναν υπολογιστή) αφού δεν κατέχουν τις αρχιτεκτονικές

παράλληλης επεξεργασίας που έχουν περιγραφεί στον εγκέφαλο. Η μελέτη των

τεχνητών νευρωνικών δικτύων υποκινήθηκε άμεσα από την αναγνώριση ότι οι

εγκεφαλικοί υπολογιστές είναι ένας εξ’ ολοκλήρου διαφορετικός δρόμος από τους

συμβατικούς ψηφιακούς υπολογιστές. Τυπικά οι νευρώνες του εγκεφάλου είναι 5-6

τάξεις μεγέθους αργότεροι από τις λογικές πύλες σιλικόνης

Η δομή του νευρώνα

Σχήμα 16: Σχηματική απεικόνιση ενός τυπικου νευρώνα

Ως κύτταρο, ο νευρώνας αποτελείται από το κυρίως σώμα, τον νευράξονα και τους

δενδρίτες. Ο κυρίως κορμός του νευρώνα είναι το σώμα μέσα στο οποίο βρίσκεται ο

πυρήνας του κυττάρου ο οποίος περιέχει όλο το γενετικό υλικό του οργανισμού. Ο

νευράξονας εκφύεται από το κυτταρικό σώμα και εφάπτεται με άλλους νευρώνες. Το

μήκος του μπορεί να είναι πολύ μικρό και μπορεί να φθάσει το ένα μέτρο ή και

περισσότερο. Ο ρόλος του είναι να μεταδίδει σήματα (νευρικές ώσεις) σε άλλους

νευρώνες, δηλαδή να στέλνει τα εξερχόμενα σήματα. Οι δενδρίτες είναι μικρές

Σελ. 52 από 85

Page 54: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

προεκτάσεις του κυτταρικού σώματος που μοιάζουν με διακλαδώσεις δένδρου και

δέχονται τα εισερχόμενα σήματα από άλλους νευρώνες.

Υπάρχουν περίπου 100 διαφορετικές κατηγορίες νευρώνων. Ο αριθμός των

συνάψεων δεν είναι σταθερός, αλλά υπολογίζεται ότι κάθε νευρώνας σχηματίζει 104

συνάψεις. Το όλο σύστημα των νευρωνικών δικτύων αποτελεί το Νευρικό Σύστημα

στον ανθρώπινο οργανισμό. Ένας νευρώνας ενεργοποιείται, όταν το σήμα εισόδου

του γίνεται μεγαλύτερο από μία τιμή θ>0. Αντίστοιχες δομές ακολουθούνται και στα

τεχνητά νευρωνικά δίκτυα.

Οι νευρώνες, ως κύτταρα, πιστεύεται ότι δεν πολλαπλασιάζονται και δεν

αναπαράγονται. Ο ανθρώπινος εγκέφαλος ενός υγιούς ενήλικα χάνει περίπου 103

νευρώνες την ημέρα. Μεγαλύτερος αριθμός αυτών καταστρέφεται από το κάπνισμα,

το αλκοόλ αλλά και την προχωρημένη ηλικία. Η παύση της αναπαραγωγής των

νευρώνων πολύ νωρίς δεν ισχύει και για τις συνάψεις, αλλά συμβαίνει ακριβώς το

αντίθετο. Καθ’ όλη τη διάρκεια ζωής ενός οργανισμού, οι συνάψεις βρίσκονται σε μια

δυναμική ισορροπία, δημιουργούνται καινούριες και καταστρέφονται παλιές. Η

δημιουργία των νέων συνάψεων γίνεται όταν ο εγκέφαλος αποκτά περισσότερες

εμπειρίες από το περιβάλλον. Από την άλλη, οι σοβαρές ασθένειες της

προχωρημένης ηλικίας προέρχονται κυρίως από τη μεγάλη καταστροφή των

συνάψεων στα νευρωνικά δίκτυα του κεντρικού νευρικού συστήματος κι όχι τόσο από

την καταστροφή των νευρώνων.

Η λειτουργία του νευρώνα σε ένα νευρωνικό δίκτυο είναι να λαμβάνει όλα τα σήματα

που έρχονται από τους άλλους νευρώνες ή από εξωτερικά ερεθίσματα, να τα

επεξεργάζεται και να μεταδίδει το επεξεργασμένο σήμα σε άλλους νευρώνες. Η

ακολουθία αυτή συνεχίζεται έτσι ώστε ένα σήμα να μεταδίδεται μέσω ενός τεράστιου

αριθμού νευρώνων προς τον εγκέφαλο και το αντίστροφο. Αναφερόμαστε σε σήματα

ηλεκτρικής μορφής και είναι της τάξης μερικών mvolt. Τα νευρωνικά δίκτυα είναι

εξαιρετικά σύνθετα. Η μεταφορά των ηλεκτρικών σημάτων γίνεται μέσω χημικών

συνάψεων. Στη χημική σύναψη η απελευθέρωση μιας χημικής ουσίας από ένα

νευρώνα, τον νευροδιαβιβαστή, προκαλεί τη δημιουργία δυναμικού ενέργειας και τη

μεταγωγή του ηλεκτρικού σήματος στους δενδρίτες στο κυτταρικό σώμα άλλων

νευρώνων.

Παρόλο ότι ο εγκέφαλος είναι το 2% της μάζας του ανθρώπου, χρησιμοποιεί πάνω

από το 20% του οξυγόνου που παίρνει ο οργανισμός. Η κατανάλωση ενέργειας στον

εγκέφαλο είναι 20 Watt, γεγονός που τον καθιστά πολύ αποδοτικό. Αντίστοιχα, ένας

Σελ. 53 από 85

Page 55: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

υπολογιστής χρειάζεται χιλιάδες Watt. Η μεγάλη αυτή απαίτηση ενέργειας οφείλεται,

πρώτον, στο ότι είναι απαραίτητο να διατηρείται μια ισορροπία στις συνδέσεις των

νευρώνων, η οποία διατηρείται μόνο με σταθερή ανταλλαγή χημικών ουσιών. Και

δεύτερον, στο ότι ο νευρώνας έχει τεράστια επιφάνεια σχετικά με τον όγκο του. Η

μεγάλη αυτή επιφάνεια έχει συνεχείς διαρροές και εισροές που πρέπει να κρατώνται

σε μια ευαίσθητη χημική ισορροπία, πράγμα που απαιτεί μεγάλα ποσά ενέργειας.

Η λειτουργία των νευρώνων

Υπάρχουν δυο δυνατές καταστάσεις στις οποίες μπορεί να βρίσκεται ένας νευρώνας

και τις ονομάζουμε ενεργό και μη-ενεργό κατάσταση. Το ότι ο νευρώνας είναι ενεργός

σημαίνει ότι συμμετέχει στη διαδικασία λήψης και εκπομπής σήματος, ενώ όταν είναι

μη-ενεργός είναι αδρανής. Ενδιάμεσες καταστάσεις δεν υπάρχουν. Ουσιαστικά

πρόκειται για δυαδικό στοιχείο και μοιάζει στο σημείο αυτό με τους ηλεκτρονικούς

υπολογιστές. Όταν ο νευρώνας πυροδοτεί, παράγει ένα ηλεκτρικό σήμα (παλμό),το

οποίο κάθε φορά έχει τα ίδια χαρακτηριστικά και είναι ίδιο για όλους. Η καταγραφή

του παλμού αυτού γίνεται μέσω ενός πολύ λεπτού μικροηλεκτροδίου κοντά σ’ ένα

νευρώνα.

Βρίσκουμε ότι το ηλεκτρικό ρεύμα διατρέχει τον άξονά του και έχει διάρκεια της τάξης

του msec και ένταση της τάξης μερικών mvolt. Το σήμα αυτό ταξιδεύει μέσα στο

νευρωνικό δίκτυο από νευρώνα σε νευρώνα χωρίς να ελαττωθεί καθόλου. Ο

μέγιστος ρυθμός παραγωγής των παλμών είναι περίπου 1000 παλμοί ανά sec.

4.3.2 Τεχνητά νευρωνικά δίκτυα

Μπορούν οι ηλεκτρονικοί υπολογιστές να κάνουν τις ίδιες λειτουργίες με τον

ανθρώπινο εγκέφαλο; Όσο εύκολα κι αν είναι κάποια πράγματα για το μυαλό ή

τουλάχιστον σ' εμάς φαίνονται έτσι, οι υπολογιστές δεν μπορούν να τα κάνουν με

απόλυτη επιτυχία, πράγμα το οποίο βέβαια δεν οφείλεται σε έλλειψη ταχύτητας,

καθώς οι υπολογιστές είναι χιλιάδες φορές πιο γρήγοροι από το μυαλό. Ο λόγος είναι

ότι η δομή των υπολογιστών είναι κατά πολύ διαφορετική από τη δομή του

εγκεφάλου.

Θα μπορούσαμε να φτιάξουμε έναν υπολογιστή με τέτοια εσωτερική δομή που να

μοιάζει με τη δομή του εγκεφάλου; Οι απόπειρες που έχουν γίνει κατά καιρούς απόΣελ. 54 από 85

Page 56: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

τους επιστήμονες για την απάντηση του παραπάνω ερωτήματος οδήγησε σταδιακά

στην κατασκευή των τεχνητών νευρωνικών δικτύων, ΤΝΔ. Τα δυο αυτά είδη δικτύων

διαφέρουν σημαντικά ως προς τη φύση τους, όμως λειτουργούν με τον ίδιο τρόπο ή

μάλλον τα τεχνητά μιμούνται τις ιδιότητες των βιολογικών. Δηλαδή «μαθαίνουν», με

την εξάσκηση και την εμπειρία, όπως ακριβώς και οι άνθρωποι, αλλά οι υπολογιστές

ακολουθούν αναγκαστικά ορισμένους προκαθορισμένους κανόνες.

Τα τεχνητά νευρωνικά δίκτυα είναι παράλληλα κατανεμημένα υπολογιστικά

συστήματα, αποτελούνται από διασυνδέσεις τεχνητών νευρώνων και έχουν την

ικανότητα να χρησιμοποιούν αποθηκευμένη εμπειρική γνώση. Είναι σχεδιασμένα να

μοντελοποιούν (ή να μιμηθούν) μερικές ιδιότητες των βιολογικών νευρωνικών

δικτύων. Μπορούν να χρησιμοποιηθούν για να μοντελοποιήσουν τους τρόπους

λειτουργίας των βιολογικών νευρωνικών δικτύων.

Αποκαλούνται επίσης διασυνδεδεμένα συστήματα (connectionist systems),

παράλληλα κατανεμημένα συστήματα (parallel distributed systems) ή προσαρμόσιμα

συστήματα (adaptive systems) λόγω του παράλληλου τρόπου λειτουργίας των

μονάδων επεξεργασίας. Στα Τεχνητά Νευρωνικά Δίκτυα δεν υπάρχει κεντρικός

έλεγχος με την κλασική μορφή, καθώς όλες οι διασυνδεδεμένες μονάδες

επεξεργασίας τροποποιούνται ή “προσαρμόζονται” ταυτόχρονα με τη ροή της

πληροφορίας και τους κανόνες που επικρατούν.

Η υπολογιστική ισχύς ενός ΤΝΔ προκύπτει από τη συμπαγή παράλληλη

κατανεμημένη δομή του και από την ικανότητά του να μαθαίνει και εν συνεχεία να

γενικεύει, παράγοντας λογικά αποτελέσματα για δεδομένα που δεν είχε

αντιμετωπίσει κατά τη διαδικασία μάθησης. Τα πιο σημαντικά χαρακτηριστικά των

τεχνητών νευρωνικών δικτύων είναι:

1. Μη-γραμμικότητα (non-linearity). Ένας νευρώνας είναιμια μη-γραμμική μονάδα

επεξεργασίας και ως εκ τούτου, ένα νευρωνικό δίκτυο που αποτελείται

απόδιασυνδεδεμένους νευρώνες παρουσιάζειμη-γραμμική συμπεριφορά. Αυτό το

χαρακτηριστικό δίνει τη δυνατότητα στα ΤΝΔ να υπολογίζουν μη-γραμμικές

συναρτήσεις και να εκτελούν πολύπλοκους μετασχηματισμούς στα δεδομένα τους.

2. Προσαρμοστικότητα (Adaptability, adaptation). Τα ΤΝΔ έχουν την ικανότητα να

μαθαίνουν μέσω παραδειγμάτων. Μπορούν να ανακαλύπτουν συσχετίσεις μεταξύ

των δεδομένων εισόδου και των αντίστοιχων επιθυμητών αποτελεσμάτων,

προσαρμόζοντας τις παραμέτρους τους, στις αλλαγές του περιβάλλοντός τους. Η

Σελ. 55 από 85

Page 57: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

προσαρμοστικότητα καθιστά ικανό ένα σύστημα να αναζητά τη βέλτιστη απόδοση,

αλλά τα προσαρμόσιμα συστήματα παρουσιάζουν δυσκολία να ανταποκρίνονται με

έναν επαναληπτικό τρόπο σε απόλυτες ποσότητες, με αποτέλεσμα μερικές φορές να

παρατηρείται μείωση της απόδοσής τους.

3. Γενίκευση (Generalization). Τα νευρωνικά δίκτυα δεν απομνημονεύουν τα

δεδομένα που χρησιμοποιήθηκαν για την εκπαίδευσή τους, αλλά ανακαλύπτουν

θεμελιώδεις σχέσεις, ώστε να μπορούν να γενικεύουν από το σύνολο εκπαίδευσης

σε νέα δεδομένα.

4. Ανοχή σε σφάλματα (Fault Tolerance) ή Ευρωστία (R obustness)^

νευρωνικά δίκτυα παρουσιάζουν ανοχή τόσο σε φυσικές βλάβες όσο και στην

ύπαρξη θορύβου στα δεδομένα. Αυτό έχει σαν αποτέλεσμα να μειώνεται,

ενδεχομένως, η απόδοσή τους κάτω από αντίξοες λειτουργικές συνθήκες, χωρίς

όμως να διακόπτεται η εργασία που επιτελούν. Αυτό είναι χρήσιμο χαρακτηριστικό,

επειδή τα δεδομένα που χρησιμοποιούνται από το νευρωνικό δίκτυο, συνήθως,

περιέχουν θόρυβο.

5. Υλοποίηση σε VLSI . Η συμπαγής παράλληλη φύση των νευρωνικών δικτύων,

κάνει δυνατή την υλοποίηση τους σε συστήματα VLSI(Very Large Scale Integration)

τεχνολογίας, έτσι ώστε τα ΤΝΔ να μπορούν να χρησιμοποιηθούν σε εφαρμογές

πραγματικού χρόνου.

6. Αναλογία με Νευροβιολογία. Ο σχεδιασμός των νευρωνικών δικτύων γίνεται σε

αναλογία με τον εγκέφαλο. Οι νευροβιολόγοι βλέπουν τα νευρωνικά δίκτυα σαν

αντικείμενο έρευνας για την εξήγηση νευροβιολογικών φαινομένων.

Ένα απλό νευρωνικό δίκτυο

Σελ. 56 από 85

Page 58: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Ένα νευρωνικό δίκτυο αποτελείται από ένα αριθμό στοιχείων, τους νευρώνες. Σε

κάθε νευρώνα καταφθάνει ένας αριθμός σημάτων, τα οποία έρχονται ως είσοδος σ’

αυτόν. Ο νευρώνας έχει μερικές πιθανές καταστάσεις στις οποίες μπορεί να βρεθεί η

εσωτερική δομή του που δέχεται τα σήματα εισόδου και τέλος, έχει μία μόνον έξοδο,

η οποία είναι συνάρτηση των σημάτων εισόδου. Κάθε σήμα που μεταδίδεται από ένα

νευρώνα σε ένα άλλο μέσα στο νευρωνικό δίκτυο συνδέεται με την τιμή βάρους w, η

οποία υποδηλώνει πόσο στενά είναι συνδεδεμένοι οι δύο νευρώνες που συνδέονται

με το βάρος αυτό.

Η σημασία του βάρους είναι όπως ακριβώς είναι και ο χημικός δεσμός ανάμεσα σε

δύο άτομα που απαρτίζουν ένα μόριο. Ο δεσμός μας δείχνει πόσο δυνατά είναι

συνδεδεμένα τα δύο άτομα του μορίου. Έτσι και ένα βάρος μας λέει ακριβώς πόσο

σημαντική είναι η συνεισφορά του συγκεκριμένου σήματος στην διαμόρφωση της

δομής του δικτύου για τους δύο νευρώνες τους οποίους συνδέει. Όταν το w είναι

μεγάλο (μικρό), τότε η συνεισφορά του σήματος είναι μεγάλη (μικρή).

Το μοντέλο του τεχνητού νευρώνα

Ένας νευρώνας είναι μια μονάδα επεξεργασίας πληροφορίας, που είναι θεμελιακή

για την λειτουργία ενός νευρωνικού δικτύου. Τα τρία βασικά στοιχεία αυτού του

μοντέλου είναι :

1. Ένα σύνολο από συνάψεις ή συνδετικούς κρίκους, κάθε μια από τις οποίες

χαρακτηρίζεται από ένα βάρος” ή “δύναμη”.

2. Έναν αθροιστή για την πρόσθεση των σημάτων εισόδου, που παίρνουν βάρος

από την αντίστοιχη σύναψη. Αυτές οι λειτουργίες αποτελούν το γραμμικό συνδυαστή.

3. Μια συνάρτηση ενεργοποίησης για τη μείωση του εύρους της εξόδου του νευρώνα.

Το μοντέλο επίσης περιλαμβάνει ένα εξωτερικά εφαρμοζόμενο κατώφλι θk, που έχει

επίδραση στην ελάττωση της εισόδου στην εφαρμοζόμενη συνάρτηση

ενεργοποίησης, που ακολουθεί. Στην βιβλιογραφία, το κατώφλι αναφέρεται και σαν

μεροληψία (bias).

Σελ. 57 από 85

Page 59: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Η μετάδοση του σήματος μέσα στο νευρωνικό δίκτυο

Ας δούμε με περισσότερες λεπτομέρειες με ποιο τρόπο μεταδίδεται το σήμα από

νευρώνα σε νευρώνα, μέσα στο νευρικό σύστημα. Ουσιαστικά γίνεται αυτό που

αναφέρθηκε παραπάνω, ότι όλα τα σήματα που φθάνουν σε ένα νευρώνα

αθροίζονται, υπόκεινται σε μια επεξεργασία, παράγεται ως αποτέλεσμα μια έξοδος κι

αυτό είναι το σήμα που μεταδίδεται περαιτέρω στους επόμενους νευρώνες. Η

θεώρηση αυτή είναι γενική και ισχύει πάντοτε, αυτό όμως που αλλάζει είναι η

διαδικασία η οποία δεν είναι πάντα η ίδια. Υπάρχουν βασικά δυο τρόποι με τους

οποίους γίνεται η μετάδοση αυτή.

Ο πρώτος τρόπος είναι δυαδικός. Στην περίπτωση αυτή ένας νευρώνας μπορεί να

βρεθεί σε μια από δυο ενδεχόμενες καταστάσεις: να είναι ενεργός ή αδρανής. Όταν

ένας νευρώνας δέχεται διάφορα σήματα την ίδια στιγμή, τότε υπολογίζει μια

ποσότητα χ, η οποία πρόκειται για το άθροισμα των δεδομένων που φτάνουν σ'

αυτόν και συγκρίνει το υπολογιζόμενο αποτέλεσμα με την τιμή κατωφλίου του θ , η

οποία είναι σταθερή και ορισμένη από την αρχή για αυτόν το νευρώνα. Αν η τιμή της

ποσότητας είναι μεγαλύτερη από την τιμή κατωφλίου, τότε λέμε ότι ο νευρώνας

ενεργοποιείται. Αν όμως είναι μικρότερη, τότε ο νευρώνας παραμένει αδρανής,

δηλαδή στη δεδομένη στιγμή δεν μεταδίδει κανένα περαιτέρω σήμα στο υπόλοιπο

δίκτυο. Επειδή ο νευρώνας εδώ δρα ως δυαδικό στοιχείο, η έξοδός του f(x) θα είναι 1

όταν είναι ενεργοποιημένος και 0 όταν είναι αδρανής.

Ο δεύτερος τρόπος εξετάζει το ενδεχόμενο να μην υπάρχει χαρακτηριστική τιμή

κατωφλίου. Σ' αυτή την περίπτωση, το εισερχόμενο σήμα χ υπόκειται επεξεργασία

μέσω μιας συνάρτησης η οποία αποκαλείται «συνάρτηση μεταφοράς» (transfer

function) ή «συνάρτηση ενεργοποίησης» (activation function).

Εκπαίδευση νευρωνικού δικτύου

Τα νευρωνικά δίκτυα αποτελούν μια διαφορετική μέθοδο για την ανάλυση δεδομένων

και την αναγνώριση προτύπων από τις συμβατικές μεθόδους. Τα νευρωνικά δίκτυα

επεξεργάζονται τις πληροφορίες με τρόπο παρόμοιο με αυτόν του ανθρώπινου

εγκεφάλου. Καθώς τα ΤΝΔ “μαθαίνουν μέσω παραδειγμάτων”, αποτελούν πολύ

ελκυστική τεχνική σε εφαρμογές που παρατηρείται ελάχιστη ή ανολοκλήρωτη

κατανόηση του προς επίλυση προβλήματος εντούτοις, υπάρχουν διαθέσιμα

δεδομένα για την προσαρμογή τους.Σελ. 58 από 85

Page 60: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Στα τεχνητά νευρωνικά δίκτυα (ΤΝΔ), οι λεγόμενες είσοδοι και έξοδοι (inputs -

outputs) σημαίνουν κάποια σήματα τα οποία έχουν αριθμητικές τιμές, λ.χ. θα

μπορούσαν να είναι δυαδικοί αριθμοί αποτελούμενοι από 0 και 1. Οι αριθμοί αυτοί

που δίνονται στην είσοδο του δικτύου ορίζουν κάποιο πρότυπο το οποίο θα

χρησιμοποιήσει το δίκτυο για την εκπαίδευσή του. Για ένα πρόβλημα μπορεί να

απαιτούνται πολλά πρότυπα. Σε κάθε πρότυπο αντιστοιχεί και μια σωστή απάντηση,

η οποία είναι το σήμα που πρέπει να πάρουμε στην έξοδο ή αλλιώς ο στόχος. Η

εκπαίδευση γίνεται με το να παρουσιάσουμε μια ομάδα από τέτοια πρότυπα στο

δίκτυο, αντιπροσωπευτικά ή παρόμοια μ’ αυτά που θέλουμε να μάθει το δίκτυο. Αυτό

σημαίνει ότι δίνουμε στο δίκτυο ως εισόδους κάποια πρότυπα για τα οποία ξέρουμε

ποια πρέπει να είναι η έξοδος, ο στόχος. Ουσιαστικά είναι σαν να δίνουμε στο δίκτυο

μια ερώτηση και ακολούθως να του δίνουμε την απάντηση.

Γενικά μπορούμε να πούμε ότι κατά την εκπαίδευση ενός ΤΝΔ οι αλλαγές στα βάρη

γίνονται με έναν από τους παρακάτω τρόπους:

• με εποπτευόμενο τρόπο

• με μη-εποπτευόμενο τρόπο (ή αυτό-εποπτευόμενο)

Η διαφορετικότητα των δυο παραπάνω έγκειται στο κατά πόσο επεμβαίνει ο

ανθρώπινος παράγοντας. Η εποπτευόμενη μάθηση είναι και η πιο συχνή. Η

διαδικασία που ακολουθούμε είναι ίδια. Αρχικά δίνουμε τις τιμές των εισόδων και

εξόδων που πρέπει να μάθει το δίκτυο, δηλαδή παρουσιάζουμε τα πρότυπα,

ξεκινώντας με τυχαίες τιμές στα βάρη w. Κατά τη διαδικασία εκπαίδευσης το ΤΝΔ

διορθώνει τις τιμές αυτές ανάλογα με το σφάλμα (διαφορά εξόδου από

στόχο).Σκοπός μας είναι τελικά να ελαχιστοποιήσουμε το σφάλμα μετά από

διαδοχικές αλλαγές των βαρών (ανακυκλώσεις διορθώσεων). Μερικές φορές η

διαδικασία αυτή μπορεί να απαιτεί μεγάλο πλήθος τέτοιων διορθώσεων και,

επομένως, μεγάλους υπολογιστικούς χρόνους.

Στη μη-εποπτευόμενη εκπαίδευση, απλώς δίνουμε την πληροφορία στο δίκτυο, αλλά

δεν δίνουμε αντίστοιχους στόχους όπως προηγουμένως κι έτσι δεν γίνεται κανένας

έλεγχος ή σύγκριση για την πορεία του σφάλματος. Το δίκτυο δεν χρησιμοποιεί

κάποια εξωτερική παράμετρο για την αλλαγή των βαρών. Τα πράγματα βέβαια δεν

αφήνονται στην τύχη, υπάρχει συγκεκριμένη διαδικασία που ακολουθείται και

καταλήγει σε εκπαίδευση του δικτύου. Σε όλες τις περιπτώσεις, αντιλαμβανόμαστε τη

Σελ. 59 από 85

Page 61: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

λήξη της διαδικασίας εκπαίδευσης όταν το ΤΝΔ σταματά να αλλάζει τις τιμές των

βαρών. Αυτό συμβαίνει επειδή το σφάλμα στην έξοδο τείνει στο 0.

4.3.3 Σύγκριση βιολογικών και τεχνητών νευρωνικών δικτύων

Είναι λογικό να υπερτερούν σε πρώτη φάση τα βιολογικά ΝΔ ως προς τον αριθμό

των μονάδων των νευρώνων και τις συνδέσεις τους. Ως τάξη μεγέθους είναι πολύ

μεγαλύτεροι από τους αριθμούς μονάδων που μπορεί να χειριστεί εύκολα σήμερα

ένας ηλεκτρονικός υπολογιστής και μάλλον πλησιάζει το ανάλογο των

ατόμων/μορίων στην ύλη (αριθμός Ανο9βεΐΓθ). Είναι λογικό να είναι έτσι τα πράγματα

αν λάβουμε υπόψη μας την πολυπλοκότητα του ανθρώπινου νου και όλες τις

διεργασίες που επιτελεί. Τα ΤΝΔ οπωσδήποτε απέχουν πολύ από το σημείο να

μπορούν να κάνουν πράγματα που ακόμα κι ο εγκέφαλος ενός παιδιού επιτελεί με

μεγάλη ευκολία. Ένα ΤΝΔ μπορεί να έχει μερικές εκατοντάδες ή χιλιάδες νευρώνες,

αλλά όχι την τάξη μεγέθους που έχει ο ανθρώπινος εγκέφαλος. Από την άλλη

πλευρά, τα ΤΝΔ μπορούν να λύσουν δύσκολα προβλήματα για τα οποία ίσως να μην

υπάρχουν συγκεκριμένοι μαθηματικοί τύποι, όπως η αναγνώριση συστήματος, η

πρόβλεψη κ.α.

Επιπλέον, υπάρχουν πολλές άλλες διαφορές, όπως στο ότι οι συνάψεις στα

βιολογικά νευρωνικά δίκτυα είναι πολύ περίπλοκες, ενώ στα ΤΝΔ είναι απλές. Η

συνδεσμολογία, που αφορά τον τρόπο και τον αριθμό των συνδέσεων, είναι επίσης

πολύ πιο περίπλοκη στα πρώτα. Αυτή η διαφορά είναι μάλλον η πιο σημαντική στα

δυο είδη. Ως προς την ταχύτητα όμως οι υπολογιστές έχουν το πλεονέκτημα σε

σχέση με την ταχύτητα διάδοσης του σήματος στους νευρώνες. Παρόλα αυτά, η

διαφορά στην ταχύτητα δεν αρκεί για να καλύψει τη διαφορά στην πολυπλοκότητα.

Στην εικόνα που ακολουθεί βλέπουμε μερικούς οργανισμούς, σχετικά με τον ολικό

αριθμό των συνάψεων των νευρώνων (άξονας χ) ως προς την ταχύτητα με την οποία

μπορούν να αλλάξουν (άξονας γ). Τα ΤΝΔ έχουν μόλις ξεπεράσει το σκουλήκι,

προσπαθούν να φτάσουν τη μύγα αλλά υπολείπονται κατά πολύ του ανθρώπινου

εγκεφάλου. Ενώ ο ανθρώπινος εγκέφαλος μαθαίνει και καταλαβαίνει πολύ γρήγορα,

η μάθηση στο ΤΝΔ παίρνει πολύ χρόνο ακόμα και στον πιο γρήγορο ηλεκτρονικό

υπολογιστή. Τέλος, ο εγκέφαλος μπορεί να κάνει σύγχρονη ή ασύγχρονη ενημέρωση

των μονάδων του (δηλαδή σε συνεχή χρόνο), ενώ το ΤΝΔ κάνει μόνο σύγχρονη

ενημέρωση (δηλαδή σε διακριτό χρόνο).

Σελ. 60 από 85

Page 62: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

10“ <

10“ ά

§10'* κατσαρίδα ■

■§·10 '°·

■ απΧυοία1 10'

σκρυΧήκΛ ■μύγα ■

2F 10*&·:= βδέλλα ■

10*

ΙΟ1·

10°

άνθρωπο; ι

ΙΟ” ΙΟ5 ΙΟ4 10* 10* 10ιβ ΙΟ1*Συνδεσμολογία (συνδέσεις)

10'* ΙΟ1*

Σχήμα 18: Διάγραμμα ταχύτητας

Διάγραμμα της ταχύτητας με την οποία μπορούν να γίνουν οι αλλαγές ως προς τον

ολικό αριθμό συνάψεων σε διάφορους οργανισμούς. Εδώ η ταχύτητα υπονοεί το

πόσο γρήγορα μπορούν να γίνουν οι υπολογισμοί.

4.4 Τοπολογίες νευρωνικών δικτύων

Η τοπολογία ενός νευρωνικού δικτύου εκφράζεται με τον τρόπο που δομούνται οι

νευρώνες του. Κάθε τοπολογία έχει τα δικά της χαρακτηριστικά, τα οποία

παρουσιάζονται παρακάτω.

4.4.1 Επίπεδα νευρωνικού δικτύου

Οι νευρώνες ενός ΤΝΔ κατανέμονται σε επίπεδα ή στρώματα (layers). Ένα

νευρωνικό δίκτυο αποτελείται από τρία επίπεδα: το επίπεδο εισόδου (input layer), το

κρυφό επίπεδο (hidden layer) και το επίπεδο εξόδου (output layer). Το παρακάτω

σχήμα παρουσιάζει τα επίπεδα ενός νευρωνικού δικτύου.

Το επίπεδο εισόδου δέχεται τα δεδομένα από το εξωτερικό περιβάλλον, που θα

τροφοδοτηθούν στο δίκτυο για την επεξεργασία τους. Ο αριθμός των νευρώνων στο

επίπεδο εισόδου ισούται με τον αριθμό των παραμέτρων του προβλήματος.Σελ. 61 από 85

Page 63: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Επίπεδο εισόδου Κρυφά επίπεδα Επίπεδο εξόδου

Σχήμα 19: Τα επίπεδα ενός νευρωνικού δικτύου

Το κρυφό επίπεδο είναι αυτό που παρεμβάλλεται μεταξύ του επιπέδου εισόδου και

του επιπέδου εξόδου και δεν έχει άμεση επαφή με το περιβάλλον. Ένα νευρωνικό

δίκτυο μπορεί να έχει περισσότερα από ένα κρυφά επίπεδα. Το πλήθος των κρυφών

επιπέδων και των νευρώνων κάθε επιπέδου είναι ανάλογο της ικανότητας του

νευρωνικού δικτύου να προσεγγίζει πολύπλοκες λειτουργίες. Όμως, αυτό δε

σημαίνει ότι ένα δίκτυο με πολύπλοκη δομή θα έχει καλύτερη απόδοση, διότι αποκτά

ευαισθησία στο θόρυβο, με αποτέλεσμα να μαθαίνει εκτός από την κύρια λειτουργία

του, το θόρυβο που υπάρχει στα δεδομένα εισόδου. Συνεπώς, υπάρχει μια

αλληλένδετη σχέση μεταξύ της ικανότητας αναπαράστασης των δεδομένων ενός

δικτύου και του θορύβου που το τελευταίο θα ενσωματώσει.

Το επίπεδο εξόδου είναι αυτό που παράγει τα διανύσματα εξόδου του νευρωνικού

δικτύου. Το επίπεδο εξόδου, όπως και το επίπεδο εισόδου είναι αυτά που έρχονται

σε επαφή με το περιβάλλον, για την εμφάνιση των αποτελεσμάτων που προέκυψαν

από την επεξεργασία των ληφθέντων δεδομένων. Οι ζητούμενες πληροφορίες μιας

εφαρμογής είναι αυτές που καθορίζουν τον αριθμό των νευρώνων στο επίπεδο

εξόδου.

Σελ. 62 από 85

Page 64: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Επιπρόσθετα, ανάλογα με το πλήθος των επιπέδων τα νευρωνικά δίκτυα

διακρίνονται σε ενός στρώματος (single-layer) και πολλαπλών στρωμάτων

(multilayer) ή πολυστρωματικά ή πολυ-επίπεδα.

Σελ. 63 από 85

Page 65: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κεφάλαιο 5

Εισαγωγή στο λογισμικό SPSS Clementine

5.1 Εισαγωγή στο Clementine

Όπως έχει ήδη αναφερθεί παραπάνω ο όγκος των δεδομένων που αποθηκεύονται

καθημερινά είναι τεράστιος στον κλάδο των τηλεπικοινωνιών και χωρίς τη χρήση

ειδικευμένων εργαλείων λογισμικού εξόρυξης δεδομένων θα ήταν αδύνατη η

επεξεργασία τους από τους ανθρώπους. Έτσι εμφανίστηκαν εταιρείες παραγωγής

λογισμικού οι οποίες αντιλαμβανόμενες την ανάγκη για γνώση και πληροφόρηση

έφτιαξαν εργαλεία τα οποία καταφέρνουν να ενσωματώσουν πληθώρα τεχνικών και

αλγορίθμων για την αναζήτηση και εξόρυξη γνώσης και κρυμμένης πληροφορίας

από τις βάσεις δεδομένων.

Η SPSS Clementine αποτελεί μία από τις σημαντικότερες εταιρείες στην παραγωγή

λογισμικού εξόρυξης δεδομένων με το λογισμικό Clementine. Το εργαλείο Data

Mining Clementine θεωρείται από τα πιο αξιόπιστα και λειτουργικά εργαλεία

πρόβλεψης και βρίσκεται στην κορυφή λόγο των δυνατοτήτων του. Η ιστοσελίδα της

KDNuggets διενεργεί κάθε χρόνο μια δημοσκόπηση η οποία αναφέρεται στην

δημοτικότητα των διαφόρων εργαλείων λογισμικού Data Mining που κυκλοφορούν

στην διεθνή αγορά. Η SPSS με την εφαρμογή Clementine φαίνεται να έρχεται πρώτη

τα τελευταία δύο χρόνια στην προτίμηση των χρηστών σε ότι αφορά το λογισμικό

Data Mining.

Το SPSS Clementine κυκλοφόρησε με σκοπό να βοηθήσει τις επιχειρήσεις και τους

οργανισμούς να δημιουργήσουν πιο αποτελεσματικές και επικερδείς σχέσεις με τους

πελάτες τους, αφού μέσω των αναλυτικών λύσεων θα μπορούν να ανακαλύψουν τι

θέλουν οι πελάτες και να προβλέψουν πως θα συμπεριφερθούν στο μέλλον. Το

λογισμικό αυτό βοηθά στην επίλυση σημαντικών επιχειρηματικών και ερευνητικών

προβλημάτων και ενσωματώνει μια σειρά επιπρόσθετων τμημάτων που

προσφέρουν στον επιχειρηματικό χρήστη και αναλυτή μια ολόκληρη οικογένεια

εργαλείων για την κάλυψη κάθε αναλυτικής ανάγκης. Ξεχωρίζει για το ιδιαίτερα φιλικό

περιβάλλον διαχείρισης και την κάλυψη όλων των βημάτων της αναλυτικής

διαδικασίας, από την αναζήτηση και μεταφορά των δεδομένων έως την τελική

διάθεση των αποτελεσμάτων της ανάλυσης. Κάθε τόσο εισάγονται νέα

χαρακτηριστικά που βελτιστοποιούν ακόμα περισσότερο την επεξεργασία και

ανάλυση των δεδομένων και από το διαθέσιμο όγκο δεδομένων, οι χρήστεςΣελ. 64 από 85

Page 66: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

παράγουν τη ζητούμενη πληροφορία διευκολύνοντας τη λήψη αποφάσεων και τη

χάραξη πελατειακής στρατηγικής.

5.1.1 Ιστορική αναδρομή

To Clementine αναπτύχθηκε αρχικά από την εταιρία Integral Solutions Ltd (ISL), η

οποία είχε την έδρα των γραφείων της στην Γαλλία, το 1989 απο τον Dr. Alan

Modgomery. Εξαρχής, ο στόχος ISL ήταν να χτιστεί ένα ενσωματωμένο περιβάλλον

για τις διαδικασίες εξόρυξης δεδομένων που θα μπορούσε να χρησιμοποιηθεί και να

γίνει κατανοητό από τους επιχειρηματίες, χωρίς να υπάρχει η ανάγκη να

συμβουλευτούν τους ειδικούς της εξόρυξης δεδομένων. Το Clementine αρχικά

παρουσιάστηκε ως ερευνητικό προιόν το 1992, μέρος του οποίου χρηματοδοτήθηκε

από το Βρετανικό τμήμα Εμπορίου και Βιομηχανίας, το τελικό προϊόν παρουσιάστηκε

στην αγορά το 1994.

Η S P S S Inc εξαγόρασε το 1998 την ISL και ενσωμάτωσε το λογισμικό του

Clementine στην γκάμα στατιστικών προιόντων που ήδη κατείχε. Το Clementine ήταν

το πρώτο λογισμικό το οποίο ενσωμάτωσε την μηχανική μάθηση και την εισήγαγε

στα λογισμικά του Business Intelligence. Η ευκολία στην χρήση και το φιλικό User

Interface καθιέρωσε το Clementine στην κορυφή της αγοράς λογισμικού εξόρυξης

δεδομένων, θέση την οποία διατηρεί μέχρι και σήμερα. Πρόσφατα, στα μέσα του

καλοκαιριού του 2009, η S P S S Inc εξαγοράστηκε από την IBM αυξάνοντας έτσι

ακόμη περισσότερο το μερίδιο της στην αγορά λογισμικού Data Mining.

5.1.2 Βασικά χαρακτηριστικά

Το λογισμικό του Clementine ακολουθεί πλήρως το επιχειρησιακό μοντέλο

προτυποποίησης της διαδικασίας εξόρυξης δεδομένων, το οποίο αναπτύχθηκε το

1996, το οποίο περιλαμβάνει τα εξής στάδια :

• Κατανόηση του επιχειρησιακού πεδίου (Business Understanding): πλήρης καθορισμός του θέματος και του αντικείμενου που ερευνάται και ορισμός των στόχων της διαδικασίας εξόρυξης δεδομένων.

• Κατανόηση δεδομένων (Data Understanding): συλλογή συνόλου δεδομένωνπου θα χρησιμοποιηθούν ως αρχική πληροφορία κατά την εφαρμογή του μηχανισμού Ανακάλυψης Γνώσης. Τα δεδομένα θα πρέπει να

Σελ. 65 από 85

Page 67: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

αντικατοπτρίζουν τη φύση του προβλήματος, να σχετίζονται άμεσα ή έμμεσα με αυτό και να είναι όσο το δυνατόν πιο ολοκληρωμένα.

• Προετοιμασία δεδομένων (Data Preparation): επιλογή των κατάλληλων δεδομένων για ανάλυση, καθαρισμός και μετασχηματισμός των δεδομένων εισόδου (κανονικοποίηση), χειρισμός των ελλιπών δεδομένων, ώστε να εισαχθούν στα εργαλεία μοντελοποίησης (modeling tools).

• Μοντελοποίηση (Modelling): επιλογή κατάλληλων τεχνικών και ρύθμιση επιθυμητών χαρακτηριστικών των αλγορίθμων, ώστε να επιφέρουν όσο το δυνατόν καλύτερα αποτελέσματα. Αν είναι αναγκαίο, πραγματοποιείται οπισθοδρόμηση στην προηγούμενη φάση της διαδικασίας, ώστε να προσαρμοστούν τα δεδομένα στην μορφή που εξυπηρετούν καλύτερα τις επιλεγμένες τεχνικές μοντελοποίησης.

• Αξιολόγηση (Evaluation): οπτικοποίηση και ερμηνεία των νέων δεδομένων. Λεπτομερής αξιολόγηση μοντέλου, με βάση τα αρχικά πρότυπα που ετέθησαν. Αναθεώρηση των βημάτων που εκτελέστηκαν, με κυριότερο σκοπό να καθοριστεί το όποιο ζήτημα δεν έχει εξεταστεί πλήρως και να επιβεβαιωθεί το αν επιτυγχάνονται οι επιθυμητοί στόχοι στο μέγιστο βαθμό.

• Ανάπτυξη (Deployment): παρουσίαση, υποστήριξη και αποτελεσματική χρήση της νέας γνώσης που αποκτήθηκε μέσα από την όλη διαδικασία. Καθορισμός ωφελειών και στρατηγικών δράσης, ώστε να αποτραπεί η λανθασμένη αξιοποίηση των αποτελεσμάτων.

Τα στάδια ανάπτυξης του λογισμικού Clementine περιγράφονται ως ένας συνεχήςκύκλος διαδικασιών και ροής δεδομένων (Σχήμα 20) και περιγράφονται ως στάδια:

ΛιιινΓ.ίμι«ΐ] u

ItSopÉvun

Σχήμα20: Στάδια της διαδικασίας εφαρμογής της Clementine

Σελ. 66 από 85

Page 68: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

1 .Συλλογή Δεδομένων : Καθορισμός του προβλήματος και επιλογή των δεδομένων.

2. Πρόσβαση σε Δεδομένα : Κατανόηση των δεδομένων του προβλήματος.

3. Διαχείρηση και προετοιμασία δεδομένων : Επιλογή των κατάλληλων

δεδομένων και μετασχηματισμός τους (έλεγχος για ελλιπής τιμές, κανονικοποίηση)

4. Ανάλυση δεδομένων : Επιλογή των κατάλληλων τεχνικών εξόρυξης δεδομένων

και αλγορίθμων για μοντελοποίηση του προβλήματος.

5. Αναφορές : Ερμηνεία των νέων δεδομένων που δημιουργήθηκαν απο την

διαδικασία.

6. Αξιοποίηση : Ενσωμάτωση της νέας γνώσης στο σύστημα.

7. Σχεδιασμός : Ανατροφοδότηση και επανεκκίνηση του συστήματος με υιοθέτηση

της νέας γνώσης που δημιουργήθηκε.

5.1.3 Γ ραφικό περιβάλλον

Από τα βασικότερα πλεονεκτήματα του Clementine είναι το user interface που

προσφέρει το πρόγραμμα και η ικανότητα αλληλεπίδρασης που δίνεται στον χρήστη

μέσα στο περιβάλλον της. Το παραθυρικό περιβάλλον (Εικόνα 21) που χρησιμοποιεί

δίνει μία αίσθηση οικειότητας στον τελικό χρήστη και κάνει πιο γρήγορη την

εξοικείωση του με τα εργαλεία της εφαρμογής, αυτό αποτέλεσε άλλωστε και βασικό

μέλημα της ομάδας σχεδίασης του Clementine, δηλαδή να μπορεί να χρησιμοποιηθεί

από άτομα τα οποία δεν είναι ειδικοί στον τομέα του Data Mining.

Σελ. 67 από 85

Page 69: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 21: Το περιβάλλον της Clementine

Το κεντρικό παράθυρο TOuClementine χωρίζεται σε τέσσερα επιμέρους κομμάτια.Το

πρώτο κομμάτι το οποίο καταλαμβάνει και τον περισσότερο χώρο του παραθύρου

ονομάζετε καμβάς (Canvas), δανειζόμενο το όνομα του από τον χώρο της

ζωγραφικής, όπου εκεί μπορούμε και σχεδιάζουμε την ροή της διαδικασίας (Stream)

πάνω στην οποία εργαζόμαστε. Ο Canvas μας δίνει την δυνατότητα να

επεξεργαζόμαστε και να σχεδιάζουμε παράλληλα πολλά Streams.

Το Stream που φαίνεται παρακάτω (Σχήμα 22) είναι η απλούστερη μορφή ροής

δεδομένων που μπορούμε να δημιουργήσουμε, αλλά και η πιο ολοκληρωμένη.

Σχεδιάζεται από κόμβους (Nodes), οι οποίοι αναπαριστούν, αρχικά την είσοδο των

δεδομένων, τον διαχωρισμό τους, την επιλογή κάποιων δεδομένων με βάση

συγκεκριμένα κριτήρια που ορίσαμε και τέλος την γραφική τους αναπαράσταση σε

ένα πίνακα.

Σελ. 68 από 85

Page 70: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Ακριβώς κάτω από τον καμβά βρίσκονται επτά διαφορετικές παλέτες (palettes). Κάθε

παλέτα περιέχει μία ομάδα από κόμβους (Nodes) της ίδιας λειτουργίας.Για

παράδειγμα η παλέτα είσοδος (Source) περιέχει την ομάδα κόμβων τους οποίους

χρησιμοποιούμε για να εισάγουμε δεδομένα στο μοντέλο μας. Τους κόμβους

μπορούμε πολύ εύκολα να τους χρησιμοποιήσουμε στο σχεδιασμό, "σύροντας"

τους από την αντίστοιχη παλέτα που βρίσκονται και ρίχνοντάς τους στον καμβά.

Σχήμα 23:Παλέτες

Από αυτές τις παλέτες μπορεί ο χρήστης να διαλέξει οποιονδήποτε κόμβο χρειάζεται

για να επιτελέσει την λειτουργία που αυτός επιθυμεί και να τον τοποθετήσει στον

καμβά. Με αυτόν τον τρόπο αρχίζει σιγά σιγά και δημιουργείται μία ροή εργασίας, η

οποία έχει ως σκοπό την εξόρυξη των δεδομένων.Για να προσθέσει κανείς ένα

κόμβο στον καμβά, αρκεί μόνο να κάνει διπλό κλικ στο εικονίδιο του κόμβου που

επιθυμεί να προσθέσει. Διαφορετικά μπορεί να τον επιλέξει και να τον σύρει μέσα

στον καμβά. Με τον πρώτο τρόπο, ο κόμβος που μπαίνει κάθε φορά συνδέεται με

αυτόν που έχει ο χρήστης από πριν επιλεγμένο, ενώ με το δεύτερο τρόπο πρέπει ο

χρήστης να πάει και να συνδέσει τους δύο κόμβους που επιθυμεί, ώστε να

δημιουργηθεί μία αλληλουχία που θα αντιπροσωπεύει τη ροή των δεδομένων.

Σχήμα 24: Συνδεδεμένοι κόμβοι

Πάνω και δεξιά στο παράθυρο βρίσκεται το πλαίσιο όπου βρίσκεται ουσιαστικά όλη η

διαχείρηση της εφαρμογής (Manager). Αποτελείται από τρία κομμάτια, Streams,

Output και Models, που επιλέγοντας ένα από αυτά μας εμφανίζονται τα αντίστοιχα

στοιχεία τους. Επιλέγοντας το κομμάτι Streams μπορούμε να διαχειριστούμε ένα

Stream όπως για παράδειγμα να ανοίξουμε νέο Stream, να σώσουμε ένα ήδη

υπάρχων ή ακόμα και να το μετονομάσουμε. Επιλέγοντας την ετικέτα Outputs

Σελ. 69 από 85

Page 71: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

μπορούμε να επιλέξουμε τον τρόπο με τον οποίο μπορούμε γραφικά να

απεικονίσουμε τα δεδομένα. Τέλος η ετικέτα Models είναι η πιο σημαντική γιατί εκεί

βρίσκονται τα αποτελέσματα της διαδικασίας μοντελοποίησης από το Clementine. Τα

μοντέλα τα οποία έχουν δημιουργηθεί σε αυτό το κομμάτι μπορούν και αυτά να

χρησιμοποιηθούν απευθείας στον καμβά.

Σχήμα 25: Παράθυρο ροών

Σχήμα 26: Παράθυρο αποτελεσμάτων Σχήμα 27:Παράθυρο προτύπων

Κάτω και δεξιά στο πλαίσιο το οποίο καλείται Project, μπορούμε και βλέπουμε

συνεχώς σε ποια φάση του έργου μας βρισκόμαστε και έτσι μπορούμε να

οργανώσουμε καλύτερα την εργασία μας. Επίσης κάτω από το πλαίσιο palettes,

υπάρχει το πλαίσιο που ονομάζεται Report Window όπου μας παρέχει πληροφορίες

σχετικά με την πρόοδο διαφόρων διεργασιών, όπως για παράδειγμα την πρόοδο

στην διαδικασία "διαβάσματος" των δεδομένων. Και τέλος το πλαίσιο Status

Window που βρίσκεται δίπλα στο Report Window το οποίο μας παρέχει πληροφορίες

σχετικά με τις λειτουργίες που εκτελούνται από μια συγκεκριμένη εφαρμογή.

Σελ. 70 από 85

Page 72: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

5.2 Βασικές λειτουργίες

Το Clementine διαθέτει επτά παλέτες λειτουργιών, όπου σε κάθε μία βρίσκεται και

μία ομάδα από κόμβους που εκτελούν παρόμοιες εργασίες. Παρακάτω παραθέτονται

οι ομάδες των κόμβων και η αντίστοιχη παλέτα στην οποία ανήκουν.

5.2.1 Κόμβοι εισόδου

Οι κόμβοι εισόδου (Source nodes) μας επιτρέπουν να εισάγουμε τα δεδομένα του

προβλήματος που είναι υπό εξέταση και υποστηρίζουν διάφορες μορφές και τύπους

δεδομένων, που μπορεί να προέρχονται από διάφορους τύπους προγραμμάτων.

Database Node : Μας επιτρέπει να εισάγουμε δεδομένα από

διάφορες Βάσεις Δεδομένων, όπως Microsoft SQL Server, DB2,

O racles άλλες, χρησιμοποιώντας την τεχνολογία ODBC

(Open Database Connectivity).

SPSS Import Node :Εισάγει δεδομένα τα οποία είναι

αποθηκευμένα σε μορφή αρχείων που χρησιμοποιούνται από

το στατιστικό πρόγραμμα SPSS.

Excel Import Node :Μας επιτρέπει να εισάγουμε δεδομένα τα

οποία προέρχονται από το πρόγραμμα Microsoft Excel.

Enterprise View Node : Με τον κόμβο αυτό μέσω κάποιων

σεναρίων (Scenario) μπορούμε να τροφοδοτούμε κατευθείαν

Σελ. 71 από 85

Page 73: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

το πρόγραμμα με δεδομένα του οργανισμού ή της επιχείρησης και να παρέχουμε και

μια συνοπτική εικόνα στους χρήστες.

5.2.2 Κόμβοι δ ιαχείρ ισης εγγραφών

Οι κόμβοι διαχείρισης εγγραφών (Record Operations Nodes) χρησιμοποιούνται για

να τροποποιήσουμε κάποια από τα δεδομένα. Οι λειτουργίες που εκτελούν οι κόμβοι

αυτοί είναι ιδιαιτέρως χρήσιμοι στο στάδιο της κατανόησης των δεδομένων (Data

Understanding) και της προετοιμασίας των δεδομένων (Data Preparation), γιατί

επιτρέπουν να προσαρμόσουμε τα δεδομένα στις ανάγκες του προβλήματος μας.

Sample Node :Με τον κόμβο αυτό μπορούμε να χειριστούμε

το μέγεθος των δεδομένων σύμφωνα με το πρότυπο που

χρησιμοποιούμε. Για παράδειγμα χρησιμοποιώντας αυτόν τον

κόμβο σε ένα Νευρωνικό Δίκτυο μπορούμε να παράγουμε τα

δεδομένα εκπαίδευσής του.

Balance Node:Χρησιμοποιείται όταν θέλουμε να γίνει έλεγχος για

ανισσοροπίες μέσα στα δεδομένα, βάσει κάποιου παράγοντα που

έχουμε θέσει μειώνοντας τις αποκλίσεις, των δεδομένων από την

τιμή που ορίζουμε.

Merge Node: Με την χρήση αυτού του κόμβου μπορούμε να

συγχωνέψουμε δεδομένα τα οποία προέρχονται από

διαφορετικούς κόμβους εισόδου κρατώντας όλα ή όποια πεδία

έχουμε επιλέξει από τα αρχικά δεδομένα.

Append Node:0 κόμβος χρησιμοποιείται όταν θέλουμε να

συνενώσουμε δεδομένα με παρόμοια δομή αλλά διαφορετικό

περιεχόμενο.

Σελ. 72 από 85

Page 74: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

5.2.3 Κόμβοι εξόδου

Οι κόμβοι εξόδου (Output Nodes) μας παρέχουν τα κατάλληλα μέσα που

χρειαζόμαστε για να αντλήσουμε πληροφορίες από τα δεδομένα μας και τα μοντέλα

που έχουμε δημιουργήσει. Επιπλέον μας δίνουν την δυνατότητα να εξάγουμε τα

αποτελέσματα μας και σε τύπους αρχείων άλλων προγραμμάτων που συνδέονται με

την διαδικασία Εξόρυξης Δεδομένων.

Table Node :Ο κόμβος αυτός εμφανίζει τα δεδομένα μας με την μορφή

πίνακα και μας δίνει την δυνατότητα αποθήκευσής τους ανάπάσα

στιγμή με την μορφή αρχείου.

Statistics Node:0 κόμβος αυτός μας προσφέρει συνοπτικά τις

βασικές στατιστικές πληροφορίες των αριθμητικών πεδίων.

Υπολογίζει τα συνοπτικά στατιστικά στοιχεία ενός πεδίου ξεχωριστά,

αλλά και σε σχέση ενός πεδίου με άλλα.

SPSS Output Node:0 κόμβος αυτός μας επιτρέπει να χειριστούμε

τα δεδομένα που έχουμε εισάγει σ™ Clementineμέσω ανάκλησης

διαδικασιών από το στατιστικό πακέτο της SPSS.

Flat File Node:0 κόμβος αυτός εξάγει τα δεδομένα με την μορφή

οριοθετημένου αρχείου κειμένου, κάτι το οποίο κάνει ευκολότερη την

προσπέλαση του αρχείου αυτού από λογισμικά ανάλυσης άλλων

εταιριών.

5.3 Ανάλυση πελατώ ν αποχώ ρησης με το SPSS

To SPSS Clementine είναι ένα λογισμικό χρήσιμο για την ανακάλυψη της γνώσης και

κατέχει ηγετική θέση στα λογισμικά που εφαρμόζουν τεχνολογίες εξόρυξης. Τα

Σελ. 73 από 85

Page 75: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

δεδομένα αντιπροσωπεύουν ένα δείγμα των πελατών με περιγραφές, όπως τον

αριθμό των λεπτών για υπεραστικές κλήσεις και τις τοπικές, οικονομικές

πληροφορίες, όπως οι τύποι τιμολόγησης και οι μέθοδοι πληρωμών, ορισμένα

δημογραφικά στοιχεία όπως η ηλικία, το φύλο, το εισόδημα.

Το SPSSClementine υποστηρίζει όλες τις πτυχές της διαδικασίας ανάλυσης

αποχώρησης εκτός από τον καθορισμό της επιχειρηματικής ερώτησης. Αυτό πρέπει

να ορίζεται από ειδικούς του χώρου, επειδή το πραγματικό πρόβλημα των

επιχειρήσεων καθοδηγεί τα δεδομένα στο έργο της εξόρυξης. Όταν τα δεδομένα

έχουν συγκεντρωθεί από διάφορες βάσεις δεδομένων-πηγές, το λογισμικό

SPSSClementine μπορεί να τα χρησιμοποιηθεί για να τα απεικονίσει και να

εξερευνήσει. Τα ιστογράμματα,τα scatterplots και η σύνδεση των διαγραμμάτων

μπορούν να βοηθήσουν να αποκαλυφθούν τα μοτίβα-σχέδια.

Μετά την εξερεύνηση των δεδομένων, το επόμενο στάδιο είναι να ξεκινήσει η

μοντελοποίηση. Η διαδικασία της επιλογής των χαρακτηριστικών είναι σημαντική. Το

πρόβλημα είναι ότι μερικοί αλγόριθμοι προσομοίωσης δεν μπορούν να

αντιμετωπίσουν μεγάλο αριθμό χαρακτηριστικών. Εάν ένας χρήστης προσθέσει

εκατοντάδες χαρακτηριστικά αυτό μπορεί να οδηγήσει σε μία κακή απόδοση του

αλγορίθμου προσομοίωσης.

Μόλις το βασικό σύνολο των γνωρισμάτων έχει επιλεχθεί, ένα νευρωνικό δίκτυο ή

κάποιος άλλος αλγόριθμος βαθμολόγησης μπορεί να εκπαιδευτεί χρησιμοποιώντας

τις υπόλοιπες ιδιότητες. Αφού εκπαιδευτεί οι πελάτες μπορούν να ταξινομηθούν σε

ένα πίνακα κατάταξης με μεγάλη πιθανότητα να αποχωρήσουν μέχρι τη μικρότερη

πιθανή οι λεγόμενοι πιστοί πελάτες. Όλα αυτά φαίνονται παρακάτω στο παράδειγμα

ανάλυσης με χαρακτηριστικά πελατών μιας τηλεφωνικής εταιρίας.

5.4 Σχέση ποιότητας και ανάλυση κερδοφορίας

Yπάρχουν πολλοί τρόποι για να χρησιμοποιήσουμε ένα μοντέλο αποχώρησης. Όλα

ρυθμίζονται από την επιχείρηση και το πρόβλημα που έχει να αντιμετωπίσει. Αν ο

στόχος είναι να "αγγίξει" όλους τους πελάτες, τότε δεν έχει σημασία το κόστος και δεν

χρειάζεται καν ένα μοντέλο. Εάν ο στόχος είναι να μεγιστοποιήσει την απόδοση σε

έναν προϋπολογισμό μάρκετινγκ ενός σταθερού ποσού η μοντελοποίηση είναι

αρκετά σημαντική. Άλλα θέματα, όπως η αξία του πελάτη αρχίζουν να παίζουν μέρος.

Αν ο πάροχος τηλεπικοινωνιών δεν κερδίζει χρήματα από τον εν λόγω πελάτη, θαΣελ. 74 από 85

Page 76: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

πρέπει να τον αφήσει να φύγει; Είναι κάποια από τα ερωτήματα που χρήζουν

απάντηση από τα στελέχη των τηλεπικοινωνιακών επιχειρήσεων.

Στο SPSS Clementine οι αναφορές που μπορούν να δημιουργηθούν δείχνουν ότι

όπου υφίστανται εκστρατείες με στόχο τους πελάτες, λαμβάνεται υπόψη η τάση της

αποχώρησης και η αξία toy πελάτη (κερδοφορία).

Το λογισμικό παρέχει πλήρης, συνεκτικές και ακριβείς πληροφορίες για τους

ιθύνοντες που το εμπιστεύονται για να βελτιώσουν την επιχειρησιακή τους απόδοση.

Αποτελεί ένα ολοκληρωμένο χαρτοφυλάκιο της επιχειρηματικής ευφυΐας,

προγνωστικών αναλύσεων, χρηματοοικονομικής επίδοσης και διαχείρισης της

στρατηγικής. Παρέχονται σαφείς εφαρμογές ανάλυσης, άμεσες και δραστικές

πληροφορίες για την τρέχουσα απόδοση και την ικανότητα να προβλέπουν τα

μελλοντικά αποτελέσματα. Σε συνδυασμό με τις πλούσιες λύσεις στη βιομηχανία,

δοκιμασμένες πρακτικές και επαγγελματικές υπηρεσίες, σε οργανισμούς κάθε

μεγέθους μπορούν να οδηγήσουν στην υψηλότερη παραγωγικότητα, την

αυτοματοποίηση αποφάσεων και να παραδώσουν τα καλύτερα αποτελέσματα.

5.5 Παράδειγμα εφαρμογής

Στην Ελλάδα, το θέμα της ανεξέλεγκτης και πολύ γρήγορης επέκτασης του τομέα

αυτού μπορεί να προκαλέσει αύξηση των ζημιών, έχει καταστεί πρωτοπόρο σε

διάφορες έρευνες στον τομέα των τηλεπικοινωνιών, η οποία πλήττεται από τις

τεράστιες απώλειες των πελατών. Η ανάλυση αποχώρησης που χρησιμοποιείται

συχνά σε όλους τους τομείς, είναι μία από τις εφαρμογές της εξόρυξης δεδομένων.

Με εκτίμηση πελάτες οι οποίοι κατά πάσα πιθανότητα θα διακόψουν την παροχή των

υπηρεσιών τους, οι οργανισμοί μπορούν να δημιουργήσουν καμπάνιες που

στοχεύουν στην αύξηση της εμπιστοσύνης των πελατών και να αναπτύξουν

στρατηγικές μάρκετινγκ για να έχουν υψηλότερη διατήρηση των πελατών τους. Στην

παρούσα πτυχιακή γίνεται μία προσέγγιση για τη δημιουργία μοντέλου για την

ανταπόκριση του αγοραστικού κοινού στον τομέα των τηλεπικοινωνιών σε ένα

πραγματικό σύνολο δεδομένων πελατών με τη χρήση του λογισμικού SPSS

Clementineτων οποίων τα αποτελέσματα παρατίθενται παρακάτω.

Σελ. 75 από 85

Page 77: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Κατανόηση των δεδομένων

Η φάση της κατανόησης των δεδομένων ξεκινά με μια αρχική συλλογή στοιχείων και

προχωρά με τις δραστηριότητες, προκειμένου να εξοικειωθούν με τα δεδομένα. Τα

δεδομένα που συλλέξαμε από μια εταιρία τηλεπικοινωνιών για να αναλυθούν(Nisbet,

R., Elder, J. and Miner, G. (2009)) περιλαμβάνουν λεπτομέρειες για τη χρήση των

πελατών ο αριθμός των εγγραφών ανέρχεται σε 1000.

Προετοιμασία δεδομένων

Η φάση της προετοιμασίας των δεδομένων καλύπτει όλες τις δραστηριότητες για την

κατασκευή του τελικού συνόλου δεδομένων. Στον πίνακα 1 φαίνονται οι μεταβλητές

που χρησιμοποιήθηκαν και οι επεξηγήσεις τους.

Μεταβλητές Επεξήγηση

CUST_ID αναγνωριστικό πελάτη

ST ART_DT ημερομηνία έναρξης της περιόδου

χρέωσης

END_DT ημερομηνία λήξης της περιόδου χρέωσης

LATE_ST τελευταία κατάσταση

CREDIT_CLASS πίστωση

INC_RANGE εύρος εισοδήματος

GENDER φύλο ^ / F)

AGE ηλικία σε έτη

INCOME έσοδα σε δολάρια

CUST_TYPE τύπος Πελάτη

INPUT_DT ημερομηνία εισόδου

ACCT_TYPE τύπος λογαριασμού

CALL_TP1,2,3 τύπος Κλήσης για τις τρεις χρονικές

αφαιρέσεις

NUM_SP1,2,3 αριθμός των ειδικών υπηρεσιών για τις

τρεις χρονικές αφαιρέσεις

DUR1,2,3 συνολική διάρκεια όλων των κλήσεων για

τις τρεις χρονικές αφαιρέσεις

CALLS1,2,3 αριθμός των κλήσεων για τις τρεις

Σελ. 76 από 85

Page 78: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

χρονικές αφαιρέσεις

BIL L_ST1, 2,3 κατάσταση λογαριασμού

LT_PMT 1, 2,3 καθυστέρηση των πληρωμών

ONETIME1, 2,3 εφάπαξ χρεώσεις

P_METH1,2,3 μέθοδο πληρωμής

CR_DT 1, 2,3 ημερομηνία πίστωσης

DUE_VAL1, 2,3 σύνολο οφειλών

TEN_RAW χρόνος προσωρινής μετατροπής

CHURN αποχώρηση (1 = αποχωρεί 0 = δεν

αποχωρεί)

Πίνακας 1 : Οι μεταβλητές και η εξήγησή τους

Στον παραπάνω κατάλογο των μεταβλητών κάποιες περιλαμβάνονται σε σετ των

τριών (π.χ. DUR1, DUR2, DUR3). Αυτές είναι οι χρονικές αφαιρέσεις. Για

παράδειγμα, η DUR1 αναφέρεται στη διάρκεια σε λεπτά χρήσης ένα μήνα πριν από

την αποχώρηση από το μήνα δείκτη. Ως μεταβλητή στόχος έχει επιλεγεί η μεταβλητή

CHURN.

Μοντελοποίηση

Δεδομένου ότι η εξαρτημένη μεταβλητή έχει επιλεγεί ως μεταβλητή στόχος έχει δύο

αποτελέσματα, όπως "0" και "1", έχουν εισαχθεί τα χαρακτηριστικά και οι μεταβλητές

και μετά την εξισορρόπηση των μεταβλητών-στόχων το σύνολο δεδομένων έχει γίνει

έτοιμο για μοντελοποίηση. Το επόμενο βήμα είναι να εξαλειφθούν οι μεταβλητές που

δεν έχουν καμία επίδραση στη μεταβλητή στόχο. Όλες οι μεταβλητές, μετά από

αυτήν την κατάργηση, μπορούν να θεωρηθούν ως σημαντικές. Είναι πολύ σημαντικό

να εξεταστεί η συσχέτιση μεταξύ αυτών των μεταβλητών. Μετά το στάδιο

προετοιμασίας των δεδομένων το μοντέλο που κατασκευάστηκε φαίνεται στο Σχήμα

28.

Σελ. 77 από 85

Page 79: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 28: Εισαγωγή δεδομένων

Σχήμα 29: Μερική κατασκευή του μοντέλου (stream)

Σελ. 78 από 85

Page 80: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 30: Ολοκληρωμένο μοντέλο

Τα αποτελέσματα από την ανάλυση θα φανούν όταν κάνουμε διπλό κλικ στον κόμβο

evaluation. Τον κόμβο αυτό τον χρησιμοποιούμε για να αξιολογήσουμε και να

συγκρίνουμε τα αποτελέσματα από τα μοντέλα πρόβλεψης. Παρουσιάζει δηλαδή

πόσο καλές είναι οι τιμές πρόβλεψης σχετικά με τα αποτελέσματα. Ταξινομεί τις

εγγραφές ανάλογα με την τιμή πρόβλεψης και την εμπιστοσύνη της πρόβλεψης.

Έχουμε δημιουργήσει στο streamένα νέο πεδίο με όνομα ϋΝϋΡ_ΡΑΥόπου έχουμε

εισάγει δύο μεταβλητές την PAY_VAL (πληρωμή πελάτη) και ^ vDUE_VAL (το ποσό

που οφείλει ο πελάτης στην εταιρία) έπειτα από διεργασία εμφανίζεται στην οθόνη

μας το διάγραμμα εκτίμησης όπως παρατίθεται παρακάτω:

Σελ. 79 από 85

Page 81: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Σχήμα 31 : Αποτελέσματα αξιολόγησης που δείχνουν το διάγραμμα αθροιστικής ανύψωσης

Το σχήμα 31 δίνει το διάγραμμα αθροιστικής ανύψωσης (Cumulative Lift Chart). Αυτό

είναι ο δείκτης ανύψωσης στον κατακόρυφο άξονα ο οποίος εκφράζει το πόσο

καλύτερη είναι η πρόβλεψη που παράγει το μοντέλο από την τυχαία πρόβλεψη. Για

παράδειγμα στα πρώτα δύο δεκατημόρια μέχρι το 20οεκατοστημόριο το μοντέλο

αποδίδει περίπου 3,8 φορές καλύτερα από τον τυχαίο τρόπο (κόκκινη γραμμή).

Το διάγραμμα lift συγκρίνει το ποσοστό των εγγραφών που αποχωρούν σε κάθε

εκατοστημόριο με το συνολικό ποσοστό των εγγραφών στο σύνολο δεδομένων

εκπαίδευσης = (πλήθος αποχωρήσεων σ’ ένα εκατοστημόριο / πλήθος εγγραφών

στο εκατοστημόριο) / (σύνολο αποχωρήσεων στο αρχείο δεδομένων εκπαίδευσης /

συνολικές εγγραφές στο αρχείο δεδομένων εκπαίδευσης).

Όπως φαίνεται υπάρχει μία αυξητική τάση όσον αφορά τους πελάτες που

αποχωρούν σε σύγκριση με αυτούς που πληρώνουν και το ποσό που οφείλουν στην

εταιρία τους. Καταργώντας την αθροιστική επιλογή cumulatives εκτελώντας ξανά

τον κόμβο αξιολόγησης (évaluation),παίρνουμε το γράφημα αυξητικό (incrémental)

διάγραμμα lift που δίνεται στο σχήμα 32.

Σελ. 80 από 85

Page 82: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

^ Evaluation af Evaluation Lift

■ ’ jfiie tan 0£ener»fi </^ew

t[ L

-4.... -.. .ί > ί '■ j. .I

Ί ΐ 60Hr̂ enHlu

CHUflN - 1

Il(?r-

G r j p n Λ Π Ι1 3 [8 ΪΒ Γ ·3

1 ™ ts a u r i e s R e c o r d O p s F ie i r s c jp js ■ i ~ r a f j i i r · M r lQ f i r i i l

<D<3 >d><§>@ ©©<!><§> (D €P-IB ti r ic u . i A v is n y m iz f Κ ιπ π ιρ ό p a-f1iH«n t a l l A f l a t ir o s t iu g lu i* . Γ ιο ρ ϊ γ ε

Σχήμα 32: Διάγραμμα αξιολόγησης που δείχνει το δείκτη ανύψωσης σε κάθε εκατοστημόριο

Το αυξητικό διάγραμμα δείχνει το δείκτη ανύψωσης σε κάθε εκατοστημόριο (δεν έχει

γίνει συσσώρευση, είναι χωρίς την αθροιστική επιλογή). Παρατηρούμε ότι η γραμμή

ανύψωσης κατεβαίνει κάτω από την τυχαία (κόκκινη) γραμμή στο περίπου 18ο

εκατοστημόριο. Αυτό σημαίνει ότι το σύνολο οφέλους του μοντέλου (σε σύγκριση με

τον τυχαίο τρόπο) επιτυγχάνεται στο πρώτο 18% των εγγραφών (σημειώστε ότι το

γράφημα ανύψωσης δημιουργείται από μια λίστα ταξινομημένη με βάση την

προβλεπόμενη πιθανότητα σε φθίνουσα σειρά).

Ένας διευθυντής CRM θα μπορούσε καθοδηγούμενος από αυτό το μοντέλο, να

αποκλείσει προσφορές μόνο στο πάνω 18% αυτής της ταξινομημένης λίστας και να

προσπαθεί να έρθει σε επαφή με το υπόλοιπο ποσοστό πελατών που έχουν υψηλή

πιθανότητα αποχώρησης. Το ποσοστό ανταπόκρισης από την καμπάνια

συγκράτησης (retention) μπορεί στη συνέχεια ελεγχθεί από την αποτελεσματικότητα

των προσφορών (κίνητρα για την παραμονή στην εταιρεία).

Αυτό το μοντέλο αποχώρησης (churn model) είναι ένα παράδειγμα ενός μοντέλου

ανταπόκρισης των πελατών. Μπορούμε να αναλύσουμε την ανταπόκριση σχεδόν

Σελ. 81 από 85

Page 83: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

κάθε πελάτη με τον τρόπο αυτό, όπως π.χ. να κάνουμε cross-sel^ou είναι η

ενέργεια ή η πρακτική της πώλησης σε ήδη υπάρχοντες πελάτες, αγορές ή έμπορους

ή η πώληση ενός πρόσθετου προϊόντος ή υπηρεσίας σε υπάρχοντα πελάτη, up-

seNπou είναι η τεχνική ή μέθοδος (επι)πρόσθετης πώλησης δηλαδή η πώληση ενός

είδους μπορεί να οδηγήσει στην πώληση επιπλέον ποσότητας του ίδιου είδους και

customer acquisition η απόκτηση νέων πελατών.

Ανάπτυξη

Η δημιουργία του μοντέλου δεν είναι γενικά το τέλος του έργου. Ακόμα κι αν ο

σκοπός του μοντέλου είναι να αυξηθεί η γνώση των δεδομένων, οι γνώσεις που

αποκτήθηκαν θα πρέπει να οργανωθούν και να παρουσιαστούν με τέτοιο τρόπο

ώστε ο πελάτης να μπορεί να τις χρησιμοποιήσει. Ανάλογα με τις απαιτήσεις, η φάση

ανάπτυξης μπορεί να είναι είτε τόσο απλή όσο η δημιουργία μιας έκθεσης ή τόσο

σύνθετη όσο η εφαρμογή μιας επαναλαμβανόμενης διαδικασίας εξόρυξης δεδομένων.

Τα αποτελέσματα που προκύπτουν από τη μελέτη αυτή μπορεί να χρησιμοποιηθούν

σε δραστηριότητες μάρκετινγκ της εταιρίας όπως διαπιστώθηκε και παραπάνω. Όταν

η εταιρία διοργανώνει εκστρατείες για τα προϊόντα και τις υπηρεσίες της, η εταιρία

μπορεί να δώσει προτεραιότητα στους συνδρομητές που είναι πιο πιθανό να

αποχωρήσουν και μπορεί να μειώσει την απώλεια των πελατών της

Συμπεράσματα

Ο τομέας των τηλεπικοινωνιών, στον οποίο οι πελάτες αλλάζουν πάροχο γρήγορα,

είναι πολύ δυναμικός. Η ανάλυση δείχνει ότι οι συνδρομητές, οι οποίοι δεν έχουν

έκπτωση σε κάποιο πακέτο, έχουν πολύ υψηλή τάση να αποχωρήσουν. Έτσι,

διάφορα ελκυστικά πακέτα θα πρέπει να δημιουργηθούν. Επίσης, οι συνδρομητές οι

οποίοι δεν ανήκουν σε κάποιο σχέδιο έκπτωσης, θα πρέπει να ενημερώνονται για τα

διάφορα προγράμματα. Δημιουργώντας διαφορετικές στρατηγικές μάρκετινγκ και

διαφορετικά σχέδια που πληρούν τα προφίλ των διαφόρων πελατών μπορεί να

βοηθήσουν τις επιχειρήσεις να κρατήσουν τους πελάτες ικανοποιημένους και μπορεί

να μειώσουν τον αριθμό απώλειας των πελατών. Επιπλέον, οι συνδρομητές θα

πρέπει να ενημερωθούν για άλλες υπηρεσίες όπως τα SMS, 3G, internet και ούτω

καθεξής. Διάφορα σχέδια που περιλαμβάνουν το σύνολο ή μέρος των υπηρεσιών

αυτών πρέπει να προωθούνται. Τέλος με τα αποτελέσματα της μελέτης οιΣελ. 82 από 85

Page 84: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

υφιστάμενοι συνδρομητές μπορούν να αναπτυχθούν, η ζήτηση μπορεί να αυξηθεί για

διάφορες υπηρεσίες της εταιρίας, τα ποσοστά αποσυνδέσεων μπορούν να

ελαχιστοποιηθούν και το περιθώριο κέρδους των επιχειρήσεων μπορεί να να αυξηθεί.

5.6 Μελλοντικές τάσεις

Η εξόρυξη δεδομένων θα διαδραματίσει σημαντικό και αυξανόμενο ρόλο στον κλάδο

των τηλεπικοινωνιών λόγω των μεγάλων ποσοτήτων υψηλής ποιότητας διαθέσιμων

δεδομένων, του ανταγωνιστικού χαρακτήρα του κλάδου και των εξελίξεων που

γίνονται στον τομέα της εξόρυξης δεδομένων. Αλλαγές στη φύση της

τηλεπικοινωνιακής βιομηχανίας θα οδηγήσουν στην ανάπτυξη νέων εφαρμογών και

στην εξαφάνιση ορισμένων από τις τρέχουσες.

Είναι δύσκολο να προβλέψουμε τις μελλοντικές αλλαγές που θα αντιμετωπίσει ο

κλάδος των τηλεπικοινωνιών. Ο τομέας των τηλεπικοινωνιακών εταιρειών αρχίζει να

προσελκύει πελάτες με την παροχή τηλεοπτικών υπηρεσιών στο σπίτι και σε πιο

εξελιγμένες υπηρεσίες κινητής τηλεφωνίας (π.χ., μουσική, βίντεο, κλπ.). Είναι σαφές

ότι οι νέες εφαρμογές εξόρυξης δεδομένων θα πρέπει να αναπτυχθούν και να

εγκατασταθούν.

Δυστυχώς, υπάρχει επίσης μια ανησυχητική τάση που έχει αναπτυχθεί τα τελευταία

χρόνια. Αυτό αφορά την αυξανόμενη πεποίθηση ότι οι αμερικανικές εταιρείες

τηλεπικοινωνιών μοιράζονται πολύ εύκολα τα αρχεία των πελατών τους με τις

κυβερνητικές υπηρεσίες. Η ανησυχία αυτή προέκυψε το 2006, λόγω αποκαλύψεων

που δημοσιοποιήθηκαν σε πολλές εφημερίδες και άρθρα περιοδικών πως οι

εταιρείες τηλεπικοινωνιών χορηγούσαν πληροφορίες σχετικά με τις κλήσεις για την

Εθνική Υπηρεσία Ασφαλείας (NSA) και για σκοπούς εξόρυξης δεδομένων. Εάν αυτή

η ανησυχία εξακολουθήσει να αυξάνεται ανεξέλεγκτα, θα μπορούσε να οδηγήσει σε

περιορισμούς στη χρήση της εξόρυξης δεδομένων για νόμιμους σκοπούς.

Σελ. 83 από 85

Page 85: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

Βιβλιογραφία

• Ahn, J. H., S. P. Han and Y. S. Lee (2006). Customer churn analysis: Churnand switching barrier on customer loyalty in Korean mobile telecommunication services. Telecommunications Policy 28(2), 145-159.

• Bradshaw, D., Brash C. (2001), Managing customer relationships in the e-business world: how to personalise computer relationships for increased profitability, International Journal of Retail & Distribution Management, 29, 12, pp 520-530. Cambridge. Centric Transformation, The Eight Building Blocks of CRM", Gartner, April 2002.

• Desai, M. (2006). Customer Churn-A reason to churn. Available at SSRN: http://ssrn.com/abstract=957208.

• Fayyad U., Piatesky. Shapiro G. and Smyth P.:"Knowledge Discovery and Data Mining: Towards a unifying framework", in Proceedings of The Second International Conference on Knowledge Discovery and Data Mining, Portland, Oregon, August 2.4, 1996, AAAI Press.

• Gary M.Weiss, (2010). Data Mining in the Telecommunications Industry. Fordham University, USA (486,489)

• Hand, D., Mannila, H. and Smyth, P. (2001). Principles of Data Mining, MIT Press, Handbook, Springer.

• Hoekstra, J. and E. Huizingh (1999). The lifetime value concept in customer based http://ssrn.com/abstract=957208. Information Management, Volume 24, Issue 1, pp 73-86.

• Kim, M. K, M. C. Park, and D. H. Jeong, (2004). The effects of customer satisfaction and switching barrier on customer loyalty in Korean mobile telecommunication services. Telecommunications Policy 28(2), 145-159.

• Maimon, O. and Rokah, L. (2005). Data Mining and Knowledge Discovery marketing. Journal of Market Focused Management 3, 257-274.

• Mozer, M. C., R. Wolniewicz, D. B. Grimes, E. Johnson and H. Kaushansky (2000). Predicting subscriber dissatisfaction and improving retention in the wireless telecommunication industry. IEEE Transactions on Neural Networks 11(3),690-696.

Σελ. 84 από 85

Page 86: Hidden Nodes - TEI EMTdigilib.teiemt.gr/jspui/bitstream/123456789/1329/1/... · 2015-05-07 · μετά από μία περιγραφή στο γραφικό περιβάλλον

Πτυχιακή εργασία της Κάλφα Ειρήνης

• Nisbet, R., Elder, J. and Miner, G. (2009) Statistical Analysis and Data Mining Applications, Academic Press, Amsterdam

• Reichheld, F. F. (1996). The loyalty effect. Boston: Harvard Business School Press.

• Tan, Steinbach and Kumar (2005). Introduction to Data Mining, Addison Wesley. telecommunication industry. IEEE Transactions on Neural Networks 11(3), telecommunications service industry. Telecommunications Policy 30, 552-568.

• Telephony Online (2002). Standing by Your Carrier. [available at http://telephonyonline.com/mag/telecom standing carrier/index.html

• Thompson, B. (2005). The Loyalty Connection: Secrets to Customer Retention and Increased Profits. RightNow Technologies and CRMguru.

• Umman Tugba Simsek Gursoy, (2010). Customer churn analysis in telecommunication sector. Istanbul University Journal of the School of Business Administration, (35-43)

• Αργυράκης Πάνος (2001), "Νευρωνικά Δίκτυα και Εφαρμογές", Ελληνικό Ανοικτό Πανεπιστήμιο

• Κρητικού Κ., Ραχοΰτης Θ. (2003), Customer Relationship Management-CRM, Διπλωματική εργασία σε μεταπτυχιακό πρόγραμμα σπουδών στα Πληροφοριακά Συστήματα, Οικονομικό Πανεπιστήμιο Αθηνών.

• Μ. Βαζιργιάννης, Μ. Χαλκίδη. "Εξόρυξη Γνώσης από Βάσεις Δεδομένων", Εκδόσεις:Τυπωθήτω

• www.expresscomputeronline.com/20030922/indiatrends01.shtml

• www.customerthink.com

Σελ. 85 από 85