Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining...

44
Vorlesung Data Mining Data Mining mit KXEN Überblick und Übungsvorbereitung Gunar Fiedler CAU Kiel, Institut für Informatik Arbeitsgruppe Technologie der Informationssysteme Kontakt: [email protected]

Transcript of Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining...

Page 1: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Vorlesung Data MiningData Mining mit KXEN

Überblick und Übungsvorbereitung

Gunar FiedlerCAU Kiel, Institut für InformatikArbeitsgruppe Technologie der InformationssystemeKontakt: [email protected]

Page 2: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 2

Übersicht

• Motivationsbeispiel• Der Data-Mining-Prozess• KXEN Analytic Framework

–Komponenten–Nutzung

Page 3: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 3

Motivationsbeispiel - Zensusdaten

1Female2042divorcedSome-college

Private31

1Male0separatedDoctoratePrivate25

0Female5178marriedBachelorsFederal-gov

40

1Female14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-statuseducationworkclassage

insgesamt 14 Merkmale und ca. 50.000 Beobachtungen

Page 4: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 4

Motivationsbeispiel

Terminologie:

Wert Ausprägung, Wert

AttributVariable, Merkmal

TupelBeobachtung (observation)

TabelleData Set, Tabelle

im Vergleich zu Datenbankenim Data Mining

Typischerweise werden nur Daten in einer einzelnen „flachen“ Tabelle bearbeitet

Page 5: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 5

Motivationsbeispiel

Typische Problemstellungen

- Kann man unbekannte Werte von Variablen aus den Werten der anderen Variablen bestimmen?

?Female5178marriedBachelorsFederal-gov

40

1Male14084neverMastersPrivate38

1Male0narries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 6: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 6

Motivationsbeispiel

Typische Problemstellungen

- Kann man unbekannte Werte von Variablen aus den Werten der anderen Variablen bestimmen? Klassifikation

?Female5178marriedBachelorsFederal-gov

40

1Female14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 7: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 7

Motivationsbeispiel

Typische Problemstellungen

- Lassen sich „ähnliche“ Beobachtungen in Gruppen einteilen? Wenn ja,was heißt in diesem Zusammenhang „ähnlich“?

0Female5178marriedBachelorsFederal-gov

40

1Female14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 8: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 8

Motivationsbeispiel

Typische Problemstellungen

- Lassen sich „ähnliche“ Beobachtungen in Gruppen einteilen? Wenn ja,was heißt in diesem Zusammenhang „ähnlich“? Clusterbildung

0Female5178marriedBachelorsFederal-gov

40

1Female14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 9: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 9

Motivationsbeispiel

Typische Problemstellungen

- Gibt es Zusammenhänge zwischen den Variablen, z.B. „martial-status = never captial-gain > 0“ ?

0Female5178marriedBachelorsFederal-gov

40

1Male14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 10: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 10

Motivationsbeispiel

Typische Problemstellungen

- Gibt es Zusammenhänge zwischen den Variablen, z.B. „martial-status = never captial-gain > 0“ ?

Assoziationsregeln

0Female5178marriedBachelorsFederal-gov

40

1Male14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 11: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 11

Motivationsbeispiel

Typische Problemstellungen

- Wie werden sich die Werte entwickeln, z.B.„Ist die Person hinter Beobachtung 4 in 5 Jahren immer noch verheiratet?“

0Female5178marriedBachelorsFederal-gov

40

1Male14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 12: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 12

Motivationsbeispiel

Typische Problemstellungen

- Wie werden sich die Werte entwickeln, z.B.„Ist die Person hinter Beobachtung 4 in 5 Jahren immer noch verheiratet?“ Zeitreihenanalysen

0Female5178marriedBachelorsFederal-gov

40

1Male14084neverMastersPrivate38

1Male0marries-civ-spouse

HS-gradSelf-emp-not-inc

50

0Male2174neverBachelorsState-gov39

class…sexcaptial-gain

martial-status

educationworkclassage

Page 13: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 13

Motivationsbeispiel

„Ist die Person hinter Beobachtung 4 in 5 Jahren immer noch verheiratet?“

Datenbasis „Zielaussage“

Page 14: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 14

Motivationsbeispiel

„Ist die Person hinter Beobachtung 4 in 5 Jahren immer noch verheiratet?“

?

Datenbasis „Zielaussage“

Page 15: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 15

Übersicht

• Motivationsbeispiel• Der Data-Mining-Prozess• KXEN Analytic Framework

–Komponenten–Nutzung

Page 16: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 16

Der Data-Mining-Prozess

Datenvorbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Page 17: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 17

Der Data-Mining-Prozess

Datenvorbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Page 18: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 18

Der Data-Mining-Prozess

Datenvorbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Datenzugriff

Datenmanipulation

Datenvorbereitung

Page 19: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 19

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Datenzugriff

Datenmanipulation

Datenvorbereitung

- physischer Zugriff (relationale Datenbank, CSV,XML, SAS, …)

ODBC

Page 20: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 20

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Datenzugriff

Datenmanipulation

Datenvorbereitung

-physischer Zugriff (relationale Datenbank, CSV,XML, SAS, …)

- Sichtenbildung

ODBC

Page 21: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 21

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Datenzugriff

Datenmanipulation

Datenvorbereitung

- Zusammenfassen von Tupelnin Beobachtungen(Aggregation)

- Zusammenführen von Datenquellen

- Schemabereinigung- irreführende Beziehungen- triviale Beziehungen

- Schema-Annotation- Datentypen- Speicherformate- Variablen-Rollen

Page 22: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 22

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Datenzugriff

Datenmanipulation

Datenvorbereitung

- Datenbereinigung- fehlende Werte- falsche Werte- konsistente Kodierung- Normierung,

Skalentransformation

Page 23: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 23

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

Page 24: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 24

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

- Algorithmus-Auswahl

Page 25: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 25

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

- Algorithmus-Auswahl- Erstellung einer Menge von Modellen aus den

Trainingsdaten

Page 26: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 26

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

- Algorithmus-Auswahl- Erstellung einer Menge von Modellen aus den

Trainingsdaten- Validierung der Modelle gegen die

Validierungsdaten und Auswahl des besten Modells

Page 27: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 27

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

- Algorithmus-Auswahl- Erstellung einer Menge von Modellen aus den

Trainingsdaten- Validierung der Modelle gegen die

Validierungsdaten und Auswahl des besten Modells- Test der „Performanz“ mit Hilfe der Testdaten und

ggf. Wiederholung des Prozesses

Page 28: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 28

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Der generelle Ablauf

- Aufteilung der Daten in- Trainingsdaten- Validierungsdaten- Testdaten

- Algorithmus-Auswahl- Erstellung einer Menge von Modellen aus den

Trainingsdaten- Validierung der Modelle gegen die

Validierungsdaten und Auswahl des besten Modells- Test der „Performanz“ mit Hilfe der Testdaten und

ggf. Wiederholung des Prozesses

Modell?Welche Algorithmen?Performanz eines Modells?

Page 29: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 29

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

„Modelle“ im Data Mining:

Im Data Mining beschreibt ein Modell die Zusammenhänge zwischen Eingabedaten („explanatory variables“) und Ausgabedaten („target variables“). Modelle dienen der Vorhersage oder der Beschreibung von Phänomenen.

“All models are wrong but some are useful”(George E.P. Box)

Page 30: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 30

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression

Page 31: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 31

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression- Entscheidungsbäume

martial-status = never

education = bachelor

j

j n

class=0 class=1

Workclass = Federal-gov

n

class=0 class=1

j n

Page 32: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 32

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression- Entscheidungsbäume- Entscheidungsregeln

Page 33: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 33

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression- Entscheidungsbäume- Entscheidungsregeln- Neuronale Netze (Perzeptrone,

Backpropagation-Netze)

Page 34: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 34

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression- Entscheidungsbäume - Entscheidungsregeln- Neuronale Netze (Perzeptrone,

Backpropagation-Netze)- Clusterbildung

Page 35: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 35

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Einige Algorithmen(-Klassen):

-Klassifikation- Regression- Entscheidungsbäume (z.B. ID3, C4.5)- Entscheidungsregeln- Neuronale Netze (Perzeptrone,

Backpropagation-Netze)- Clusterbildung

- z.B. k-Means, neuronale Netze (SOMs)- Assoziationsregeln

- z.B A-priori- …

Page 36: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 36

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Performanz eines Modells:

- Aussagekraft, d.h. gute Vorhersage bzw. Beschreibung der Zielvariablen( KXEN: Quality Indicator)

- Robustheit, d.h. gleich gute Ergebnisse auf neuen Datenmengen(KXEN: Robustness Indicator)

Page 37: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 37

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Modellbereitstellung:

- Überprüfen der Performanz eines Modells durch Modellkurven,z.B. Gains Chart

Page 38: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 38

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Modellbereitstellung:

- Überprüfen der Performanz eines Modells durch Modellkurven

- Extraktion von Modellparametern- Simulation des Modells

Page 39: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 39

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Modellbereitstellung:

- Überprüfen der Performanz eines Modells durch Modellkurven,

- Extraktion von Modellparametern- Simulation des Modells- Generierung von Code (z.B. Klassifikatoren)

Page 40: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 40

Der Data-Mining-Prozess

Datenaufbereitung

Modellbildung

Modell-bereitstellung

Anwendung

Anwendung:

- Nutzung des Modells im Geschäftsbetrieb,- Kreditwürdigkeit neuer Kunden- Einblendung adaptiver Werbung- …

Page 41: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 41

Übersicht

• Motivationsbeispiel• Der Data-Mining-Prozess• KXEN Analytic Framework

–Komponenten–Nutzung

Page 42: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 42

KXEN

- Kommerzielle Data Mining Suite- Klassifikation auf der Basis eines

proprietären Regressionsalgorithmus- Clusterbildung- Zeitreihenanalysen- Assoziationsregeln („Warenkorbanalysen“)

Page 43: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 43

KXEN

Page 44: Vorlesung Data Mining Data Mining mit KXENfiedler/teaching/ws0607/dm/docs/... · Im Data Mining beschreibt ein Modell die ... - Klassifikation auf der Basis eines proprietären Regressionsalgorithmus

Data Mining 44

KXEN

Demonstration:

- „Gezielte Werbung“: Klassifikation von Personen