Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15...
Transcript of Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15...
Data Mining in der Bauer Media Group –Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests
Hamburg, 12.03.2009 6. TDWI Roundtable - M. Westphal, N. Brauns, Dr. S. Steinberg
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Agenda
lVorstellung Bauer Media Group
lData Mining Themen
lLogistikstrukturen der Bauer Media Group
lVerfahren zur individuellen Gebietsclusterung
lZusammenfassung
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Bauer Media Group
l 282 Zeitschriften in 15 Ländern
l 48 Zeitschriften in Deutschland
l Auflage von über 15 Millionen Exemplaren pro Erscheinungsintervall (IVW III/2008)
l 6600 Mitarbeiter weltweit
l Jeder zweite Deutsche liest eine Zeitschrift der Bauer Media Group (ma 2008 P II)
l In Deutschland Marktführer in den Segmenten:
l Programmzeitschriften
l Wöchentliche Frauenzeitschriften
l Jugendzeitschriften (BRAVO)
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Bauer Systems KG
l IT-Dienstleister für die Bauer Media Group
lca. 180 Mitarbeiter
lAufgabenfelder:
l Support
lSystemadministration
lSystembetrieb (SAP etc.)
lBetrieb Rechenzentrum
lSoftwareentwicklung
l…
lBusiness Intelligence
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Business Intelligence in der Bauer Systems
Business Intelligence
20 Mitarbeiter
Data Warehousing / ETL
Kampagnenmanagement
Operatives Geschäft
Reporting
Data Mining
Abonnement Logistik Handel
GeschäftsleitungExterne Kunden
(VDZ, FAZ, Spiegel)
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
lKundenwert- und Haltbarkeitsberechnung –Prognosen für die durchschnittliche Dauer der Kundenbeziehung
lWie vergleicht man am besten Äpfel mit Birnen? – Zwillingsverfahren für die Bildung von Ex-Post-Kontrollgruppen
lQualitätsmessung im Bereich Handel mit dem System Kompass
01.01.2001
01.01.2002
Vergangenheit
Zukunft
A b o a l t e r
Zeitachse
01.01.1990
01.01.2010
VKG-Basis
Standard-Basis
Testgruppe
Kontroll-gruppe?
Kundenzwilling
Gesamtbestand
8,012,0
16,020,0
24,0
10,015,0
17,019,0
21,023,0
25,0
0
5
10
15
20
25
30
35
Remi-Quote
VD
Ausverkaufsquote
Data-Mining-Themen
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Data-Mining-Themen
lReklamationsmodell – Wie viele Reklamationen sind für ein Gebiet zu erwarten?
lHaushaltsabdeckung – Wieviele Haushalte in Deutschland können wir beliefern?
lPLZ-Nachbarn – Welche Postleitzahlen grenzen aneinander?
88,6
3%
76,3
7%
92,3
3%
72,4
2%
70,5
9%
83,9
0%
76,2
1%
66,8
8%
66,8
9%
78,1
6%
77,3
8%
80,8
9%
82,5
0%
81,4
9%
80,1
9%
90,6
0%
95,4
1%
73,5
0%
92,4
1%
67,2
2%
74,9
4%
82,6
0%
79,5
6%
68,7
7%
82,8
7%
87,2
3%
90,1
5%
86,3
8%
81,3
4%
76,1
1%
71,3
0%
72,4
8%
64,9
6%
76,4
9%
86,8
9%
78,7
3%
67,0
2%
82,9
9%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
DD
WE BE MV HH OL
HN KS MD ES KL
KO HA SB ST
SG ME NU DG
-20,00%
-15,00%
-10,00%
-5,00%
0,00%
5,00%
10,00%
15,00%
20,00%
HH-Abdeckung MVS Veränderung zu Vormonat HH-Abdeckung BRD
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
LogistikstrukturenEin leistungsstarkes Logistiknetzwerk
lMehr als 40 Jahre Erfahrung
l Leistungsstarkes Netzwerk für die Zustellung von Printprodukten, z.B.:
l Zeitschriften, Zeitungen, Kataloge, Info-Mailings, Warenproben, Anzeigenblätter, Briefe
lBis zu 40 % Kostenersparnis gegenüber Zustellung durch Deutsche Post AG
lÜber 80 % Haushaltsabdeckung in Deutschland
lZustellung immer Mittwochs und Freitags
lWöchentliches Volumen:
lCa. 1,8 Millionen Zeitschriften-Abonnements der Bauer Media Group
lBis zu 3,5 Millionen Sendungen externer Kunden
lCa. 140 Millionen Sendungen pro Jahr
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
LogistikstrukturenEin leistungsstarkes Logistiknetzwerk
1 Spedition 1 Dienstleistungs-zentrum
2 Call-Center1 Rechen-zentrumLogistik-
Zentrale
40 Mastervertriebsstellen45 Umschlagplätze
575 Vertriebsstellen (selbstständige Subunternehmer)
40.000 Zusteller 800.000 Straßen55.000 Bezirke
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Fragestellungen Logistik
lWie hoch ist unsere Reklamationsquote?
lWie hoch darf sie sein?
lWie gut arbeitet unsere Logistik verglichen mit der Post?
lWie viele Haushalte können wir beliefern?
lWie hoch ist das Zustellpotenzial für externe Kunden?
lWie sind unsere Zusteller strukturiert?
lWie wirken sich strukturelle Veränderungen Auswirkungen auf die Zustellqualität aus?
l…
?Wie kann man die Wirksamkeit
von Veränderungen im Logistiknetzwerk messen?
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Motivation I
lGrundsätzliche Frage: Welche Gebiete sind miteinander vergleichbar?
lWann sind Gebiete einander ähnlich?
lÄhnliche Eigenschaften, z.B. Einkommensstruktur, Einwohner-Dichte, Haushaltsgröße
lSelektion von Aufgabenbezogenen, unabhängigen Variablen, die das Gebiet beschreiben
lBildung von Vektoren
lLösungsansatz: Bildung von Clustern (Gruppen von ähnlichen Elementen)
Problem: Ähnlichkeit einzelner Elemente zu Elementen anderer Cluster ist u.U. größer
als zu Elementen im eigenen Cluster
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Motivation II
lUnser Lösungsansatz: Bildung von individuellen Clustern um jeweils einen spezifischen Mittelpunkt
lDatengrundlage: Mikrogeografische Daten auf PLZ-Ebene (ca. 8000 PLZ)
lZusammenfassung der PLZ-Gebiete zu den Gebieten A, B, C, D und E
A B
C D
E
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Individuelle Gebietsclusterung
lQuantitative Eigenschaften der Gebiete, die in mehreren Geoeinheiten liegen, werden nach einer Regel geteilt
lGrundlage: Verhältnis der Anzahl unserer Abonnenten in der PLZ in Gebiet C und D
lVerhältnis dient als Gewichtungsfaktor für die Eigenschaften, z.B. Anzahl der Haushalte
A B
C D
E
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Mmh
hxX
mll
mliil
mi ...1=
∗=∑
∑
∋
∋ Mmh
hXxs
mll
mli
miil
mi ...1
)( 2
=∗−
=∑
∑
∋
∋
N
XXD
N
i
pi
ki
kp
∑=
−= 1
2)(1 Mpk
N
ssD
N
i
pi
ki
kp ...1,)(
2 1
2
=−
=∑
=
λβ
αα+
−+∗= 1
2)1(1 kpkpkp
DDD
)/( iimi
mi xxXXss −=
Llii xXX
...1
max=
=Ll
ii xxx...1
min=
=
3. Mittelwerte und Standardabweichungen je Variable berechnen
)/()( iiimi
mi xxXXxxXX −−=
wobei
4. Normierung aller Variablen
5. Distanzfunktion für die Mittelwerte und Standard-abweichungen für alle Gebietspaare
6. Zusammenführung der Distanzen durch Gewichtungs-variablen alpha, beta und lambda
1. N Variablen xi und L Mikrogebiete (PLZ) xil mit i=1…N, l=1…L
2. Verteilung der MIkrogebiete L auf M Makrogebiete m1…mM (gegebenenfalls Teilung der Mikrogebiete)
Individuelle Gebietsclusterung
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Individuelle Gebietsclusterung
A B
C D
E
l Berechnung der Distanzen gemäßSchritt 1 bis 6, z.B.:
lDist(A,E)=0,1
lDist(A,B)=0,3
lDist(A,C)=0,5
lDist(A,D)=0,8
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Individuelle Gebietsclusterung
Cluster Individuelle Gebietscluster
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Anwendung für Tests in der Logistikstruktur
Logistik-Zentrale
40 Mastervertriebsstellen45 Umschlagplätze
575 Vertriebsstellen (selbstständige Subunternehmer)
40.000 Zusteller 800.000 Straßen55.000 Bezirke
Logistik-Zentrale
40 Mastervertriebsstellen45 Umschlagplätze
575 Vertriebsstellen (selbstständige Subunternehmer)
40.000 Zusteller 800.000 Straßen55.000 Bezirke
0,65
0,63
0,57
Distanz zum Rest
0,13
0,20
0,16
Distanz Top 3
VS…3a, VS…3b, VS…3cVS…3
VS…2a, VS…2b, VS…2bVS…2
VS…1a, VS…1b, VS…1cVS…1
Top 3 VergleichsgebieteTestgebiet
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Validierung des Verfahrens
Grosso-Gebiete im Einzelhandel, VDZ-Clusterung
0,72
0,71
0,72
0,60
0,58
0,57
0,58
0,60
0,59
0,62
0,75
Distanz zu anderen
0,397Ost Süd 2
0,324Ost Süd 1
0,404Ost Nord
0,438Südwest 2
0,388Südwest 1
0,4314Mitte 2
0,439Mitte 1
0,4514Nord
0,456Urban 2
0,633Urban 1
0,368Südost
Distanz innerhalb
Anzahl Grossisten
Clustername
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Und womit kann man nun Bayern vergleichen?
DistanzBundesland
0,7Brandenburg
0,7Sachsen-Anhalt
0,7Mecklenburg-Vorpommern
0,6Thüringen
0,6Sachsen
0,5Berlin
0,4Hamburg
0,4Bremen
0,3Schleswig-Holstein
0,3Niedersachsen
0,3Nordrhein-Westfalen
0,3Saarland
0,2Hessen
0,2Rheinland-Pfalz
0,1Baden-Württemberg
0,0Bayern
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Zusammenfassung
lPragmatische Lösung des Problems
lBestimmung von individuellen Abstandsmaßen für Gebiete
lFür jedes Gebiet können Einflussvariablen neu bestimmt werden
lAnwendbar auf alle Gebiete, die sich aus Postleitzahlen zusammensetzen lassen
N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung
Vielen Dank! Fragen?
Bauer Systems KG Hamburg