Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15...

21
Data Mining in der Bauer Media Group – Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests Hamburg, 12.03.2009 6. TDWI Roundtable - M. Westphal, N. Brauns, Dr. S. Steinberg

Transcript of Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15...

Page 1: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

Data Mining in der Bauer Media Group –Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests

Hamburg, 12.03.2009 6. TDWI Roundtable - M. Westphal, N. Brauns, Dr. S. Steinberg

Page 2: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Agenda

lVorstellung Bauer Media Group

lData Mining Themen

lLogistikstrukturen der Bauer Media Group

lVerfahren zur individuellen Gebietsclusterung

lZusammenfassung

Page 3: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Bauer Media Group

l 282 Zeitschriften in 15 Ländern

l 48 Zeitschriften in Deutschland

l Auflage von über 15 Millionen Exemplaren pro Erscheinungsintervall (IVW III/2008)

l 6600 Mitarbeiter weltweit

l Jeder zweite Deutsche liest eine Zeitschrift der Bauer Media Group (ma 2008 P II)

l In Deutschland Marktführer in den Segmenten:

l Programmzeitschriften

l Wöchentliche Frauenzeitschriften

l Jugendzeitschriften (BRAVO)

Page 4: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Bauer Systems KG

l IT-Dienstleister für die Bauer Media Group

lca. 180 Mitarbeiter

lAufgabenfelder:

l Support

lSystemadministration

lSystembetrieb (SAP etc.)

lBetrieb Rechenzentrum

lSoftwareentwicklung

l…

lBusiness Intelligence

Page 5: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Business Intelligence in der Bauer Systems

Business Intelligence

20 Mitarbeiter

Data Warehousing / ETL

Kampagnenmanagement

Operatives Geschäft

Reporting

Data Mining

Abonnement Logistik Handel

GeschäftsleitungExterne Kunden

(VDZ, FAZ, Spiegel)

Page 6: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

lKundenwert- und Haltbarkeitsberechnung –Prognosen für die durchschnittliche Dauer der Kundenbeziehung

lWie vergleicht man am besten Äpfel mit Birnen? – Zwillingsverfahren für die Bildung von Ex-Post-Kontrollgruppen

lQualitätsmessung im Bereich Handel mit dem System Kompass

01.01.2001

01.01.2002

Vergangenheit

Zukunft

A b o a l t e r

Zeitachse

01.01.1990

01.01.2010

VKG-Basis

Standard-Basis

Testgruppe

Kontroll-gruppe?

Kundenzwilling

Gesamtbestand

8,012,0

16,020,0

24,0

10,015,0

17,019,0

21,023,0

25,0

0

5

10

15

20

25

30

35

Remi-Quote

VD

Ausverkaufsquote

Data-Mining-Themen

Page 7: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Data-Mining-Themen

lReklamationsmodell – Wie viele Reklamationen sind für ein Gebiet zu erwarten?

lHaushaltsabdeckung – Wieviele Haushalte in Deutschland können wir beliefern?

lPLZ-Nachbarn – Welche Postleitzahlen grenzen aneinander?

88,6

3%

76,3

7%

92,3

3%

72,4

2%

70,5

9%

83,9

0%

76,2

1%

66,8

8%

66,8

9%

78,1

6%

77,3

8%

80,8

9%

82,5

0%

81,4

9%

80,1

9%

90,6

0%

95,4

1%

73,5

0%

92,4

1%

67,2

2%

74,9

4%

82,6

0%

79,5

6%

68,7

7%

82,8

7%

87,2

3%

90,1

5%

86,3

8%

81,3

4%

76,1

1%

71,3

0%

72,4

8%

64,9

6%

76,4

9%

86,8

9%

78,7

3%

67,0

2%

82,9

9%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

DD

WE BE MV HH OL

HN KS MD ES KL

KO HA SB ST

SG ME NU DG

-20,00%

-15,00%

-10,00%

-5,00%

0,00%

5,00%

10,00%

15,00%

20,00%

HH-Abdeckung MVS Veränderung zu Vormonat HH-Abdeckung BRD

Page 8: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

LogistikstrukturenEin leistungsstarkes Logistiknetzwerk

lMehr als 40 Jahre Erfahrung

l Leistungsstarkes Netzwerk für die Zustellung von Printprodukten, z.B.:

l Zeitschriften, Zeitungen, Kataloge, Info-Mailings, Warenproben, Anzeigenblätter, Briefe

lBis zu 40 % Kostenersparnis gegenüber Zustellung durch Deutsche Post AG

lÜber 80 % Haushaltsabdeckung in Deutschland

lZustellung immer Mittwochs und Freitags

lWöchentliches Volumen:

lCa. 1,8 Millionen Zeitschriften-Abonnements der Bauer Media Group

lBis zu 3,5 Millionen Sendungen externer Kunden

lCa. 140 Millionen Sendungen pro Jahr

Page 9: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

LogistikstrukturenEin leistungsstarkes Logistiknetzwerk

1 Spedition 1 Dienstleistungs-zentrum

2 Call-Center1 Rechen-zentrumLogistik-

Zentrale

40 Mastervertriebsstellen45 Umschlagplätze

575 Vertriebsstellen (selbstständige Subunternehmer)

40.000 Zusteller 800.000 Straßen55.000 Bezirke

Page 10: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Fragestellungen Logistik

lWie hoch ist unsere Reklamationsquote?

lWie hoch darf sie sein?

lWie gut arbeitet unsere Logistik verglichen mit der Post?

lWie viele Haushalte können wir beliefern?

lWie hoch ist das Zustellpotenzial für externe Kunden?

lWie sind unsere Zusteller strukturiert?

lWie wirken sich strukturelle Veränderungen Auswirkungen auf die Zustellqualität aus?

l…

?Wie kann man die Wirksamkeit

von Veränderungen im Logistiknetzwerk messen?

Page 11: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Motivation I

lGrundsätzliche Frage: Welche Gebiete sind miteinander vergleichbar?

lWann sind Gebiete einander ähnlich?

lÄhnliche Eigenschaften, z.B. Einkommensstruktur, Einwohner-Dichte, Haushaltsgröße

lSelektion von Aufgabenbezogenen, unabhängigen Variablen, die das Gebiet beschreiben

lBildung von Vektoren

lLösungsansatz: Bildung von Clustern (Gruppen von ähnlichen Elementen)

Problem: Ähnlichkeit einzelner Elemente zu Elementen anderer Cluster ist u.U. größer

als zu Elementen im eigenen Cluster

Page 12: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Motivation II

lUnser Lösungsansatz: Bildung von individuellen Clustern um jeweils einen spezifischen Mittelpunkt

lDatengrundlage: Mikrogeografische Daten auf PLZ-Ebene (ca. 8000 PLZ)

lZusammenfassung der PLZ-Gebiete zu den Gebieten A, B, C, D und E

A B

C D

E

Page 13: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Individuelle Gebietsclusterung

lQuantitative Eigenschaften der Gebiete, die in mehreren Geoeinheiten liegen, werden nach einer Regel geteilt

lGrundlage: Verhältnis der Anzahl unserer Abonnenten in der PLZ in Gebiet C und D

lVerhältnis dient als Gewichtungsfaktor für die Eigenschaften, z.B. Anzahl der Haushalte

A B

C D

E

Page 14: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Mmh

hxX

mll

mliil

mi ...1=

∗=∑

∋ Mmh

hXxs

mll

mli

miil

mi ...1

)( 2

=∗−

=∑

N

XXD

N

i

pi

ki

kp

∑=

−= 1

2)(1 Mpk

N

ssD

N

i

pi

ki

kp ...1,)(

2 1

2

=−

=∑

=

λβ

αα+

−+∗= 1

2)1(1 kpkpkp

DDD

)/( iimi

mi xxXXss −=

Llii xXX

...1

max=

=Ll

ii xxx...1

min=

=

3. Mittelwerte und Standardabweichungen je Variable berechnen

)/()( iiimi

mi xxXXxxXX −−=

wobei

4. Normierung aller Variablen

5. Distanzfunktion für die Mittelwerte und Standard-abweichungen für alle Gebietspaare

6. Zusammenführung der Distanzen durch Gewichtungs-variablen alpha, beta und lambda

1. N Variablen xi und L Mikrogebiete (PLZ) xil mit i=1…N, l=1…L

2. Verteilung der MIkrogebiete L auf M Makrogebiete m1…mM (gegebenenfalls Teilung der Mikrogebiete)

Individuelle Gebietsclusterung

Page 15: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Individuelle Gebietsclusterung

A B

C D

E

l Berechnung der Distanzen gemäßSchritt 1 bis 6, z.B.:

lDist(A,E)=0,1

lDist(A,B)=0,3

lDist(A,C)=0,5

lDist(A,D)=0,8

Page 16: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Individuelle Gebietsclusterung

Cluster Individuelle Gebietscluster

Page 17: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Anwendung für Tests in der Logistikstruktur

Logistik-Zentrale

40 Mastervertriebsstellen45 Umschlagplätze

575 Vertriebsstellen (selbstständige Subunternehmer)

40.000 Zusteller 800.000 Straßen55.000 Bezirke

Logistik-Zentrale

40 Mastervertriebsstellen45 Umschlagplätze

575 Vertriebsstellen (selbstständige Subunternehmer)

40.000 Zusteller 800.000 Straßen55.000 Bezirke

0,65

0,63

0,57

Distanz zum Rest

0,13

0,20

0,16

Distanz Top 3

VS…3a, VS…3b, VS…3cVS…3

VS…2a, VS…2b, VS…2bVS…2

VS…1a, VS…1b, VS…1cVS…1

Top 3 VergleichsgebieteTestgebiet

Page 18: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Validierung des Verfahrens

Grosso-Gebiete im Einzelhandel, VDZ-Clusterung

0,72

0,71

0,72

0,60

0,58

0,57

0,58

0,60

0,59

0,62

0,75

Distanz zu anderen

0,397Ost Süd 2

0,324Ost Süd 1

0,404Ost Nord

0,438Südwest 2

0,388Südwest 1

0,4314Mitte 2

0,439Mitte 1

0,4514Nord

0,456Urban 2

0,633Urban 1

0,368Südost

Distanz innerhalb

Anzahl Grossisten

Clustername

Page 19: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Und womit kann man nun Bayern vergleichen?

DistanzBundesland

0,7Brandenburg

0,7Sachsen-Anhalt

0,7Mecklenburg-Vorpommern

0,6Thüringen

0,6Sachsen

0,5Berlin

0,4Hamburg

0,4Bremen

0,3Schleswig-Holstein

0,3Niedersachsen

0,3Nordrhein-Westfalen

0,3Saarland

0,2Hessen

0,2Rheinland-Pfalz

0,1Baden-Württemberg

0,0Bayern

Page 20: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Zusammenfassung

lPragmatische Lösung des Problems

lBestimmung von individuellen Abstandsmaßen für Gebiete

lFür jedes Gebiet können Einflussvariablen neu bestimmt werden

lAnwendbar auf alle Gebiete, die sich aus Postleitzahlen zusammensetzen lassen

Page 21: Data Mining in der Bauer Media Group · 2009-03-18 · Bauer Media Group l282 Zeitschriften in 15 Ländern l48 Zeitschriften in Deutschland lAuflage von über 15 Millionen Exemplaren

N. Brauns, Dr. S. Steinberg, M. WestphalIndividuelle Gebietsclusterung

Vielen Dank! Fragen?

Bauer Systems KG Hamburg

[email protected] [email protected]

[email protected]