6. TDWI Roundtable in Hamburg Begrüßung / Agenda Source.pdf · • SpagoBI : The Business ......

25
12. März 2009 6. TDWI Roundtable in Hamburg www.tdwi.eu 6. TDWI Roundtable in Hamburg Begrüßung / Agenda Fred Türling Björn Kühl Quelle: http://commons.wikimedia.org/wiki/Image: Hamburg-Michaeliskirche-Hafen.jpg Published under GNU Free Documentation license

Transcript of 6. TDWI Roundtable in Hamburg Begrüßung / Agenda Source.pdf · • SpagoBI : The Business ......

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

6. TDWI Roundtablein HamburgBegrüßung / Agenda

Fred TürlingBjörn Kühl

Quelle: http://commons.wikimedia.org/wiki/Image:Hamburg-Michaeliskirche-Hafen.jpg

Published under GNU Free Documentation license

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

AGENDA

• 18:00 – 18:10 BegrüßungFred Türling, Tom Gansor, TDWI Roundtable Hamburg

• 18:10 – 19:00 Praxisvortrag"Data Mining in der Bauer Media Group – Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests“Martin Westphal, Bauer Media Group

• 19:00 – 19:50 Forumsdiskussionzum Thema: "Ist Open Source BI (schon) reif für die Praxis in den Unternehmen?" moderiert von Fred Türling und Björn Kühl

• ab 19:50 Get Together / Imbiss

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

TDWI-D-A-CH: die neutrale BI-Community

Berater Anwender

Hersteller

Einzel-Mitgliedschaften

Sammel-Mitgliedschaften

Wissenschaft

neutral

non-Profit

unabhängig

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

PrintSeminare

Leistungen und Angebote

KonferenzenRoundtable

Anwender-Treffen

cbipOnlineCommunity

Meetings

Details siehe Präsentationsdownload!

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

PrintSeminare

Konferenzen dienen der Weiterbildung

KonferenzenRoundtable

Anwender-Treffen

cbipOnlineCommunity

Meetings

9th European TDWI Conference 2009München , 15.-17.06.2009

• First Bird Special: Sparvorteil und TDWI Buch koste nlos

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Zusammenfassung

BeraterAnwenderForscher Hersteller

Einzel-Mitgliedschaften

Firmen-Mitgliedschaften

TDWIdas gute Fundament für Ihre

Business Intelligence Entwicklung

PrintSeminare

KonferenzenRoundtable

Anwender-Treffen

cbipOnlineCommunity

Meetings

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Allgemein Roundtable Hamburg

TDWI Germany E-Mail:Lindlaustraße 2c [email protected] Troisdorf [email protected]

E-Mail: [email protected]

www.TDWI.eu

Haben Sie Fragen ?

Quelle: http://commons.wikimedia.org/wiki/Image:Hamburg-Michaeliskirche-Hafen.jpg

Published under GNU Free Documentation license

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

AGENDA

• 18:00 – 18:10 BegrüßungFred Türling, Tom Gansor, TDWI Roundtable Hamburg

• 18:10 – 19:00 Praxisvortrag"Data Mining in der Bauer Media Group – Vorstellung eines Verfahrens zur Auswahl vergleichbarer Gebiete für regionale Tests“Martin Westphal, Bauer Media Group

• 19:00 – 19:50 Forumsdiskussionzum Thema: "Ist Open Source BI (schon) Reif für die Praxis in den Unternehmen?" moderiert von Fred Türling und Björn Kühl

• ab 19:50 Get Together / Imbiss

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Ist Open Source BI (schon) reif für die Praxis in den Unternehmen?

Forumsdiskussion

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Open Source

• Open Source ist eine Palette von Lizenzen für Software, deren Quelltext öffentlich zugänglich ist und durch die Lizenz Weiterentwicklungen fördert

• Die Lizenzverträge haben diese drei charakteristischen Merkmalen:– Die Software darf beliebig kopiert, verbreitet und genutzt werden

(keine Nutzungsbeschränkungen / keine Zahlungs-verpflichtungen gegen einen Lizenzgeber)

– Die Software (d. h. der Quelltext) liegt in einer für den Menschen lesbaren und verständlichen Form vor

– Die Software darf verändert und in der veränderten Form weitergegeben werden

Quelle: Wikipedia

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Auswahl von Open Source BI Tools

• Pentaho : Open Source Business Intelligence Suite – Integratives Paket verschiedener Open-Source-BI-Tools

• JasperIntelligence : Business Intelligence Suite von JasperSoft• Palo : in Deutschland entwickelte Open-Source-OLAP-Datenbank mit

kostenfreiem Microsoft Excel-Addin• RapidMiner (vormals YALE): freie Open-Source Software für Business-

Intelligence, Knowledge-Discovery und Data-Mining• Waikato Environment for Knowledge Analysis (Weka) : freie Open-

Source-Software für Data Mining • BIRT: Business-Intelligence- and Reporting-Tools des Eclipse-Projektes• SpagoBI : The Business Intelligence Free Platform• Bizgres : Business Intelligence mit PostgreSQL• Talend : ETL und Data Integration Lösung• …

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Meinungen aus einer Diskussion zu Open Source

„ […]

das erste Ziel von Pentaho ist der professionelle Support durch den es erst möglich wird Open Source "sicherer" einzusetzen.

[…]

Zum Thema Firmengröße: derzeit wird gerade in Großunternehmen OS vorrangig eingesetzt - aber niema nd möchte sich als Referenz nennen lassen ;-)

Das Potential ist m.E. enorm - Pentaho ist es gelungen im OSBI-Umfeld die Nummer 1 zu sein und wird sich neben den Closed-Source-Anbietern etablieren. Die vollständige Funktionalität ist noch nicht abgedeckt, aber es ist nur eine Frage de r Zeit.

Für das ETL-Tool Kettle / Pentaho Data Integration kan n ich sagen, dass es schon viele Closed-Source-Anbieter au s dem Rennen geworfen hat.

Meine Meinung ist übrigens nicht ganz neutral, da wir CertifiedPentaho Solution Partner sind und ein SAP-Connector(ProSAPCONN) und eine weitere Datenbankschnitstelle für das ETL-Tool Kettle / Pentaho Data Integration entwickelt haben ;-)“

Zitat Jens Bleuel PentahoCorporation

XING Diskussionsforum

2008

https://www.xing.com/app/forum?op=showarticles;id=1724797;offset=0

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Meinungen aus einer Diskussion zu Open Source

„Hier [bei Open Source BI] von "Marktdurchdringung" z u sprechen, ist wohl etwas übertrieben. Als Marktbeobachter für BI kann ich ihnen sagen, daß keiner der Open Source BI Anbieter irgendwelche Durchdringung erreicht hat. Die Anzahl der Downloads der entsprechenden Produkte ist nicht signifikant, da es nur ein generisches Interesse anzeigt. Die Zahl der OS BI Produkte in Produktion geht (im Vergleich zu den "herkömmlichen" BI Anbietern) gegen Null. [...]

Gerade Großunternehmen verlassen sich nicht auf vag en Support für solche wichtigen Infrastruktur-Komponenten wie BI . Daß hier OS auch getestet wird und damit "rumgespielt" bestreite ich nicht, aber in meinen unzähligen Gesprächen mit den großen Banken, Telcos, Autobauern, oder Retailern ist OS BI schlicht und einfach kein Thema. […]

Klar haben die sich gewissermaßen "etabliert", aber auf was für einem Level? Selbst als Nummer 1 im OS BI Umfeld sind Pentaho noc h nicht mal am Horizont erkennbar.[…]

… aber mit den derzeitigen Lücken aller OS BI Anbieter wird das im Vergleich zu BOBJ, COGN, HYSL, SAS noch viele Jahre dauern.“

[…]

Zwischen den kommerziellen Daten-Integrations-Tools (PowerCenter, Information Server, OWB/ODI, etc) und den Open Source Anbietern wie Pentaho/Kettle, Talend, IKAN, Jitterbit, Enhydra, SeETL, liegen immer noch Welten . Nicht zuletzt redet man im Open Source Umfeld immer noch von ETL, während man im kommerziellen Umfeld schon Jahre weiter ist, und neben ETL zusätzlich Federation, Replication, Synchronization, Metadaten-Management, Datenqualität, usw. anbietet..

Meine Meinung ist übrigens 100% neutral, das ist nämlich mein Job. “

Zitat Andreas Bitterer, Gartner

XING Diskussionsforum

2008

https://www.xing.com/app/forum?op=showarticles;id=1724797;offset=0

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Fragen an das Forum – 1 :

• Wer hat bereits Open Source BI-Tools eingesetzt?– 5 Teilnehmer (von 45) haben Open Source BI-Tools im Einsatz– 15 Teilnehmer (von 45) haben schon mal Open Source BI-Tools

heruntergeladen und getestet• Welche Tools wurden eingesetzt?

– Kettle / Palo / Pentaho / Rapid Miner• Wie ist Ihre Erfahrung mit diesen Tools?

– Sinnvoll als Backup zu Closed Source.– Einsetzbar in kleineren Projekten, es ist schnell und günstig implementiert.

Anspruch ist allerdings: Nur wenige User / geringes Datenvolumen (Palo).– Bereits erfolgreiche kleinere Implementierungen (geringes Risiko) auch als Poc.– Rapid Miner als kostengünstige Variante einer Data Mining Komponente.– Rapid Miner wird bereits in begrenzten Maßen eingesetzt. Problem: Service

kosten in der Implementierung.– Rapid Miner wird bei Ford zur Datenanalyse eingesetzt.– Pentaho Data Integration liefert eine gute Performance mit guter Sicherheit. Bei

kleineren Projekten bereits implementiert.

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Anwendungsbeispiel:Qualitative Kosten / Nutzen Analyse bei der Toolevalu ierung

für

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Qualitative Kosten / Nutzen Analyse

Hardware und Software InfrastrukturAufwand:• Anschaffung / Lizenzen• Betrieb / Wartung• Erweiterungen

Software Leistungsumfang / Features:• Leistungsfähigkeit DB• ETL Tool• Reporting Applikation

Entwicklungs- und BetriebsprozesseEntwicklung:• ETL Entwicklung• Report Entwicklung• Konfigurationsmanagement

Betrieb:• Monitoring (Host, DB, Ladeprozesse)• Back up and Recovery• Benutzerverwaltung und Security Konzepte• Anwenderbetreuung

Qualitative Kosten- / Nutzenanalyse

• Aufwand für Anschaffung, Betrieb und Erweiterung (Aufwand)

• Unterstützung für Entwicklungs- und Betriebsprozesse (Nutzen)

• Software Leistungsumfang (Qualität)

Anforderungen

Prioritäten Aufwand und Leistungsumfang

Methode für die qualitative Kosten- und Nutzenanalyse

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Die Tools wurden aus 4 Blickrichtungen bewertet

Investitions- und Betriebsaufwand

Unterstützung fürBetriebsprozesse

Unterstützung fürEntwicklungsprozesse

Leistungsumfang Software und deren

Hersteller

Qualitative Kosten- / Nutzen-

Betrachtung

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Lizenzumfang

Lizenzumfang der betrachteten Systeme

Oracle Standard Ed.Warehouse BuilderBusiness Objects

Oracle 10g R2

(40 Named User)

BO Edge Standard

(5 Concurrent + 5 Named User)

Crystal Reports Prof.(3 Named User)

Crystal Xcelsius Designer(3 Named User)

Microsoft Enterprise Ed.SQL Server 2005

BI Suite

SQL Server 2005

(40 Named User)

Pro Clarity Analytics Desktop Pro

(40 Named User)

My SQLPentaho BI Suite

My SQL 5.0 Enterprise

Pentaho Open BI Suite 1.6.0-GA

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Datenbank

Leistungsumfang und Eignung der Werkzeuge

Oracle und Business Objects Microsoft

+ Wichtige DWH Features incl. Partitionierung und Parallelisierung

+ Sehr gute Administrations-tools für Monitoring und Backup

Open Source MySQL und Pentaho

+ Wichtige DWH Features- Keine Partitionierung- Backup unterstützt DWH

Betrieb nicht optimal

ETL Tool

+ Gute Unterstützung der Entwicklungsarbeit

- Prozesssteuerung schwächer unterstützt

- Repository auf nicht vergleichbarem Niveau

Reporting

+ Beste Bedienbarkeit für den Fachanwender

+ Sehr gute Zugriffs- und Funktionskontrolle

+ Sehr gutes Repository

+ Gute Bedienbarkeit für den Fachanwender

+ Gute Zugriffskontrolle- Dash Board und Cockpits in

Performance Point Server 2008

+ Gutes Standardreporting- Ad hoc Reporting für

Fachanwender nicht zumutbar.

- Stabilität der Releases noch unzureichend

+ Wichtige DWH Features+ Sehr gute

Administratonstools für Monitoring und Backup

- Keine Partitionierung und Paralleliserung

+ Sehr gute Unterstützung Entwicklungsarbeit

+ Sehr gute Prozesssteuerung+Ausgereiftes leistungsfähiges

Repository+ Deploymentmanagment

+ Sehr gute Unterstützung Entwicklungsarbeit

+ Sehr gute Prozesssteuerung+ Unterstützung für

Datenqualitätsmanagment- Repository nicht optimal

unterstützt

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Summary

• Die open source Variante mit MySQL und der Pentaho BI Suite scheidet aus, da die Anforderungen der Fachabteilung qualitativ nicht erfüllt werden können und dieser Mangel durch die Unterstützung mindestens eines weiteren IT Mitarbeiters kompensiert werden müsste

• Die Lizenz- und Wartungskosten aller drei Szenarien bewegen sich auf vergleichbarem Niveau. Nimmt man Produktivitätsgewinne in der Entwicklung und im laufenden Betrieb hinzu ergibt sich ein Vorteil für die Oracle / BO Lösung

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Diskussionspunkte im Forum

• Ist das Kostenmodell für alle Größenklassen von Unt ernehmen nutzbar?– Nein

• Ist der Reifegrad auf allen Ebenen – ETL und DWH– Reporting / OLAP– Data Mining

vergleichbar?– Eine Migration eines Closed Source DWH in eine Open Souce Variation ist momentan nicht denkbar.– Die Produkte sind für eine Enterprise-Architektur zu unterschiedlich und meist nicht kompatibel. (Zentrale

Steuerung von Prozessen, Zugriffsrechten, Ressourcen)– Liefern OS-Tools eine entsprechend gute Datenqualität? (Fehlende Vergleichsmöglichkeiten) – MySQL stößt auch bei massiven Hardwareaufwand an seine Grenzen.

• Wer plant zukünftig Open Source BI-Tools einzusetzen ?

• Für welche Einsatzzwecke?

• Wie könnte Open Source BI eingesetzt werden?– Open Source ist als "Einstiegsdroge" für den Mittelstand denkbar.– Einsatz im Mittelstand "Green-Field" zur ersten Veranschaulichung der Thematik DWH / BI / Reporting mit

einer kleinen Implementierung basierend auf Unternehmensdaten. "BI zum anfassen". Die Rechtfertigung für einen späteren Wechsele muss im Vorfeld berücksichtig werden.

– Ein weiterer Nutzen von Open Source Produkten ist die Freiheit gegenüber Herstellern. Es entstehen keine vertraglichen Verpflichtungen.

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Weiterführende Informationen

• Open Source Business Intelligence: Quelloffene Werkzeuge für Reporting, OLAP und Data Mining im Vergleich

– Getestete Produkte der Studie "Open Source Business Intelligence" • Werkzeugkategorie Projekt/Releasestand• Reporting Jasper Reports 2.0.3 • Reporting Pentaho Reporting 1.6.0 • Reporting Eclipse BIRT 2.2.1 • OLAP jPivot/Mondrian 1.8.0/3.0.3 • OLAP Palo 2.0 • Data Mining RapidMiner 4.0 • Data Mining KNIME 1.3.3 • Data Mining WEKA 3.5.6

– Autoren: Prof. Dr. Peter Gluchowski, Christian SchiederErscheinungsdatum: Februar 2009

• Open Source Data Warehousing und Datenintegration: Chancen, Risiken und Kostenaspekte

– Autoren: Jacqueline Bloemen, Timm Grosser, Alexander HauskrechtErscheinungsdatum: Februar 2009

Quellen: http://www.barc.de/de/studien.html

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

AnhangToolevaluierung

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Investitions- und Betriebsaufwand

Unterstützung fürBetriebsprozesse

Lizenzkosten

Wartungskosten (SW)

Hardwarekosten

Schulungsaufwand

Aufwand für quantitative Erweiterungen

Monitoring Host / DB / Ladeprozesse

Scheduling

Wartung Datenbank

Wartung Ladeprozesse

Anwenderbetreuung Reporting und „Selfservice“-Fähigkeiten

Benutzerverwaltung und Zugriffskontrolle

Skalierbarkeit Performance / Volumen

Bewertungskriterien der Tools - 1

© SHS VIVEON AG

12. März 20096. TDWI Roundtable in Hamburgwww.tdwi.eu

Unterstützung fürEntwicklungsprozesse

Leistungsumfang Software und deren Hersteller

ETL Entwicklung

Report Entwicklung

Performanceoptimierung

Konfigurationsmanagement

Datenqualitätsmanagement

Metadatenmanagement

DatenbankDWH FeaturesAdminstrationSupportSkalierbarkeit

ETL ToolsFunktionalitätTechnologieBetrieb/Konfigurations-managementIntegration

ReportingFunktionalitätTechnologieBetriebIntegration

Bewertungskriterien der Tools - 2

© SHS VIVEON AG