Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions...

73
Aktuelle Forschungsprojekte in der Wirtschaftsinformatik / Informatik Sommersemester 2016 1 23.03.2016 Aktuelle Forschungsprojekte

Transcript of Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions...

Page 1: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Aktuelle Forschungsprojekte

in der Wirtschaftsinformatik / Informatik

Sommersemester 2016

1 23.03.2016 Aktuelle Forschungsprojekte

Page 2: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

ReCoM – Recommendation Services – Entscheidungsunterstützungssysteme für verschiedenste Anwendungsszenarien

MPI – Massively Adhoc Processing in the Internet (Big Data, Datenanalyse)

IWASD – Informative Workspaces in Agile Software Development

MIASE – Media Supported Interaction in Agile Software Engineering

HoEff-CIM – Energieeffiziente Hochschule – Campus Information Modeling

PIMnG – Product Information Management next Generation

Überblick über aktuelle Projekte

2

ReCoM MPI IWASD MIASE PIMnG

M. Häusl

J. Forster

P. Mandl

A. Döschl

N. Bauer

P. Mandl

I. Richter

F. Raith

R. Lindermeier

P. Mandl

HoEff-CIM

E. Januzaj

P. Mandl

23.03.2016 Aktuelle Forschungsprojekte

Page 3: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

ReCoM-Teilprojekt: Einsatz kognitiver Systeme zur Entscheidungsunterstützung

Johannes Forster

Forschungspartner: IBM

23.03.2016 3 Aktuelle Forschungsprojekte

Page 4: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

RaaSEngine

Onlineshop 1

Social Media

Broadcast Media

Personal Context Data

Commercial Product Data

- Facebook- Google +

- Television- Radio- News ticker

- Test Magazines- Usage statistics- Product reviews

Open ProductData

- Wikipedia- Webcrawler

Onlineshopn

- Aktueller Ort- Aktuelle Aktivität- Benutzerprofil

Persönlicher Kontext in Echtzeit

SortimenteKundendatenEmpfehlungen

RaaS integrationKontext

ExterneDaten

RaaS integration

ReCoM – Ursprungsarchitektur

23.03.2016 4 Aktuelle Forschungsprojekte

Page 5: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Research Question

Can a Cognitive Computing system, which is specialised in the handling of unstructered data, be enhancened with structured data analysis to compete with current decision support systems?

23.03.2016 5 Aktuelle Forschungsprojekte

Page 6: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Main columns of Cognitive Computing

by IBM Understands

natural language

Generates and evaluates hypotheses

Adapts and learns

23.03.2016 6 Aktuelle Forschungsprojekte

Page 7: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Projekt Input Management +(IM+)

- Detecting Complaints

-Classification of Complaints

- Sentiment Analysis

23.03.2016 7 Aktuelle Forschungsprojekte

Page 8: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

ReCoM-Teilprojekt InnoDect: Unterstützende Internet-Dienste zur Informationsverdichtung

von Beiträgen aus dem Social Web

Martin Häusl

23.03.2016 8 Aktuelle Forschungsprojekte

Page 9: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Es gibt keine ausreichende Metrik zur Erkennung von SPAM (niedriger Relevanz) rein auf Basis von Metadaten von Social Media Beiträgen

Erkennung von Innovationssignalen in Social Media Beiträgen ist wenig erforscht

Rein textbasierte Ansätze zur Erkennung von SPAM und Innovationssignalen sind kostenintensiv

Ziel ist die Entwicklung von Metriken zur zeitnahen Erkennung von SPAM und Innovationssignalen

Problemstellung (1)

23.03.2016 9 Aktuelle Forschungsprojekte

Page 10: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Entwicklung von Kennzahlen auf Basis von Metadaten zur Identifizierung von SPAM und Einschränkung der weiter auszuwertenden Datenmenge (Innovationserkennung)

Kennzahlen werden in Anlehnung an die Erkenntnisse aus der Graphen- und Netzwerktheorie entwickelt

Strategische Position (Wen jemand kennt)

Aktivität (Wie aktiv jemand ist)

Reputation (Wer jemand ist)

Forschungsaktivitäten (1)

23.03.2016 10 Aktuelle Forschungsprojekte

Page 11: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Weiterentwicklung der Kennzahlen zur Identifizierung von Innovationen

auf Basis der Entropie (Shannon et al.),

anhand der Häufigkeit von Keywords,

der Aktualität und

dem Verbreitungsgrad

Identifizierung von Korrelationen zwischen Metadaten und der Entropie

Forschungsaktivitäten (2)

23.03.2016 11 Aktuelle Forschungsprojekte

Page 12: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Strategische Position • Verhältnis zwischen

Ausgangsgrad (Friend fr)

Eingangsgrad (Follower fo)

Aktivität • Verhältnis zwischen

Alter des Accounts (a)

Anzahl Nachrichten (s)

Zentralitätskonzept • Zusammenführung

• Gewichtung

Kennzahlen

23.03.2016 12 Aktuelle Forschungsprojekte

Page 13: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Forschungsidee - Abgrenzung

Text: Einsatz von Text Mining Verfahren

Metadaten: Verwendung einzelner Metadaten, keine Metriken

Graph: Aufzeichnung eigener Graphen beispielsweise anhand des Retweet Counts in Twitter

Innovation: Anwendung Sozialwissenschaftlicher Forschungsmethoden auf Massendaten (Netnographie) zur Identifizierung von Innovationssignalen

Autor Text Metadaten Graph Innovation

Pennacchiotti & Popescu 2011 X

Boyed und Golder 2010 X

Naaman et al. 2010 X

Tauhid Zaman 2014 X X

Heidemann 2011 X X

Cha et al. 2010 X

Wang 2010 X X

Mark et al. 2012 X X X

Verwandte Arbeiten

23.03.2016 13 Aktuelle Forschungsprojekte

Page 14: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

ReCoM-Teilprojekt:

Knowledge Discovery zur automatischen Modellgenerierung für das Multichannel Marketing

Peter Mandl, Projekt im Aufbau

23.03.2016 14 Aktuelle Forschungsprojekte

Page 15: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

23.03.2016 15 Aktuelle Forschungsprojekte

... Facebook Tumblr Twitter Xing

Internet

Baustein 1: Datenextraktions-Framework

FacebookPlugin TumblrPlugin TwitterPlugin XingPlugin

Baustein 2: Textanalyse-Baustein

Baustein 3: Modellbildungs-Baustein

Baustein 4: Präsentations-Baustein

Modell

...

Ampeldarstellung Modellvisualisierung

Komprimierte Daten in optimiertem Datenmodell

Gesammelte SM-Daten

Neue Modell-Repräsentation

Parametrisierung

Parametrisierung

Parametrisierung

Page 16: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Alexander Döschl

Nikolai Bauer

Forschungspartner: GEMA, XT AG

MPI - Massively parallel Processing in the Internet

23.03.2016 16 Aktuelle Forschungsprojekte

Page 17: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Das Forschungsprojekt MPI (= Massively parallel

processing of internet events) beschäftigt sich mit der

massiven, parallelen Verarbeitung vor allem von

Musiknutzungsdaten

Annahme: Die Menge der Musiknutzungsdaten steigt

weiter an, so dass die aktuell eingesetzten Systeme

der GEMA bei deren Verarbeitung an ihre Grenzen

stoßen

Untersuchungsgegenstand: Erforschung und

Entwicklung effizienter Verarbeitungsprozesse und

Softwarearchitekturen (u. a. Hadoop und NoSQL)

Aufgabenstellung

23.03.2016 17 Aktuelle Forschungsprojekte

Page 18: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Rechte und Nutzungen

Tantiemen

Workflow der Verarbeitung von

Musiknutzungen

23.03.2016 18 Aktuelle Forschungsprojekte

Page 19: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Teilprozesse

23.03.2016 19 Aktuelle Forschungsprojekte

Page 20: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Preprocessing im Cluster

23.03.2016 20 Aktuelle Forschungsprojekte

Page 21: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

SAN Fabric (10GB/s iSCSI) Switch Fabric

(10 GbE) Storage Array

Faculty

Network

Manage-ment &

Monitoring (Ambari and Zookeeper) Distributed Storage

(HDFS)

Distributed Processing

(MapReduce)

Non-Relational Database (HBase)

Operating System (CentOS)

7 Knoten (1 Master, 6 Worker)

Konfiguration je Worker-Knoten: – 3 virtuelle Prozessoren (von Intel Xeon X5650 mit insgesamt 6 Kernen à

2,66 GHz, 12 Threads ≙ 12 virtuellen Prozessoren)

– 12 GB RAM

– 10 Gbit/s-Ethernet

– 128 MB HDFS-Block-Size

Unser Test-Cluster

23.03.2016 21 Aktuelle Forschungsprojekte

Page 22: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Repository-Cluster Sch

nittstellen

DDEX-Files

GEMA-Mitarbeiter

Content-Owner

Informationen

Informationen

Entwicklung eines Repository-Clusters

Repository-Cluster (SUREPO)

23.03.2016 22 Aktuelle Forschungsprojekte

Page 23: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Die Tarife für Lizenznehmer im Außendienst ändern

sich häufig

Sowohl für die Definition der Tarife als auch für deren

Anwendung werden leicht zu handhabende Lösungen

gesucht

Mit Business-Rules-Engines könnten if-Anweisungen

(Rules) ausgelagert werden, so dass diese von

Business-Usern anzupassen sind ohne die

Softwareentwickler involvieren zu müssen

Dies wird im Projekt näher untersucht

Business Rule-Engine

23.03.2016 23 Aktuelle Forschungsprojekte

Page 24: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

IWASD-Teilprojekt: Media supported workspaces in agile software

development

Florian Raith

23.03.2016 24 Aktuelle Forschungsprojekte

Page 25: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

1. Number of distributed software projects increases and Global SW-Development (GSD) becomes a normal practice

2. Agile methods are increasingly chosen to support development (up to 52 percent of software projects are agile in 2013)

Contradiction between agile principles and global software development

Agile workspaces are designed for local usage

• physical media (paper based)

• Information can‘t be shared

Contrary tendencies in software

development

23.03.2016 25 Aktuelle Forschungsprojekte

Page 26: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

• First approach: Web-based tools for agile PM (e.g. Jira, Redmine)

– Lack of transparency

– Quiet meetings

– Decrease of social interaction

– Administration effort • Second approach: Parallel use of physical media and web-

based tools

– Inconsistencies between digital and physical data

– Inconsistencies are often unnoticed

– Increased administrative effort

Approaches in practice and related

problems

23.03.2016 26 Aktuelle Forschungsprojekte

Page 27: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Question 1: What causes the known issues in communication and social interaction using browser-based software instead of a physical task board?

Question 2 Is there a way to exchange status/data of a physical task board between the development teams without disturbing the agile process?

Question 2.1

How can we track the relevant data ?

Question 2.2

How can the physical Task Board be augmented by data of other teams?

Basis Questions

23.03.2016 27 Aktuelle Forschungsprojekte

Page 28: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

• Goal: A concept to share project status amongst distributed agile development teams, without disturbing the agile process

Overall concept

Technical solution

track project status from task board

augment task board with data of dist. teams

Integration

Results of RQ 1

Literature: Heuristics [22], [11] Recommendations [7], [8] Synchronize with PM-Tool

Evaluation

Solution and research objective

23.03.2016 28 Aktuelle Forschungsprojekte

Page 29: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

PM-Tool (e.g.Jira)

Tracking of relevant data from physical media (e.g. Agile Kanban-Board)

Synchronization with a PM-Tool

Project status can be shared btw. development teams and project management

Developer Team Developer Team (Offshore)

Project Management

Technical Ideas

23.03.2016 29 Aktuelle Forschungsprojekte

Page 30: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

MIASE-Teilprojekt: Towards Media supported agile Release Planning

in Distributed Work Environments

Ingo Richter

23.03.2016 30 Aktuelle Forschungsprojekte

Page 31: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Agile Software Development (ASD) is getting increasingly popular in research and practice

More layers of management threatens agility

Executive management support is the most important success factor for small projects

ASD has a comparative lack of documentation when held up against traditional development

Success of software development projects is related to the quality of the Requirements Engineering (RE)

RE in distributed ASD suffers from minimal documentation

Requirements in agile RE change often and regularly

During RP stakeholders discuss their constraints & objectives.

Distributed ASD is already supported by virtual media

Virtual media seems effective to overcome disadvantages of distribution

Motivation

Aktuelle Forschungsprojekte 23.03.2016 31

Page 32: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Insular thinking of the different stakeholders in distributed ASD projects, especially in traditional corporations

This effects RE:

Stakeholders do not communicate as much as it may be required.

Stakeholders make incorrect assumptions.

Stakeholders do not distribute information which may be relevant to other stakeholders.

Research focus:

Higher management stakeholders and project responsible stakeholders

Research Problem

Aktuelle Forschungsprojekte 23.03.2016 32

Page 33: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Research Questions (1) Focus on project management stakeholders: RQ1: What information do project responsible stakeholders need

to make their controlling decisions on a project level?

RQ2: How can this information be collected and stored

(documented) in an agile process without disturbing the agility of the process too much?

RQ3: How can interaction be supported in an agile project, to

achieve a better information flow in distributed project environments?

Aktuelle Forschungsprojekte 23.03.2016 33

Page 34: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Research Questions (2) Focus on higher management stakeholders: RQ4: What information do relevant stakeholders in the higher

management need to make their controlling decisions on a meta-project level?

RQ5: How can agile project data be transformed to meet the formal and continual expectations of the higher management and the corporate controlling instances of a corporation?

RQ6: How can the exchange of information be documented in a traceable way?

RQ7: What typical decisions have stakeholders in the higher management to make?

RQ8: How can they be supported in their decision making?

Aktuelle Forschungsprojekte 23.03.2016 34

Page 35: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Research Methods (1) Research problem and questions Literature research

Interview study with practical experts

Developing a model for distributed agile release planning Develop semantic agile process model based on the general

agile process in OWL.

Develop a concept for automatic data collection, editing and retrieval.

Develop a concept for supporting the decision making of management stakeholders which addresses uncertainty through probabilistic approaches.

Aktuelle Forschungsprojekte 23.03.2016 35

Page 36: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Research Methods (2) Evaluation Observe practical experts who will fulfil selected tasks with the

prototype in their real projects.

Conduct structured interviews with those practical experts afterwards.

Analyze observation protocols and interview transcripts.

Conclude analysis of protocols and transcripts.

Compare analysis with findings of literature research and our interview study.

Aktuelle Forschungsprojekte 23.03.2016 36

Page 37: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Contribution A model to support distributed agile RP: Semantic agile process model (RQ3, RQ6).

Concept of data collection, editing and retrieval (RQ2, RQ3).

Concept for supporting decision making of management stakeholders (RQ1, RQ3, RQ4, RQ5, RQ6, RQ7, RQ8).

Prototypical implementation and evaluation of the model for distributed agile release planning (RQ2, RQ3).

The contributions help to address blind spots in RE research.

Aktuelle Forschungsprojekte 23.03.2016 37

Page 38: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Projekt HoEff - Referenzraummethode und Folgeprojekt

IoT4EER – Internet of Things für Energieeffiziente Raumnutzung

Eshref Januzaj

Kooperationspartner: Fakultät für Versorgungs- und Gebäudetechnik und LMU

23.03.2016 38 Aktuelle Forschungsprojekte

Page 39: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Softwarearchitektur zur Integration der

Referenzraummethode (1/2)

• Hierarchische Systemstruktur

– Projekt -> Gebäude -> Räume

• Modulares IT-System zur Steigerung der Flexibilität und der Erweiterungsmöglichkeit

• Trennung über Rollenkonzept

– Projektanwender, Administrator, Forscher

Aktuelle Forschungsprojekte 39 23.03.2016

Page 40: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Softwarearchitektur zur Integration der

Referenzraummethode (2/2)

Aktuelle Forschungsprojekte 40 23.03.2016

Page 41: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Stand Prototyp

• Umsetzung der Projektstruktur – Projekte

– Gebäude

– Räume

• Benutzerverwaltung (Rollen) – User-Admin

– Projekt-Admin

– „NN“-Admin

Aktuelle Forschungsprojekte 41 23.03.2016

Page 42: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Aktuelle Forschungsprojekte 42 23.03.2016

Page 43: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Verteilte Integrationsplattform

Aktuelle Forschungsprojekte 23.03.2016 43

Page 44: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Was kostet die LMU?

• Fragestellungen: – Wie sähe der

Energieverbrauch nach einer Sanierung aus?

– Wo kann man was [günstig] sanieren?

– Was ist günstiger: • Neue Fenster einbauen?

• Neue (größere) Heizkörper?

• Dämmung? Welche?

Aktuelle Forschungsprojekte 23.03.2016 44

Page 45: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Daten

Informationen

Wissen (entdecken)

„Rohmaterial“

Gebäude Räume

Fassaden Heizung Kühlung

Lüftung …

Strukturierte Daten

Quick Check Tooll FAMOS

DB

Vernetzte Informationen

Data Mining Big Data …

Wissensentdeckung Data Mining Effiziente

Datenanalyse Big Data

Aus Daten Wissen generieren

Aktuelle Forschungsprojekte 23.03.2016 45

Page 46: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

• Forschungsprojekt : HoEff-CIM - EnergieEffiziente Hochschule – Campus Information Modeling

• Schwerpunkt: – kompakte Beschreibung der Gebäudedaten (Geometrie, Energiekomponenten, etc.)

– Evaluierung der passenden Analysetechnik (Data Mining: Clustering, Klassifikation, etc.)

– Berechnung der Ähnlichkeit zwischen Gebäuden/Räumen (prototypisch umsetzen)

• Betreuer: Eshref Januzaj ( E-Mail: [email protected] )

• Kooperation: Gebäudetechnik @ HM

• Es sind mehrere Arbeiten möglich. Auch für Teamarbeit gut geeignet!

Anwendung von Data Mining in der

Gebäudetechnik

Aktuelle Forschungsprojekte 23.03.2016 46

Page 47: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Anwendungsbeispiel: Data Mining (1)

Bildquelle (LMU): http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/muc/s0017/index.html

Data Mining Track Vorverarbeitung

Data Mining

Ähnlichkeitsfunktion

Muster

Auswertung

Aktuelle Forschungsprojekte 23.03.2016 47

Page 48: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Anwendungsbeispiel: Data Mining

Bildquelle (LMU): http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/muc/s0017/index.html

Data Mining Track

Vorverarbeitung

Data Mining

Ähnlichkeitsfunktion

Muster

Auswertung

Aktuelle Forschungsprojekte 23.03.2016 48

Page 49: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse ( aus Sicht der IT ) Architektur

Aktuelle Forschungsprojekte 23.03.2016 49

Page 50: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse-Beispiel: „Berg

Sandkorn“

LMU Innenstadt Bildquelle: http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/lageplan_lmu.pdf

Aktuelle Forschungsprojekte 23.03.2016 50

Page 51: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse-Beispiel: „Berg

Sandkorn“

Bildquelle: http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/lageplan_lmu.pdf

Aktuelle Forschungsprojekte 23.03.2016 51

Page 52: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse-Beispiel:

„Berg Sandkorn“

Aktuelle Forschungsprojekte 23.03.2016 52

Page 53: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse-Beispiel: „Berg Sandkorn“

Aktuelle Forschungsprojekte 23.03.2016 53

Page 54: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Datenanalyse-Beispiel: „Berg Sandkorn“

RAUM

Bezeichnung

Stockwerk Adresse

Länge

Breite

Höhe

Fläche

Volumen

#Fenster

#Türe

Fensterfläche

Fassade (alt, neu, etc.)

Straßenseite (JA | NEIN)

Heizkörper (m³)

Stromverbrauch

Heizenergie-verbrauch

Nutzungsart (Büro, Labor, etc.)

Raum-Parameter bestimmen

… …

Aktuelle Forschungsprojekte 23.03.2016 54

Page 55: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Peter Mandl

Forschungspartner: iSYS Software GmbH

Aktuelle Forschungsprojekte 23.03.2016 55

PIMnG – Product Information Management next Generation

Page 56: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

QCEP - Abnahmetestgetriebene Entwicklung von ereignisbasierten

Anwendungen

Johannes Weiß

Forschungspartner: UniCredit

Aktuelle Forschungsprojekte 23.03.2016 56

Page 57: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Motivation

• Die Anzahl der digital verfügbaren Daten (Ereignisse) wächst stetig (jährlicher „Umsatz“ 2013: 4,4 ZB, 2020: 44 ZB*)

• Event-Processing (EP) bietet Ansätze und Lösungen, um Ereignisströme in (weicher) Echtzeit zu korrelieren und Muster zu erkennen

• Durch die Abbildung von fachlicher Anwendungsfunktionalität in EP-Anwendungen gewinnt das funktionale, dynamische Testen an Bedeutung

• Ein aktueller Ansatz der agilen Softwaretechnik ist die abnahmetestgetrieben Entwicklung (ATDD- Acceptance Test Driven Development)

*„Das digitale Universum“, EMC/IDC Studie (http://germany.emc.com/leadership/digital-universe/index.htm)

Aktuelle Forschungsprojekte 23.03.2016 57

Page 58: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Forschungsfragen

1. Wie kann ATDD im Bereich der EP-Anwendungsentwicklung eingesetzt werden? – Wie können funktionale Testfälle

benutzerorientiert erstellt werden? – Welche Funktionalitäten muss ein Testsystem

bereitstellen, um solche Testfälle auszuführen?

2. Welche Auswirkungen hat der Einsatz von ATDD auf ausgewählte Performanceindikatoren der EP-Anwendungsentwicklung?

Aktuelle Forschungsprojekte 23.03.2016 58

Page 59: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Motivierendes Beispiel – Erkennen von EC-

Kartenbetrug

Statistiken 2012*:

Anzahl Transaktionen: ca. 2,5 Mrd.

Betrugsfälle: ca. 38.000

Schaden : ca. 1,33 Mrd. €

Szenario:

Erkennen von betrügerischen Kartentransaktionen

Beispielanforderung:

Wenn innerhalb einer Stunde mit derselben EC-Karte zwei Transaktionen (T1, T2) von Orten getätigt werden, die mehr als 200 km entfernt sind, sperre die Karte.

*de.statista.com, handelsblatt.com

EP-Anwendung

T2 @Rom, 17:32 T1 @ Dresden, 16:42

S

Aktuelle Forschungsprojekte 23.03.2016 59

Page 60: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Motivierendes Beispiel – Erkennen von EC-

Kartenbetrug

Statistiken 2012*:

Anzahl Transaktionen: ca. 2,5 Mrd.

Betrugsfälle: ca. 38.000

Schaden : ca. 1,33 Mrd. €

Szenario:

Erkennen von betrügerischen Kartentransaktionen

Beispielanforderung:

Wenn innerhalb einer Stunde mit derselben EC-Karte zwei Transaktionen (T1, T2) von Orten getätigt werden, die mehr als 200 km entfernt sind, sperre die Karte.

*de.statista.com, handelsblatt.com

EP-Anwendung

T2 @Rom, 17:32 T1 @ Dresden, 16:42

S

Zeitfenster

Minuten

T1

0 60

T2a T2c

Transaktionen T2a und T2b würde zur Erzeugung eines

Sperrereignisses (S) führen, bei T2c wäre alles in Ordnung.

S

Testvarianten EC-Karten Transaktionen

T2b

S

Aktuelle Forschungsprojekte 23.03.2016 60

Page 61: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Entwicklung einer

Testbeschreibungssprache

• EPTDL – Event Processing Test Description Language

• Eigenschaften: – Tabellen zum Definieren, Ausführen

und Überprüfen von Ergebnissen (inkl. Negation)

– virtuelles Attribute „:time“ (Entdeckungszeit)

– Zeitangaben beim Initialisieren und beim Ausführen (Start- und Zielzeit)

– Operatoren (:op ) für detaillierte Ergebnis-Prüfungen: z.B. <,>,<=,>=,<>

*Auszug EPTDL

Aktuelle Forschungsprojekte 23.03.2016 61

Page 62: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

QCEP-Testsystem zur Ausführung von

EPTDL-Tests

Aktuelle Forschungsprojekte 23.03.2016 62

Page 63: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

http://sourceforge.net/p/qcep-ts

EP Engine

API Test Engine

Test Client

API

API EP Driver

API

App

FitNesse Framework mit EP - Fixtures

Testschnittstelle, Testfunktionalität(RMI)

einheitliche Zugriffsschnittstelle (RMI inkl. Callback)

Aktuell angebunden:

Prototypische Umsetzung des QCEP-

Testsystem

produktunabhängig

produktabhängig

Aktuelle Forschungsprojekte 23.03.2016 63

Page 64: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Empirische Studien

Ergebnisse des Experiments „FINDBUGS“ • Wie lange benötigen Teilnehmer um Fehler in Testfällen in einem gewissen

Format (automatisierbar vs. nicht automatisierbar) zu finden?

• Ergebnis: Signifikanter Unterschied. Es kann ein positiver Effekt in Richtung automatisierbares Format gemessen werden.

Aktuelle Forschungsprojekte 23.03.2016 64

Page 65: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

ReCoM-Teilprojekt:

Rated Tags as a Service Konzept und Evaluierung

Daniel Kailer

Promotion und Projekt abgeschlossen

Aktuelle Forschungsprojekte 23.03.2016 65

Page 66: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Problemstellung

• Kontext: Onlinehandel

• Suche nach passendem Produkt zeitaufwendig

• Gesamtbewertungen nicht hilfreich für spezifische Produktmerkmale

• Rezensionen enthalten viele Informationen, sind jedoch unstrukturiert

Aktuelle Forschungsprojekte 23.03.2016 66

Page 67: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Ziel

• Verbesserung der Entscheidungsfindung durch Vergabe von bewertbaren Tags (Rated Tags)

Aktuelle Forschungsprojekte 23.03.2016 67

Page 68: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Evaluierung der Entscheidungshilfe

• Durchführung einer Anwenderstudie mit 34 Teilnehmern, aufgeteilt in Rated Tags-Gruppe und Kontrollgruppe

• Überprüfung des Entscheidungsaufwands (Dauer der Entscheidung) sowie der Entscheidungsqualität

• Statistische Hypothesentests zeigen für Teilnehmer der Rated Tags-Gruppe eine signifikante Reduzierung des Aufwands sowie eine signifikante Verbesserung der Entscheidungsqualität

Aktuelle Forschungsprojekte 23.03.2016 68

Page 69: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Weiteres Ziel

• Vereinheitlichung der Benutzer-generierten Tags anhand von Textklassifikatoren

Aktuelle Forschungsprojekte 23.03.2016 69

Page 70: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Klassifikationsmodell

• Nutzung von erprobten Basisklassifikatoren wie Naive Bayes und Support Vector Machine

• Kompensation der Schwächen o.g. Klassifikatoren durch neu entwickelte Text-basierte und Wörterbuch-basierte Klassifikatoren

• Entwurf eines Ensemble-Klassifikators, der für die endgültige Klassifikationsentscheidung alle Klassifikatoren miteinander kombiniert

Aktuelle Forschungsprojekte 23.03.2016 70

Page 71: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Evaluierung des Klassifikationsmodells

• Extraktion von über 5.000 echten Benutzermeinungen aus einem Bewertungsportal in Form von Vor- und Nachteilen (Tags)

• Erstellung eines Goldstandards, d.h. Zuweisung einer Merkmalsklasse zu jedem Tag

• Anwendung von gängigen Evaluierungsmetriken wie Precision, Recall und F1-Wert sowie einer 10-fach stratifizierten Kreuzvalidierung

• Umsetzung mittels Data Mining-Software WEKA

Aktuelle Forschungsprojekte 23.03.2016 71

Page 72: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Evaluierung des Klassifikationsmodells

Aktuelle Forschungsprojekte 23.03.2016 72

Page 73: Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions Literature research Interview study with practical experts Developing a model for distributed

Beiträge der Arbeit

• Studienergebnisse zeigen verbesserte Entscheidungsqualität sowie verminderten Entscheidungsaufwand bei Anwendung von Rated Tags

• Güte des entworfenen Klassifikators zur Vereinheitlichung der erstellten Tags übersteigt den aktuellen Stand der Technik

Aktuelle Forschungsprojekte 23.03.2016 73