Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions...
Transcript of Aktuelle Forschungsprojekte in der Wirtschaftsinformatik ... · Research problem and questions...
Aktuelle Forschungsprojekte
in der Wirtschaftsinformatik / Informatik
Sommersemester 2016
1 23.03.2016 Aktuelle Forschungsprojekte
ReCoM – Recommendation Services – Entscheidungsunterstützungssysteme für verschiedenste Anwendungsszenarien
MPI – Massively Adhoc Processing in the Internet (Big Data, Datenanalyse)
IWASD – Informative Workspaces in Agile Software Development
MIASE – Media Supported Interaction in Agile Software Engineering
HoEff-CIM – Energieeffiziente Hochschule – Campus Information Modeling
PIMnG – Product Information Management next Generation
Überblick über aktuelle Projekte
2
ReCoM MPI IWASD MIASE PIMnG
M. Häusl
J. Forster
P. Mandl
A. Döschl
N. Bauer
P. Mandl
I. Richter
F. Raith
R. Lindermeier
P. Mandl
HoEff-CIM
E. Januzaj
P. Mandl
23.03.2016 Aktuelle Forschungsprojekte
ReCoM-Teilprojekt: Einsatz kognitiver Systeme zur Entscheidungsunterstützung
Johannes Forster
Forschungspartner: IBM
23.03.2016 3 Aktuelle Forschungsprojekte
RaaSEngine
Onlineshop 1
Social Media
Broadcast Media
Personal Context Data
Commercial Product Data
- Facebook- Google +
- Television- Radio- News ticker
- Test Magazines- Usage statistics- Product reviews
Open ProductData
- Wikipedia- Webcrawler
Onlineshopn
- Aktueller Ort- Aktuelle Aktivität- Benutzerprofil
Persönlicher Kontext in Echtzeit
SortimenteKundendatenEmpfehlungen
RaaS integrationKontext
ExterneDaten
RaaS integration
…
ReCoM – Ursprungsarchitektur
23.03.2016 4 Aktuelle Forschungsprojekte
Research Question
Can a Cognitive Computing system, which is specialised in the handling of unstructered data, be enhancened with structured data analysis to compete with current decision support systems?
23.03.2016 5 Aktuelle Forschungsprojekte
Main columns of Cognitive Computing
by IBM Understands
natural language
Generates and evaluates hypotheses
Adapts and learns
23.03.2016 6 Aktuelle Forschungsprojekte
Projekt Input Management +(IM+)
- Detecting Complaints
-Classification of Complaints
- Sentiment Analysis
23.03.2016 7 Aktuelle Forschungsprojekte
ReCoM-Teilprojekt InnoDect: Unterstützende Internet-Dienste zur Informationsverdichtung
von Beiträgen aus dem Social Web
Martin Häusl
23.03.2016 8 Aktuelle Forschungsprojekte
Es gibt keine ausreichende Metrik zur Erkennung von SPAM (niedriger Relevanz) rein auf Basis von Metadaten von Social Media Beiträgen
Erkennung von Innovationssignalen in Social Media Beiträgen ist wenig erforscht
Rein textbasierte Ansätze zur Erkennung von SPAM und Innovationssignalen sind kostenintensiv
Ziel ist die Entwicklung von Metriken zur zeitnahen Erkennung von SPAM und Innovationssignalen
Problemstellung (1)
23.03.2016 9 Aktuelle Forschungsprojekte
Entwicklung von Kennzahlen auf Basis von Metadaten zur Identifizierung von SPAM und Einschränkung der weiter auszuwertenden Datenmenge (Innovationserkennung)
Kennzahlen werden in Anlehnung an die Erkenntnisse aus der Graphen- und Netzwerktheorie entwickelt
Strategische Position (Wen jemand kennt)
Aktivität (Wie aktiv jemand ist)
Reputation (Wer jemand ist)
Forschungsaktivitäten (1)
23.03.2016 10 Aktuelle Forschungsprojekte
Weiterentwicklung der Kennzahlen zur Identifizierung von Innovationen
auf Basis der Entropie (Shannon et al.),
anhand der Häufigkeit von Keywords,
der Aktualität und
dem Verbreitungsgrad
Identifizierung von Korrelationen zwischen Metadaten und der Entropie
Forschungsaktivitäten (2)
23.03.2016 11 Aktuelle Forschungsprojekte
Strategische Position • Verhältnis zwischen
Ausgangsgrad (Friend fr)
Eingangsgrad (Follower fo)
Aktivität • Verhältnis zwischen
Alter des Accounts (a)
Anzahl Nachrichten (s)
Zentralitätskonzept • Zusammenführung
• Gewichtung
Kennzahlen
23.03.2016 12 Aktuelle Forschungsprojekte
Forschungsidee - Abgrenzung
Text: Einsatz von Text Mining Verfahren
Metadaten: Verwendung einzelner Metadaten, keine Metriken
Graph: Aufzeichnung eigener Graphen beispielsweise anhand des Retweet Counts in Twitter
Innovation: Anwendung Sozialwissenschaftlicher Forschungsmethoden auf Massendaten (Netnographie) zur Identifizierung von Innovationssignalen
Autor Text Metadaten Graph Innovation
Pennacchiotti & Popescu 2011 X
Boyed und Golder 2010 X
Naaman et al. 2010 X
Tauhid Zaman 2014 X X
Heidemann 2011 X X
Cha et al. 2010 X
Wang 2010 X X
Mark et al. 2012 X X X
Verwandte Arbeiten
23.03.2016 13 Aktuelle Forschungsprojekte
ReCoM-Teilprojekt:
Knowledge Discovery zur automatischen Modellgenerierung für das Multichannel Marketing
Peter Mandl, Projekt im Aufbau
23.03.2016 14 Aktuelle Forschungsprojekte
23.03.2016 15 Aktuelle Forschungsprojekte
... Facebook Tumblr Twitter Xing
Internet
Baustein 1: Datenextraktions-Framework
FacebookPlugin TumblrPlugin TwitterPlugin XingPlugin
Baustein 2: Textanalyse-Baustein
Baustein 3: Modellbildungs-Baustein
Baustein 4: Präsentations-Baustein
Modell
...
Ampeldarstellung Modellvisualisierung
Komprimierte Daten in optimiertem Datenmodell
Gesammelte SM-Daten
Neue Modell-Repräsentation
Parametrisierung
Parametrisierung
Parametrisierung
Alexander Döschl
Nikolai Bauer
Forschungspartner: GEMA, XT AG
MPI - Massively parallel Processing in the Internet
23.03.2016 16 Aktuelle Forschungsprojekte
Das Forschungsprojekt MPI (= Massively parallel
processing of internet events) beschäftigt sich mit der
massiven, parallelen Verarbeitung vor allem von
Musiknutzungsdaten
Annahme: Die Menge der Musiknutzungsdaten steigt
weiter an, so dass die aktuell eingesetzten Systeme
der GEMA bei deren Verarbeitung an ihre Grenzen
stoßen
Untersuchungsgegenstand: Erforschung und
Entwicklung effizienter Verarbeitungsprozesse und
Softwarearchitekturen (u. a. Hadoop und NoSQL)
Aufgabenstellung
23.03.2016 17 Aktuelle Forschungsprojekte
Rechte und Nutzungen
Tantiemen
Workflow der Verarbeitung von
Musiknutzungen
23.03.2016 18 Aktuelle Forschungsprojekte
Teilprozesse
23.03.2016 19 Aktuelle Forschungsprojekte
Preprocessing im Cluster
23.03.2016 20 Aktuelle Forschungsprojekte
SAN Fabric (10GB/s iSCSI) Switch Fabric
(10 GbE) Storage Array
Faculty
Network
Manage-ment &
Monitoring (Ambari and Zookeeper) Distributed Storage
(HDFS)
Distributed Processing
(MapReduce)
Non-Relational Database (HBase)
Operating System (CentOS)
7 Knoten (1 Master, 6 Worker)
Konfiguration je Worker-Knoten: – 3 virtuelle Prozessoren (von Intel Xeon X5650 mit insgesamt 6 Kernen à
2,66 GHz, 12 Threads ≙ 12 virtuellen Prozessoren)
– 12 GB RAM
– 10 Gbit/s-Ethernet
– 128 MB HDFS-Block-Size
Unser Test-Cluster
23.03.2016 21 Aktuelle Forschungsprojekte
Repository-Cluster Sch
nittstellen
DDEX-Files
GEMA-Mitarbeiter
Content-Owner
Informationen
Informationen
Entwicklung eines Repository-Clusters
Repository-Cluster (SUREPO)
23.03.2016 22 Aktuelle Forschungsprojekte
Die Tarife für Lizenznehmer im Außendienst ändern
sich häufig
Sowohl für die Definition der Tarife als auch für deren
Anwendung werden leicht zu handhabende Lösungen
gesucht
Mit Business-Rules-Engines könnten if-Anweisungen
(Rules) ausgelagert werden, so dass diese von
Business-Usern anzupassen sind ohne die
Softwareentwickler involvieren zu müssen
Dies wird im Projekt näher untersucht
Business Rule-Engine
23.03.2016 23 Aktuelle Forschungsprojekte
IWASD-Teilprojekt: Media supported workspaces in agile software
development
Florian Raith
23.03.2016 24 Aktuelle Forschungsprojekte
1. Number of distributed software projects increases and Global SW-Development (GSD) becomes a normal practice
2. Agile methods are increasingly chosen to support development (up to 52 percent of software projects are agile in 2013)
Contradiction between agile principles and global software development
Agile workspaces are designed for local usage
• physical media (paper based)
• Information can‘t be shared
Contrary tendencies in software
development
23.03.2016 25 Aktuelle Forschungsprojekte
• First approach: Web-based tools for agile PM (e.g. Jira, Redmine)
– Lack of transparency
– Quiet meetings
– Decrease of social interaction
– Administration effort • Second approach: Parallel use of physical media and web-
based tools
– Inconsistencies between digital and physical data
– Inconsistencies are often unnoticed
– Increased administrative effort
Approaches in practice and related
problems
23.03.2016 26 Aktuelle Forschungsprojekte
Question 1: What causes the known issues in communication and social interaction using browser-based software instead of a physical task board?
Question 2 Is there a way to exchange status/data of a physical task board between the development teams without disturbing the agile process?
Question 2.1
How can we track the relevant data ?
Question 2.2
How can the physical Task Board be augmented by data of other teams?
Basis Questions
23.03.2016 27 Aktuelle Forschungsprojekte
• Goal: A concept to share project status amongst distributed agile development teams, without disturbing the agile process
Overall concept
Technical solution
track project status from task board
augment task board with data of dist. teams
Integration
Results of RQ 1
Literature: Heuristics [22], [11] Recommendations [7], [8] Synchronize with PM-Tool
Evaluation
Solution and research objective
23.03.2016 28 Aktuelle Forschungsprojekte
PM-Tool (e.g.Jira)
Tracking of relevant data from physical media (e.g. Agile Kanban-Board)
Synchronization with a PM-Tool
Project status can be shared btw. development teams and project management
Developer Team Developer Team (Offshore)
Project Management
Technical Ideas
23.03.2016 29 Aktuelle Forschungsprojekte
MIASE-Teilprojekt: Towards Media supported agile Release Planning
in Distributed Work Environments
Ingo Richter
23.03.2016 30 Aktuelle Forschungsprojekte
Agile Software Development (ASD) is getting increasingly popular in research and practice
More layers of management threatens agility
Executive management support is the most important success factor for small projects
ASD has a comparative lack of documentation when held up against traditional development
Success of software development projects is related to the quality of the Requirements Engineering (RE)
RE in distributed ASD suffers from minimal documentation
Requirements in agile RE change often and regularly
During RP stakeholders discuss their constraints & objectives.
Distributed ASD is already supported by virtual media
Virtual media seems effective to overcome disadvantages of distribution
Motivation
Aktuelle Forschungsprojekte 23.03.2016 31
Insular thinking of the different stakeholders in distributed ASD projects, especially in traditional corporations
This effects RE:
Stakeholders do not communicate as much as it may be required.
Stakeholders make incorrect assumptions.
Stakeholders do not distribute information which may be relevant to other stakeholders.
Research focus:
Higher management stakeholders and project responsible stakeholders
Research Problem
Aktuelle Forschungsprojekte 23.03.2016 32
Research Questions (1) Focus on project management stakeholders: RQ1: What information do project responsible stakeholders need
to make their controlling decisions on a project level?
RQ2: How can this information be collected and stored
(documented) in an agile process without disturbing the agility of the process too much?
RQ3: How can interaction be supported in an agile project, to
achieve a better information flow in distributed project environments?
Aktuelle Forschungsprojekte 23.03.2016 33
Research Questions (2) Focus on higher management stakeholders: RQ4: What information do relevant stakeholders in the higher
management need to make their controlling decisions on a meta-project level?
RQ5: How can agile project data be transformed to meet the formal and continual expectations of the higher management and the corporate controlling instances of a corporation?
RQ6: How can the exchange of information be documented in a traceable way?
RQ7: What typical decisions have stakeholders in the higher management to make?
RQ8: How can they be supported in their decision making?
Aktuelle Forschungsprojekte 23.03.2016 34
Research Methods (1) Research problem and questions Literature research
Interview study with practical experts
Developing a model for distributed agile release planning Develop semantic agile process model based on the general
agile process in OWL.
Develop a concept for automatic data collection, editing and retrieval.
Develop a concept for supporting the decision making of management stakeholders which addresses uncertainty through probabilistic approaches.
Aktuelle Forschungsprojekte 23.03.2016 35
Research Methods (2) Evaluation Observe practical experts who will fulfil selected tasks with the
prototype in their real projects.
Conduct structured interviews with those practical experts afterwards.
Analyze observation protocols and interview transcripts.
Conclude analysis of protocols and transcripts.
Compare analysis with findings of literature research and our interview study.
Aktuelle Forschungsprojekte 23.03.2016 36
Contribution A model to support distributed agile RP: Semantic agile process model (RQ3, RQ6).
Concept of data collection, editing and retrieval (RQ2, RQ3).
Concept for supporting decision making of management stakeholders (RQ1, RQ3, RQ4, RQ5, RQ6, RQ7, RQ8).
Prototypical implementation and evaluation of the model for distributed agile release planning (RQ2, RQ3).
The contributions help to address blind spots in RE research.
Aktuelle Forschungsprojekte 23.03.2016 37
Projekt HoEff - Referenzraummethode und Folgeprojekt
IoT4EER – Internet of Things für Energieeffiziente Raumnutzung
Eshref Januzaj
Kooperationspartner: Fakultät für Versorgungs- und Gebäudetechnik und LMU
23.03.2016 38 Aktuelle Forschungsprojekte
Softwarearchitektur zur Integration der
Referenzraummethode (1/2)
• Hierarchische Systemstruktur
– Projekt -> Gebäude -> Räume
• Modulares IT-System zur Steigerung der Flexibilität und der Erweiterungsmöglichkeit
• Trennung über Rollenkonzept
– Projektanwender, Administrator, Forscher
Aktuelle Forschungsprojekte 39 23.03.2016
Softwarearchitektur zur Integration der
Referenzraummethode (2/2)
Aktuelle Forschungsprojekte 40 23.03.2016
Stand Prototyp
• Umsetzung der Projektstruktur – Projekte
– Gebäude
– Räume
• Benutzerverwaltung (Rollen) – User-Admin
– Projekt-Admin
– „NN“-Admin
Aktuelle Forschungsprojekte 41 23.03.2016
Aktuelle Forschungsprojekte 42 23.03.2016
Verteilte Integrationsplattform
Aktuelle Forschungsprojekte 23.03.2016 43
Was kostet die LMU?
• Fragestellungen: – Wie sähe der
Energieverbrauch nach einer Sanierung aus?
– Wo kann man was [günstig] sanieren?
– Was ist günstiger: • Neue Fenster einbauen?
• Neue (größere) Heizkörper?
• Dämmung? Welche?
Aktuelle Forschungsprojekte 23.03.2016 44
Daten
Informationen
Wissen (entdecken)
„Rohmaterial“
Gebäude Räume
Fassaden Heizung Kühlung
Lüftung …
Strukturierte Daten
Quick Check Tooll FAMOS
…
DB
Vernetzte Informationen
Data Mining Big Data …
Wissensentdeckung Data Mining Effiziente
Datenanalyse Big Data
Aus Daten Wissen generieren
Aktuelle Forschungsprojekte 23.03.2016 45
• Forschungsprojekt : HoEff-CIM - EnergieEffiziente Hochschule – Campus Information Modeling
• Schwerpunkt: – kompakte Beschreibung der Gebäudedaten (Geometrie, Energiekomponenten, etc.)
– Evaluierung der passenden Analysetechnik (Data Mining: Clustering, Klassifikation, etc.)
– Berechnung der Ähnlichkeit zwischen Gebäuden/Räumen (prototypisch umsetzen)
• Betreuer: Eshref Januzaj ( E-Mail: [email protected] )
• Kooperation: Gebäudetechnik @ HM
• Es sind mehrere Arbeiten möglich. Auch für Teamarbeit gut geeignet!
Anwendung von Data Mining in der
Gebäudetechnik
Aktuelle Forschungsprojekte 23.03.2016 46
Anwendungsbeispiel: Data Mining (1)
Bildquelle (LMU): http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/muc/s0017/index.html
Data Mining Track Vorverarbeitung
Data Mining
Ähnlichkeitsfunktion
Muster
Auswertung
Aktuelle Forschungsprojekte 23.03.2016 47
Anwendungsbeispiel: Data Mining
Bildquelle (LMU): http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/muc/s0017/index.html
Data Mining Track
Vorverarbeitung
Data Mining
Ähnlichkeitsfunktion
Muster
Auswertung
Aktuelle Forschungsprojekte 23.03.2016 48
Datenanalyse ( aus Sicht der IT ) Architektur
Aktuelle Forschungsprojekte 23.03.2016 49
Datenanalyse-Beispiel: „Berg
Sandkorn“
LMU Innenstadt Bildquelle: http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/lageplan_lmu.pdf
Aktuelle Forschungsprojekte 23.03.2016 50
Datenanalyse-Beispiel: „Berg
Sandkorn“
Bildquelle: http://www.uni-muenchen.de/ueber_die_lmu/standorte/lageplaene/lageplan_lmu.pdf
Aktuelle Forschungsprojekte 23.03.2016 51
Datenanalyse-Beispiel:
„Berg Sandkorn“
Aktuelle Forschungsprojekte 23.03.2016 52
Datenanalyse-Beispiel: „Berg Sandkorn“
Aktuelle Forschungsprojekte 23.03.2016 53
Datenanalyse-Beispiel: „Berg Sandkorn“
RAUM
Bezeichnung
Stockwerk Adresse
Länge
Breite
Höhe
Fläche
Volumen
#Fenster
#Türe
Fensterfläche
Fassade (alt, neu, etc.)
Straßenseite (JA | NEIN)
Heizkörper (m³)
Stromverbrauch
Heizenergie-verbrauch
Nutzungsart (Büro, Labor, etc.)
…
Raum-Parameter bestimmen
… …
Aktuelle Forschungsprojekte 23.03.2016 54
Peter Mandl
Forschungspartner: iSYS Software GmbH
Aktuelle Forschungsprojekte 23.03.2016 55
PIMnG – Product Information Management next Generation
QCEP - Abnahmetestgetriebene Entwicklung von ereignisbasierten
Anwendungen
Johannes Weiß
Forschungspartner: UniCredit
Aktuelle Forschungsprojekte 23.03.2016 56
Motivation
• Die Anzahl der digital verfügbaren Daten (Ereignisse) wächst stetig (jährlicher „Umsatz“ 2013: 4,4 ZB, 2020: 44 ZB*)
• Event-Processing (EP) bietet Ansätze und Lösungen, um Ereignisströme in (weicher) Echtzeit zu korrelieren und Muster zu erkennen
• Durch die Abbildung von fachlicher Anwendungsfunktionalität in EP-Anwendungen gewinnt das funktionale, dynamische Testen an Bedeutung
• Ein aktueller Ansatz der agilen Softwaretechnik ist die abnahmetestgetrieben Entwicklung (ATDD- Acceptance Test Driven Development)
*„Das digitale Universum“, EMC/IDC Studie (http://germany.emc.com/leadership/digital-universe/index.htm)
Aktuelle Forschungsprojekte 23.03.2016 57
Forschungsfragen
1. Wie kann ATDD im Bereich der EP-Anwendungsentwicklung eingesetzt werden? – Wie können funktionale Testfälle
benutzerorientiert erstellt werden? – Welche Funktionalitäten muss ein Testsystem
bereitstellen, um solche Testfälle auszuführen?
2. Welche Auswirkungen hat der Einsatz von ATDD auf ausgewählte Performanceindikatoren der EP-Anwendungsentwicklung?
Aktuelle Forschungsprojekte 23.03.2016 58
Motivierendes Beispiel – Erkennen von EC-
Kartenbetrug
Statistiken 2012*:
Anzahl Transaktionen: ca. 2,5 Mrd.
Betrugsfälle: ca. 38.000
Schaden : ca. 1,33 Mrd. €
Szenario:
Erkennen von betrügerischen Kartentransaktionen
Beispielanforderung:
Wenn innerhalb einer Stunde mit derselben EC-Karte zwei Transaktionen (T1, T2) von Orten getätigt werden, die mehr als 200 km entfernt sind, sperre die Karte.
*de.statista.com, handelsblatt.com
EP-Anwendung
T2 @Rom, 17:32 T1 @ Dresden, 16:42
S
Aktuelle Forschungsprojekte 23.03.2016 59
Motivierendes Beispiel – Erkennen von EC-
Kartenbetrug
Statistiken 2012*:
Anzahl Transaktionen: ca. 2,5 Mrd.
Betrugsfälle: ca. 38.000
Schaden : ca. 1,33 Mrd. €
Szenario:
Erkennen von betrügerischen Kartentransaktionen
Beispielanforderung:
Wenn innerhalb einer Stunde mit derselben EC-Karte zwei Transaktionen (T1, T2) von Orten getätigt werden, die mehr als 200 km entfernt sind, sperre die Karte.
*de.statista.com, handelsblatt.com
EP-Anwendung
T2 @Rom, 17:32 T1 @ Dresden, 16:42
S
Zeitfenster
Minuten
T1
0 60
T2a T2c
Transaktionen T2a und T2b würde zur Erzeugung eines
Sperrereignisses (S) führen, bei T2c wäre alles in Ordnung.
S
Testvarianten EC-Karten Transaktionen
T2b
S
Aktuelle Forschungsprojekte 23.03.2016 60
Entwicklung einer
Testbeschreibungssprache
• EPTDL – Event Processing Test Description Language
• Eigenschaften: – Tabellen zum Definieren, Ausführen
und Überprüfen von Ergebnissen (inkl. Negation)
– virtuelles Attribute „:time“ (Entdeckungszeit)
– Zeitangaben beim Initialisieren und beim Ausführen (Start- und Zielzeit)
– Operatoren (:op ) für detaillierte Ergebnis-Prüfungen: z.B. <,>,<=,>=,<>
*Auszug EPTDL
Aktuelle Forschungsprojekte 23.03.2016 61
QCEP-Testsystem zur Ausführung von
EPTDL-Tests
Aktuelle Forschungsprojekte 23.03.2016 62
http://sourceforge.net/p/qcep-ts
EP Engine
API Test Engine
Test Client
API
API EP Driver
API
App
FitNesse Framework mit EP - Fixtures
Testschnittstelle, Testfunktionalität(RMI)
einheitliche Zugriffsschnittstelle (RMI inkl. Callback)
Aktuell angebunden:
Prototypische Umsetzung des QCEP-
Testsystem
produktunabhängig
produktabhängig
Aktuelle Forschungsprojekte 23.03.2016 63
Empirische Studien
Ergebnisse des Experiments „FINDBUGS“ • Wie lange benötigen Teilnehmer um Fehler in Testfällen in einem gewissen
Format (automatisierbar vs. nicht automatisierbar) zu finden?
• Ergebnis: Signifikanter Unterschied. Es kann ein positiver Effekt in Richtung automatisierbares Format gemessen werden.
Aktuelle Forschungsprojekte 23.03.2016 64
ReCoM-Teilprojekt:
Rated Tags as a Service Konzept und Evaluierung
Daniel Kailer
Promotion und Projekt abgeschlossen
Aktuelle Forschungsprojekte 23.03.2016 65
Problemstellung
• Kontext: Onlinehandel
• Suche nach passendem Produkt zeitaufwendig
• Gesamtbewertungen nicht hilfreich für spezifische Produktmerkmale
• Rezensionen enthalten viele Informationen, sind jedoch unstrukturiert
Aktuelle Forschungsprojekte 23.03.2016 66
Ziel
• Verbesserung der Entscheidungsfindung durch Vergabe von bewertbaren Tags (Rated Tags)
Aktuelle Forschungsprojekte 23.03.2016 67
Evaluierung der Entscheidungshilfe
• Durchführung einer Anwenderstudie mit 34 Teilnehmern, aufgeteilt in Rated Tags-Gruppe und Kontrollgruppe
• Überprüfung des Entscheidungsaufwands (Dauer der Entscheidung) sowie der Entscheidungsqualität
• Statistische Hypothesentests zeigen für Teilnehmer der Rated Tags-Gruppe eine signifikante Reduzierung des Aufwands sowie eine signifikante Verbesserung der Entscheidungsqualität
Aktuelle Forschungsprojekte 23.03.2016 68
Weiteres Ziel
• Vereinheitlichung der Benutzer-generierten Tags anhand von Textklassifikatoren
Aktuelle Forschungsprojekte 23.03.2016 69
Klassifikationsmodell
• Nutzung von erprobten Basisklassifikatoren wie Naive Bayes und Support Vector Machine
• Kompensation der Schwächen o.g. Klassifikatoren durch neu entwickelte Text-basierte und Wörterbuch-basierte Klassifikatoren
• Entwurf eines Ensemble-Klassifikators, der für die endgültige Klassifikationsentscheidung alle Klassifikatoren miteinander kombiniert
Aktuelle Forschungsprojekte 23.03.2016 70
Evaluierung des Klassifikationsmodells
• Extraktion von über 5.000 echten Benutzermeinungen aus einem Bewertungsportal in Form von Vor- und Nachteilen (Tags)
• Erstellung eines Goldstandards, d.h. Zuweisung einer Merkmalsklasse zu jedem Tag
• Anwendung von gängigen Evaluierungsmetriken wie Precision, Recall und F1-Wert sowie einer 10-fach stratifizierten Kreuzvalidierung
• Umsetzung mittels Data Mining-Software WEKA
Aktuelle Forschungsprojekte 23.03.2016 71
Evaluierung des Klassifikationsmodells
Aktuelle Forschungsprojekte 23.03.2016 72
Beiträge der Arbeit
• Studienergebnisse zeigen verbesserte Entscheidungsqualität sowie verminderten Entscheidungsaufwand bei Anwendung von Rated Tags
• Güte des entworfenen Klassifikators zur Vereinheitlichung der erstellten Tags übersteigt den aktuellen Stand der Technik
Aktuelle Forschungsprojekte 23.03.2016 73