1© disclosure or duplication without consent
prohibited
COMET K2 Competence Center - Initiated by the Federal Ministry of Transport, Innovation & Technology (BMVIT) and theFederal Ministry of Economics & Labour (BMWFI). Funded by FFG, Land Steiermark and Steirische Wirtschaftsförderung (SFG)
Enterprise Search: Potenziale und Fallstricke
3. Kremser Wissensmanagement-TageDonau-Universität Krems
Dr. Alexander Stocker
2© disclosure or duplication without consent
prohibited
Einführung Nutzerzufriedenheit Enterprise Search vs. Internet-Suche Ergebnisse einer Nutzerevaluierung
Enterprise SearchAgenda
3© disclosure or duplication without consent
prohibited
Enterprise SearchEinführung
4© disclosure or duplication without consent
prohibited
Nutzung unterschiedlicher IT-Systeme: Wissensinseln statt einheitlicher unternehmensweiten Wissensbasis
Mitarbeitern fehlt der Überblick über die Gesamtheit der Repositories: Einzelner MA weiß nicht, wie/wo er seinen Informationsbedarf decken kann.
Mitarbeiter können benötigte Informationen nicht finden: Produktivität leidet darunter. Entscheidungen werden auf falschen Informationen gebildet: Resultat sind schlechte
Entscheidungen. Problem wird erneut bearbeitet, obwohl an anderer Stelle schon gelöst: Das Rad wird
ein zweites Mal erfunden Hohe Erwartungen der Anwender an Suche im Unternehmen:
„Google“ im Unternehmen
Enterprise SearchBedarf
5© disclosure or duplication without consent
prohibited
Enterprise SearchBedarf
Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013
6© disclosure or duplication without consent
prohibited
Enterprise Search schließt jegliche Organisation mit Textinhalten in elektronischer Form ein und umfasst die Suche auf externen Unternehmenswebseiten, auf internen Unternehmenswebseiten (d.h. dem Unternehmensintranet), sowie die Suche nach Text in E-Mails, Datenbankeinträgen, in Dokumenten auf
Fileshares und Ähnlichem.(„Challenges in Enterprise Search“, Hawking, 2004)
Enterprise SearchDefinition
7© disclosure or duplication without consent
prohibited
Enterprise Search Architektur (simplifiziert)
Benutzerschnittstelle
Inhaltsquellen
Suchindex
In welcher Inhaltsquelle steht welcher Inhalt wie oft und an welcher Stelle?
Suchanfrage TrefferlisteFiltermöglichkeit durch Facetten
Konnektoren
Für die Suche aufbereiteter Volltext der Inhalte aus den Inhaltsquellen
Fileshare N: Wiki:
8© disclosure or duplication without consent
prohibited
Enterprise SearchFunktionsweise (simplifiziert)
Suchindex
Word-Dokument
• Extrahieren des Inhalts (formatfreier Volltext)• Entfernung von Leerzeichen & Interpunktion (Worte =
Tokens)• Entfernen der Stoppworte (inhaltsbereinigte Tokens) • Zurückführung von Wörtern in Grundform (Autos = Auto)• Tokens als Basis für inversen Index
(Liste von „Wörtern“ und den Dokumenten, in welchen diese vorkommen)
• ..
Konnektor für Word
9© disclosure or duplication without consent
prohibited
Enterprise SearchFunktionsweise (simplifiziert)
Suchindex
• Extrahieren des Inhalts• Zerlegung in Worte• Entfernen der Stoppworte• Zurückführung von Wörtern in Grundform• …
Benutzerschnittstelle• Titel• Textschnipsel• Ort (Quelle)• Metadaten• ..
• Nach Relevanz sortiert
10© disclosure or duplication without consent
prohibited
Enterprise Search(z.B. Microsoft Sharepoint Foundation 2013)
11© disclosure or duplication without consent
prohibited
Enterprise SearchZufriedenheit
12© disclosure or duplication without consent
prohibited
Enterprise SearchZufriedenheit
Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013
13© disclosure or duplication without consent
prohibited
Enterprise SearchZufriedenheit
Mindmetre: Report „Minding the Search Gap“
14© disclosure or duplication without consent
prohibited
Enterprise SearchZufriedenheit
Findability Survey 2013 http://de.slideshare.net/findwise/enterprise-search-and-findability-survey-2013
15© disclosure or duplication without consent
prohibited
Internet Suche Suchraum besteht aus verlinkten Web-
Seiten und einfach zu erschließenden Dokumenten in Standardformaten
Internet-Suchmaschinen wie Google bewerten die Relevanz von Webseiten anhand der auf sie zeigenden Hyperlinks
Informationen auf Web-Seiten, „wollen“ idR gefunden werden und werden daher speziell für Suchmaschinen optimiert
Internet-Suche durchsucht den „öffentlichen“ Teil des Intranets, Zugriffsrechte sind dort irrelevant.
Internet-Suchanfragen sind oft viel „allgemeinerer Natur“. Der Suchende ist in vielen Fällen mit einer „guten“ Antwort (von vielen möglichen guten Antworten) zufrieden, wobei meist viele mögliche gute Lösungen existieren.
Internet-Suche vs. Enterprise Search
Intranet Suche (Enterprise Search)
Inhalte sind sehr heterogen, von völllig unstrukturiert bis hin zu strukturierten Inhalten in Datenbanken
Inhalte sind in Unternehmen in der Regel nicht verlinkt, es bedarf anderer Ansätze zur Relevanzbewertung
Anwender ergreifen idR wenig Initiative, um Inhalte für Intranet-Suchmaschinen zu optimieren (z.B. durch systematische Metadatenpflege)
Komplexe Rollen- und Rechtestrukturen machen die Sicherstellung von Zugriffsbeschränkungen essentiell
Bei der Internet-Suche existiert oftmals nur ein einziges richtiges Dokument (d.h. genau das richtige), das der Mitarbeiter möglichst rasch finden werden will.
16© disclosure or duplication without consent
prohibited
Nutzernahe Evaluierung von Enterprise Search
17© disclosure or duplication without consent
prohibited
Aufgabenstellung Forschungseinrichtung im Umfeld Automotive Engineering mit rund 200
Wissensarbeitenden Pilot einer Enterprise Search für die Suche nach projektspezifische Inhalten auf
einem Fileshare (mit Microsoft Sharepoint Foundation 2013 Identifikation nutzernaher Aspekte zu Enterprise Search durch 10 an Experimenten
teilnehmenden Wissensarbeitende Ablauf der Evaluierung
Kurzes semi-strukturiertes Interview (Tätigkeiten, Dokumente & Tools, Infobedarf, Suchraum- und Dauer)
Festlegung möglicher Suchtasks und Exploration durch den Wissensarbeitenden im Rahmen von „Thinking-Aloud“
Transkription der Interviews und Inhaltsanalyse Zusammenfassung der wesentlicher Aussagen und Erkenntnisse
Nutzernahe Evaluierung von Enterprise Search
18© disclosure or duplication without consent
prohibited
Das Finden geeigneter Keywords die zum gewünschten Suchergebnis führen sollen ist elementar – und äußerst schwierig Je „besser“ die verwendeten Keywords, desto relevanter das Suchergebnis Wissen über den möglichen Inhalt eines gesuchten Dokuments spiegelt sich in mehr
oder weniger geschickt gewählten Keywords wider (z.B.: Projektnamen, -kurznamen, -kürzel)
Normen, Strukturen und Schreibweisen bei Dokumentennamen und –inhalt relevant (zB immer Projektkürzel ohne - ): Je besser gelebt, desto besser das Suchergebnis.
Ergebnisse der Evaluierung (1)
„Also das Projekt heißt AS4T06, ach, wobei ich jetzt nicht weiß mit Bindestrich, Unterstrich oder zusammen. Also würde ich das jetzt einfach mit
dem Leerzeichen eingeben AS4 T06 ..“
“Wobei das Dokument glaube ich heißt anders… Du musst irgendwie das Vokabular, das sich entwickelt hat kennen, damit du eigentlich die Möglichkeit hast danach zu suchen ... Also die
richtigen Keywords zu finden, ist echt eine Herausforderung. “
“Bei der Suche ist halt der Haken, dass man schon relativ viel wissen
muss. Daher ist mir oft eine saubere Ordnerstruktur
sympathischer, wo ich mich durchklicken kann.“
19© disclosure or duplication without consent
prohibited
Die Nutzung von Metadaten für die Suche wird durch die in der Praxis oft ungepflegten Metadaten in Dokumenten erschwert Metadaten werden für die Suche verwendet und dienen der Filterung (sog. „Facetten“) Fehlende oder falsche Metadaten reduzieren die Suchqualität
(z.B. angezeigter Autor ist nicht der echte Autor, sondern nur der Ersteller der Vorlage) Systematische Pflege der Metadaten aus Sicht der Wissensarbeiternden ohne
Zusatznutzen, wenn keine Suchmaschine vorhanden
Ergebnisse der Evaluierung (2)
“Autor,.. OK, ..das liest er also aus. Problem ist, dass es so in
der Vorlage steht, und es keiner ändert.“
“Ich frage mich, ob da immer ... aha das ist der Titel vom Powerpoint ... Folie 1…, was zeigt er mir da eigentlich immer an? Wieso
kommt da immer Folie 1, und nicht zum Beispiel der Titel der Präsentation.“
“Ja da stehen irgendwelche Sachen bei uns drinnen… Wachmann ... Aber ja da steht
irgendetwas drinnen. Das ist ja alles überhaupt nicht gepflegt bei uns. Weil es
auch keiner gebraucht hat bis jetzt“
20© disclosure or duplication without consent
prohibited
“Genau! Und jetzt findet er mit Projektmeeting und Stuttgart nichts, dann sage ich, OK ich suche nur nach Projektmeeting ... Stuttgart ist jedoch so ein
essentieller Inhalt der drinnen sein muss, weil sonst kann er damit gar nichts anfangen.“
“Wir haben zwar eine Namenskonvention für Dokumente,
aber ... Einer verwendet einmal einen Bindestrich, einer einen Unterstrich.
Dann sind doch immer wieder Leerzeichen drinnen. Aber ich glaube das ist generell ein Suchproblem. Eh bei allen Maschinen ... Weil auf die
Idee wäre ich jetzt zum Beispiel nicht gekommen, dass ich AreaD einmal
trenne.“
„Also mit ..[mom].. vorher habe ich das Aktuellste gefunden. Aber da hat er eben
nachgeschaut im Content und da war eben oben im Aktuellsten eben ..[mom].. drinnen
und im Alten nur ..[minutes of meeting]. Deswegen hat er es anders nicht gefunden ...“
Einheitliche Dokumenteninhalte und inbs. Schreibweisen erhöhen die Qualität der Suche, sind aber leider nicht immer vorhanden Essentielle Wörter und Informationen im Dokument erhöhen Suchererfolg
(z.B. Autor, Ort, Datum, einheitliche Projektbezeichnung, einheitl. Dokumententyp, ...) Struktur und Norm essentieller Information in Dokumenten muss gelebt werden, um
„Raterei“ zu vermeiden („welches Schlagwort könnte denn im Dokument stehen?“)
Ergebnisse der Evaluierung (3)
21© disclosure or duplication without consent
prohibited
Die Relevanzbewertung der Suchergebnisse durch die Suchmaschine entspricht nicht immer den Wünschen der Nutzer Die Häufigkeit des Vorkommens der Keywords in den indizierten Dokumenten ist
primär verantwortlich für die Reihung der Dokumente in der Trefferliste Die Reihung der Treffer ist elementar für Nutzerzufriedenheit; Reihung nach
„Aktualität“ wurde gefordert Workaround: Kopie des Pfades zum gesuchten Dokument aus der Trefferliste &
manuelle Navigation durch die Ordnerstruktur
Ergebnisse der Evaluierung (4)
“Das ist die Aktuellste… Das Einzige, was mich da jetzt wundert ist, dass die
Aktuellste da eigentlich am Schluss liegt.“
“Die Leute wünschen sich das gesuchte Dokument sehr weit vorne, und ich glaube die Leute haben auch nicht die Akzeptanz, dass sie da ewig blättern in der Trefferliste.“
22© disclosure or duplication without consent
prohibited
Enterprise Search muss sich gegen bestehende „Suchstrategien“ (bzw. Informationsbeschaffungsstrategien) behaupten Face2Face Gespräche sind für die Infosuche von größter Bedeutung
(z.B.: Ablageort eines Dokuments wird erfragt) Benutzer haben die Struktur der Projektordner „verinnerlicht“, so dass sie nicht mehr
suchen, sondern gezielt navigieren (d.h. „finden“) Nutzung von Verknüpfungen auf Ordner und Dokumente
(Links zu Projekten und wichtigen Dokumenten über Instant Messenger)
Ergebnisse der Evaluierung (5)
„Ich bin da nämlich ein bisschen ein Verfechter, dass die Ordnerstruktur wirklich sauber sein sollte. Suchmaschine ist dann
auch gut, wenn es sie gibt, aber nicht stattdessen!“
“Das hat so oft den Namen geändert in letzter Zeit, dass ich jetzt eigentlich gar
nicht mehr weiß wie es heißt. An meinem Rechner habe ich einfach einen Link
darauf, und damit ist die Sache erledigt ...“
Jetzt bin ich nämlich selber neugierig, ... Was ich jetzt schon merke, was für mich total ungewohnt ist … ich bin
gewöhnt, dass ich mich durch die Ordnerstrukturen durcharbeite. Aber ich nehme jetzt die Ordnernamen
nicht mehr so wahr.
23© disclosure or duplication without consent
prohibited
„Ja, hat mir eigentlich ganz gut gefallen jetzt. Also ich glaub schon, dass das
helfen könnte. Mir haben jetzt ein bisschen die konkreten Anlassfälle dafür gefehlt.“
Enterprise Search muss aus Sicht der beteiligten Wissensarbeiter rasch einen Mehrwert für die tägliche Arbeit darstellen. Verwendung ungewohnt, obwohl Google-Suche täglich praktiziert Enterprise Search nimmt mehr Zeit in Anspruch, als Navigation durch Ordnerstruktur Probleme bei Office-Dokumenten aufgrund großer Anzahl verschiedener
Dokumentenversionen (generell hohe Anzahl „ähnlicher“ Office-Dokumente) Tlw. Unzufriedenheit mit Suche, da Keywords nicht immer im Dokument vorhanden,
bzw. in anderer Schreibweise
Ergebnisse der Evaluierung (6)
“Also normal, in der Ordnerstruktur wäre ich halt her gegangen und hätte unterhalb irgendwo gesehen ... Wenn ich da reingegangen wäre. Das habe ich halt in einer Suche zum Beispiel
dann nicht unbedingt... Ich denke mir bei solchen Fällen sind hierarchische
Strukturen leichter. Weil ich mich Schritt für Schritt vorhantle.“
“Ja ich glaube schon, man muss am Anfang ein bisschen umdenken, dass man nicht einfach in den
Ordnern sucht, …. war vielleicht nicht so schlecht, die Schätzung mit den
10 Minuten Zeitersparnis.“
“Also ich glaube, dass ich mit der Suche länger brauche, als so normal,
bis ich es finde.“
24© disclosure or duplication without consent
prohibited
1. Enterprise Search Einführung
2. Enterprise Search Nutzerzufriedenheit
3. Enterprise Search Potentiale & Fallstricke
Enterprise SearchZusammenfassung
25© disclosure or duplication without consent
prohibited
Kontakt
Dr. Alexander Stocker
VIRTUAL VEHICLE
Top Related