Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24...

26
Mit Standards in die Deutsche Digitale Bibliothek Herdis Kley Deutsche Digitale Bibliothek Fachstelle Museum Institut für Museumsforschung digiS-Jahreskonferenz Themen-Session: Kuratieren! Auffindbarkeit Formate, Standards, Normdaten und Schnittstellen Berlin, 06.12.2018 Except where otherwise noted, this work is licensed under a Creative Commons Attribution 4.0 International License.

Transcript of Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24...

Page 1: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

Mit Standards in die

Deutsche Digitale Bibliothek

Herdis Kley

Deutsche Digitale Bibliothek

Fachstelle Museum

Institut für Museumsforschung

digiS-Jahreskonferenz

Themen-Session: Kuratieren! Auffindbarkeit Formate, Standards, Normdaten und Schnittstellen

Berlin, 06.12.2018

Except where otherwise noted, this work is licensed under a Creative Commons Attribution 4.0 International License.

Page 2: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

2 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Herausforderungen der DDB

Zusammenführen von heterogenen Metadaten

> 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten

(Archiv, Bibliothek, Denkmalpflege, Forschungseinrichtung, Mediathek, Museum)

Metadaten sind…

... in unterschiedliche Erfassungssysteme entstanden

... für unterschiedliche Zielgruppen gedacht

... über verschiedene Workflows an DDB geliefert worden

Metadatenstandards für den Datenimport

7 Standardformate für die verschiedenen Sparten:

Dublin Core, EAD, EDM, ESE, MARCXML, METS/MODS und LIDO

Page 3: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

3 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

LIDO

http://network.icom.museum/cidoc/working-groups/lido/what-is-lido

Page 4: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

4 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Herausforderungen beim Export und Import

• Datenlieferungen aus Museen in unterschiedlichen Formaten

csv, xml, LIDO

• LIDO-Exporte müssen auch andere Portale bedienen können: erfordert Nachmappen zu DDB-LIDO

• Zeitangaben ohne standardisierte Anfangs- und Endzeiten

• Freitexteingabe und fehlende Trennung von Entitäten

• fehlende Identifier von Personen und Orten

• Nicht-normierte Filterfacetten erschweren die Suche

Page 5: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

Beliebte Zeitangaben sind:

„Wendezeit“ – Welche Wende?

„Nachkriegszeit“ – Nach welchem Krieg?

„Barock“ – Welcher, der italienische oder deutsche?

„Mittelalter“ – Wann genau?

„Kaiserzeit“ – In Äthiopien, Japan oder Deutschland?

Zeitangaben lassen sich auch erweitern:

Vor 1904 – Wann begann das?

Nach Christi Geburt – Wann endet das?

Spätes 18. Jahrhundert – Wann begann das?

Erstes Viertel 5. Jahrhundert vor Chr. – Drittes Viertel 4. Jahrhundert vor Chr.

– (beliebt bei Ägyptologen)

Standards bei der Zeitangabe? Beispiele aus museum-digital

Page 6: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

6 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Zeiten – ohne Standards keine Auffindbarkeit

Page 7: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

7 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Zeiten – ohne Standards keine Auffindbarkeit

Page 8: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

8 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Freitexteingabe und fehlende Trennung von Entitäten: csv-Export aus dem Erfassungssystem

Page 9: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

9 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Freitexteingabe und fehlende Trennung von Entitäten: LIDO

Page 10: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

10 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Freitexteingabe und fehlende Trennung von Entitäten: DDB-View

https://www.deutsche-digitale-bibliothek.de/item/AX3Z5IBVDMRLOIHGC7VWDAXBV7FJCXZZ

This work is licensed under a Attribution-NonCommercial-ShareAlike 4.0 International

Page 11: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

11 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Freitexteingabe und fehlende Trennung von Entitäten: DDB-Filterfacette

Page 12: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

12 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Lösung: Neue Datenbank und Bereinigung der Freitexteingaben: LIDO

Page 13: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

13 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Beste Lösung: Bereinigung der Freitexteingaben im Erfassungssystem: DDB-View

https://www-t1.deutsche-digitale-bibliothek.de/item/T2ZT5W3UL5PP2OAHLLTL24DH4GGVUFSF

This work is licensed under a Attribution-NonCommercial-ShareAlike 4.0 International

Page 14: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

14 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Beste Lösung: Bereinigung der Freitexteingaben im Erfassungssystem: DDB-Filterfacette

Page 15: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

15 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Herausforderung: Mehrfachanlegung von Personen

Page 16: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

16 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Herausforderung: Keine normierte Facettierung in der DDB

Page 17: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

17 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Lösungsansatz: einheitliche Schreibweise der Personen mit GND-ID in der Facette

Page 18: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

18 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Lösungsansätze (Zusammenfassung)

• Beratung und Unterstützung der Institutionen bei der

Bereinigung ihrer Daten: Rückmeldung von fehlerhaften Feldinhalten, Hilfe bei Schreibanweisungen und bei der Einrichtung von Datenbanken

• Nachmappen der Daten: Zusammenführung zu Ereignissen, (wenn möglich), Verwendung von Display- und Index-Elemente, Anreicherung mit Normdaten

• Hilfe bei der Einrichtung eines LIDO-Exportes (Institutionen und Softwareanbieter)

• Normierung der DDB-Facetten (Personen, Orte, Objektbezeichnung…)

Page 19: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

19 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Standards = Normierte Facetten = Auffindbarkeit

Page 20: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

20 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Personenseiten in der DDB

https://www.deutsche-digitale-bibliothek.de/journal/persons/?sort=478746638

Page 21: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

21 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Personenseiten in der DDB

Page 22: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

22 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Personenseiten in der DDB

https://www.deutsche-digitale-bibliothek.de/item/L4ZUW4LEUXYOR3OZ3IRNINBROTC6HAQE

The metadata is licensed under a CC0 1.0 Universal (CC0 1.0) Public Domain Dedication

Page 23: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

23 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

Personenseiten in der DDB

https://www.deutsche-digitale-bibliothek.de/entity/118607626

Page 24: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

24 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

NEU: Organisationenseiten in der DDB

https://www.deutsche-digitale-bibliothek.de/item/7OLADGE4YJU3CLY3LOXNULAXUPEJ5WYC

The metadata is licensed under a CC0 1.0 Universal (CC0 1.0) Public Domain Dedication

Page 25: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

25 Deutsche Digitale Bibliothek, Fachstelle Museum Institut für Museumsforschung Staatliche Museen zu Berlin - Preußischer Kulturbesitz

NEU: Organisationenseiten in der DDB

https://www.deutsche-digitale-bibliothek.de/organization/gnd/4248109-0

Page 26: Mit Standards in die Deutsche Digitale Bibliothek · Zusammenführen von heterogenen Metadaten > 24 Millionen Datensätze aus 369 Einrichtungen aus sechs Kultursparten (Archiv, Bibliothek,

Herzlichen Dank für Ihre Aufmerksamkeit.

Deutsche Digitale Bibliothek

Fachstelle Museum

Institut für Museumsforschung

Staatliche Museen zu Berlin –

Preußischer Kulturbesitz

Herdis Kley

Tel. 030/8301-492

Kontaktieren Sie uns! [email protected]