SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.
-
Upload
jan-wieners -
Category
Documents
-
view
183 -
download
1
description
Transcript of SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.
Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // [email protected]
Advanced Markup & MetadataSommersemester 2013
19. Juni 2013 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.
Digitale Bibliotheken, Digitale Archive, Digitale Museen
Bibliographische Metadaten MARC MAB MARCXML Dublin Core (DC) Metadata Object Description Schema (MODS)
Digitale Objekte Metadata Encoding and Transmission Standard (METS)
Gruppierung digitaler Objekte Open Archives Initiative (OAI) OAI-PMH
(Eingebettete) Metadaten für Multimedia Bild: (GIF, PNG, JPEG), TIFF, EXIF Audio: ID3 / ID3v2
Sitzungsüberblick
© Raimond Spekking
http://www.kulturelles-erbe-koeln.de
Digitale Bibliothek
Vannevar Bush (1890-1974) 1954: „As we may think“ „Memex“ (Memory Extender)
Digitale Bibliothek
Digitale Bibliothek
http://www.deutsche-digitale-bibliothek.de
Digitale Bibliothek
http://www.deutsche-digitale-bibliothek.de
Digitale Bibliothek
http://www.deutsche-digitale-bibliothek.de
“A focused collection of digital objects, including text, video, and audio [and beyond: 3D objects, simulations, dynamic visualizations, and virtual reality], along with methods for access and retrieval, and for selection, organization, and
maintenance of the collection.”[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
Digitale Bibliothek
Sammlung digitaler Objekte Text Video Audio 3D Objekte Simulationen, VR, etc.
Bereitstellung von Zugriffsmöglichkeiten: Benutzerseite:
Zugriff (access)
Abfrage (retrieval) von digitalen Objekten
Bibliothekarinnen-/Bibliothekarseite: Selection Organization Maintenance
Metadaten Kritisch für alle Formen organisierter digitaler Inhalte
Digitale Bibliothek
Grundfrage: Woher stammen die Metadaten?
Grundfrage: Woher stammen die Metadaten?
Option I: Ein Mensch hat festgelegt, dass x Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu.
Option II: Ein Computerprogramm hat x analysiert und bestimmt Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus.
Metadaten
Arten von Metadaten: Administrative metadata for managing resources, such as rights
information Descriptive metadata for describing resources (Beispiel: Zettel
des Zettelkataloges) Preservation metadata for describing resources, such as
recording preservation actions Technical metadata related to low-level system information, such
as data formats and any data compression used Usage metadata related to system use, such as tracking user
behavior
“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
Metadaten“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
Arten von Metadaten: Administrative metadata for managing resources, such as rights
information Descriptive metadata for describing resources (Beispiel: Zettel des
Zettelkataloges) Preservation metadata for describing resources, such as recording
preservation actions Technical metadata related to low-level system information, such as
data formats and any data compression used Usage metadata related to system use, such as tracking user
behavior
“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
MARC MAB MARCXML Dublin Core (DC) Metadata Object Description Schema: MODS […] OAI
Bibliographische Metadaten: Standards
MARC
MARC: MAchine Readable Cataloging
Vorgestellt in den späten 1960er Jahren von Henriette Avram (Library of Congress)
!Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)
MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
“Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R final revised 2nd edition).”[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
MARC
Variable Control Fields (00x) Variable Data Fields
Numbers and Codes (0xx) Main Entries (1xx) Titles (2xx) Edition, Imprint, etc. (2xx) Physical Description, etc. (3xx) Series Statements (4xx) Notes (5xx) […]
Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html
MARC Tags (die Spitze des Eisbergs)
MARC Tags (die Spitze des Eisbergs)
MARC Übung
http://www.loc.gov/marc/bibliographic/ecbdhome.html
MARCXML-Darstellung
MARCXML
Vorteile?Nachteile?
MARCXML Dublin Core
http://lccn.loc.gov/79459272/dc
Vorteile?Nachteile?
Maschinelles Austauschformat für Bibliotheken (MAB), MAB 1970er, Deutsche Nationalbibliothek MAB2 1990er Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung)
Kleiner Exkurs: MAB und VD18
Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke des 18. Jahrhunderts
Kontext
VD18
VD 16 VD 17 VD 18
~100 000 erfasste Titel
~255 000Titel
Ziel: Mehr als600 000 Titel
Förderzeitraum: 1969-1999
Förderzeitraum:Seit Juli 1996
Förderzeitraum:Ab 2009
VD18 – Arbeitsaufteilung / Workflow
SWB
KoordinierungsDB
VD18: Daten
MAB Übung
Dublin Core
Benannt nach Dublin, Ohio, wo 1995 das erste Treffen der Gruppe / Initiative veranstaltet wurde.
Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für Nutzung durch Nicht-Spezialisten die Beschreibung digitaler Ressourcen (i.e. Websites),
die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden
Verglichen (z.B.) mit MARC: Sehr einfach Designziel: Allgemeinheit, Einfachheit
Dublin Core
Satz von 15 Elementen zur Beschreibung von Ressourcen: Title Creator Subject Description Publisher Contributor Date Type Format Identifier Source Language Relation Coverage Rights
Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig
Dublin Core
http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core
Elementübersicht: http://de.wikipedia.org/wiki/Dublin_Core Vgl. auch: http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core
Übungsaufgabe: Geben Sie die wesentlichen Charakteristika des Werkes „Die Jungfrau züchtigt den Jesusknaben vor drei Zeugen“ (Max Ernst, 1926) mit Dublin Core wieder.
Dublin Core Übung
Stärke von Dublin Core: Einfachheit Schwäche von Dublin Core: Einfachheit
Genügen 15 Elemente, um (digitale) Objekte adäquat zu beschreiben?
Dublin Core
Digitale Objekte:METS / MODS
Problemstellung
Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://
www.gbv.de/wikis/cls/METS/MODS): Metadata Encoding and Transmission Standard (METS) Metadata Object Description Schema (MODS)
Heimat von METS: http://www.loc.gov/standards/mets/
METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.”
METS / MODS
Sieben Hauptabschnitte: Kopfteil (METS Header) Erschließungsangaben (Descriptive Metadata) Verwaltungsangaben (Administrative Metadata) Dateienabschnitt (File Section) Strukturbeschreibung (Structural Map) Strukturverknüpfungen (Structural Links) Verhalten (Behavior)
Ein Beispiel: http://vd18-proto.bibliothek.uni-halle.de/de-slub-vd18/oai/?
verb=GetRecord&metadataPrefix=mets&mode=view&identifier=5270690
METS / MODS
OAI:Open Archives Initiative
OAI: Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet
Konzepte & Co.: Data Provider Systeme, die Metadaten über OAI-PMH
zugänglich machen OAI-PMH OAI Protocol for Metadata Harvesting Service Provider Sammelt Metadaten von
Datenprovidern, bietet Suchinterface für Archive, von denen Metadaten gesammelt wurden
OAI: Begrifflichkeiten, Konzepte
Datenkommunikation über http-Request Basisadresse + Script (+ Verb (+ Argument)?)* Sechs "Verben" zur Kommunikation
Identify [wer bist du?] ListMetadataFormats [was sprichst du?] ListSets [was hast du für
Sammlungen?] ListIdentifiers [gib mir deine Identifier] ListRecords [gib mir Datensätze] GetRecords [gib mir Datensätze] Sechs "Argumente":
metadataPrefix, identifier, from, until, set, resumptionToken
OAI: Kommunikation
Beispielanwendung CEEC Handschrift Dom 213 Bild:
http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/pagesma/%22kn28-0213_001.jpg%22/segment/%22body%22
Beschreibung: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/katl/%22kn28-0213%22
XML (TEI-like): http://www.ceec.uni-koeln.de/projekte/CEEC/database/descriptions/kn28-0213.xml
OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn28-0213
OAI: CEEC
Arten von Metadaten: Administrative metadata for managing resources, such as rights
information Descriptive metadata for describing resources (Beispiel: Zettel
des Zettelkataloges) Preservation metadata for describing resources, such as
recording preservation actions Technical metadata related to low-level system information, such
as data formats and any data compression used Usage metadata related to system use, such as tracking user
behavior
“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
Metadaten“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
/