In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · ©...
Transcript of In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · ©...
Research Collection
Presentation
Pilotprojekt digitale Langzeitarchivierung
Author(s): Boutsiouci, Pascalia; Pika, Jiri
Publication Date: 2008
Permanent Link: https://doi.org/10.3929/ethz-a-005552858
Rights / License: In Copyright - Non-Commercial Use Permitted
This page was generated automatically upon download from the ETH Zurich Research Collection. For moreinformation please consult the Terms of use.
ETH Library
1© ETH-Bibliothek 2008
Pascalia Boutsiouci, Dr. Pascalia Boutsiouci, Dr. JiriJiri Pika Pika –– ETHETH--BibliothekBibliothekISKOISKO--TagungTagung WissensorganisationWissensorganisation 2008, Konstanz, 21. 2008, Konstanz, 21. FebruarFebruar 20082008
Pilotprojekt Digitale Langzeitarchivierung
2© ETH-Bibliothek 2008
ProjektorganisationProjektorganisation
Kooperation zwischen drei Partnern
Informatikdienste der ETH Zürich
ETH-Bibliothek
Konsortium der Schweizer Hochschulbibliotheken
Phase 1: 01.09.2006 – 31.05.2007Phase 2: 01.06.2007 – ca. Ende 2008
3© ETH-Bibliothek 2008
Ausgangslage (1)Ausgangslage (1)
Digitale Informationen an der ETH Zürich
Aus der ForschungPrimärdaten: digitale Messdaten
Sekundärdaten: elektronische Auswertungen / Ergebnisse
Aus der Verwaltung
digitale Dokumente: Geschäftsdaten
4© ETH-Bibliothek 2008
Ausgangslage (2)Ausgangslage (2)
ETH-Bibliothek verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc.
traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form)
An der ETH Zürich fehlt:
ein umfassender Ansatz fein umfassender Ansatz füür die langfristige r die langfristige Archivierung und VerfArchivierung und Verfüügbarkeit von gbarkeit von digitalen Primdigitalen Primäärr-- und Sekundund Sekundäärdatenrdaten
5© ETH-Bibliothek 2008
OAISOAIS--Referenzmodell als BasisReferenzmodell als BasisISO-Standard 14721 seit 2001
Consultative Committee for Space Data Systems (CCSD) –NASA, ESA, DLR
Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig
Übernahme von Modulen in Projektorganisation und Strukturplan
6© ETH-Bibliothek 2008
Nutzung von Erfahrungen und Kompetenzen Nutzung von Erfahrungen und Kompetenzen
Austausch international
E-HelveticakopalKB – KoninklijkeBibliotheek der Niederlande
Kooperation mit nestor
Gemeinsame Umfrage 2007Nachnutzung: „Kriterienkatalog vertrauenswürdige digitale Langzeitarchive“
7© ETH-Bibliothek 2008
Testdaten (1)Testdaten (1)
Primärdaten
Departement Erdwissenschaften der ETH Zürich
Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes
Projekt Replay – Multimedia-Portal System der ETH Zürich
Video-Dateien (Vorlesungen)
8© ETH-Bibliothek 2008
Testdaten (2)Testdaten (2)
Sekundärdaten
ETH-Bibliothek und KonsortiumE-Journals Elsevier
E-Books (Springer)
E-Pics (Bildarchiv)
E-Collection (Dissertationen und elektronische Publikationen der ETH-Angehörigen
9© ETH-Bibliothek 2008
Metadatenanalyse (1)Metadatenanalyse (1)
Standards
Möglichst bestehende Standards und offene Formate verwenden
Für möglichst viele Objekttypen ohne Anpassungen
Metadatengewinnung
Möglichst automatisierter Ablauf
10© ETH-Bibliothek 2008
KategorieKategorieMetadatentypMetadatentyp
CodierungXML
PackagingMETS
administrative u. technische MetadatenLMER / PREMIS
reine Beschreibung der MetadatenDublin Core
Metadatenanalyse (2)Metadatenanalyse (2)
MetadatenstandardsGeeignet für die Langzeitarchivierung
11© ETH-Bibliothek 2008
PreservationLevel A
PreservationLevel B
PreservationLevel C
Ser
vice
leve
l
Aufbewahrungsdauer
Kurzeitige Datenhaltungmit minimaler Serviceleistung
Mittelfristige Datenhaltungmit geringer Serviceleistung
Dauerhafte Datenhaltungmit umfassender Serviceleistung
Definition von Preservation Levels (1)Definition von Preservation Levels (1)
Definition für die ETH ZürichDrei Stufen und
Kriterien für die Langzeitarchivierung
12© ETH-Bibliothek 2008
Kriterien Kriterien –– Preservation Levels (2)Preservation Levels (2)
Kriterien für die Archivierung nach den Preservation Levels
Das Dateiformat entspricht einer Positivliste von Formaten (z.B. PDF/A, XML, etc.).C.3
Der Objekttyp entspricht einer Positivliste von Typen.C.2
Umfassende inhaltliche, technische und administrative Metadaten sind vorhanden.Ein Mindeststandard der Metadaten muss definiert werden.C.1
Kriterien für die Langzeitarchivierung gemäss Preservation Level C
Das Dateiformat entspricht einer Positivliste von Formaten.B.2
Metadaten müssen so aufbereitet werden können, dass die Objekte für 5 bis 10 Jahre nutzbar bleiben.B.1
Kriterien für die Speicherung gemäss Preservation Level B
Es ist erkennbar, wer das Objekt abliefert.A.3
Es ist eine Übergabevereinbarung mit der Archiveinrichtung zu schliessen.A.2
Ein Objekt stellt kein Sicherheitsrisiko für das Archiv oder für archivierte Objekte dar.A.1
Kriterien für die Speicherung gemäss Preservation Level A
13© ETH-Bibliothek 2008
14© ETH-Bibliothek 2008
ÜÜbergabevereinbarungbergabevereinbarung
Datenlieferant
Art und Umfang der LieferungInhaltliche UmschreibungUmfang, Dateiformate, ÜbergabeverfahrenIT-Umgebung, Metadaten etc.
Verpflichtung des digitalen LZAPreservation LevelsDauer der Archivierung u. Dienstleistungsumfang
NutzungsbedingungenZielgruppen, Nutzungsrechte
Schutzfristen, Kosten
etc.
15© ETH-Bibliothek 2008
OnlineOnline--Umfrage (1)Umfrage (1)
Bedarfsanalyse April 2007Klärung des Bedarfs an LZA digitaler Objekte an der ETH Zürich
Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen)
AdressatenAlle 15 Departemente der ETH Zürich
Zentrale Dienste
Rücklauf: 20%
16© ETH-Bibliothek 2008
OnlineOnline--Umfrage (2)Umfrage (2)Allgemeine Aussagen
Über 80 % haben Interesse an einer zentralen Dienstleistung „digitale Langzeitarchivierung“
17© ETH-Bibliothek 2008
OnlineOnline--Umfrage (3)Umfrage (3)
Vereinbarungen und Vorschriftenca. 80 % geben an, dass es in ihrer Organisationseinheit keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.
18© ETH-Bibliothek 2008
OnlineOnline--Umfrage (4)Umfrage (4)
Formate der zu archivierenden Daten und ObjekteASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB, NETCDF, PDF, TIF, TXT, WORD, XML
Teilweise proprietäre Formate
17 (18%)keine Antwort
29 (31%)Nein
48 (51%)Ja
Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist?
19© ETH-Bibliothek 2008
OnlineOnline--Umfrage (5)Umfrage (5)
Gibt es in Ihrem Bereich Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?
<5 Jahre: 5-10 Jahre: dauerhaft:
Einzeldateien (Textdateien, Bilder,
PDFs etc.)
Komplexe Objekte (z.B. Multimedia)
Datenbanken Fachspezifische Formate (GIS, CAD etc.)
Websites Ausführbare Objekte(Programme)
Aufbewahrungsdauer
20© ETH-Bibliothek 2008
Enthalten die betreffenden Daten eine standardisierte Beschreibung ihrer technischen Eigenschaften?
Ja 27 (29%)
Nein 48 (51%)
keine Antwort 19 (20%)
OnlineOnline--Umfrage (6)Umfrage (6)
Technische MetadatenDaten und Objekte verfügen überwiegend über keine standardisierten Metadaten
21© ETH-Bibliothek 2008
Enthalten die betreffenden Daten aussagekräftige deskriptive und administrative Beschreibungen, die es erlauben, diese zu einem anderen Zeitpunkt sachlich korrekt zu interpretieren?
Ja 50 (53%)
Nein 24 (26%)
keine Antwort 20 (21%)
Inhaltliche MetadatenRund die Hälfte der Antworten bejaht das Vorhandensein von inhaltlichen (deskriptiven und administrativen) Metadaten.
OnlineOnline--Umfrage (7)Umfrage (7)
22© ETH-Bibliothek 2008
Entsprechen die technischen und inhaltlichen Beschreibungen einem Standard, der in Ihrem Fach oder allgemein anerkannt und dokumentiert ist?
Ja 39 (41%)
Nein 31 (33%)
keine Antwort 23 (26%)
OnlineOnline--Umfrage (8)Umfrage (8)
Format der technischen u. inhaltlichen Metadaten41 % antworten mit ja, aber nennen kein konkretes Format.
23© ETH-Bibliothek 2008
OnlineOnline--Umfrage (9)Umfrage (9)Aktuelle Massnahmen
eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum.
18(19%)
Ergänzungen und sonstige Vorgehensweisen:
24 (26%)
Wir haben dafür eine verantwortliche Person benannt, die sich um die Aufbewahrung langfristig relevanter Daten kümmert:
19(20%)
Es gibt klare Richtlinien zur Aufbewahrung der Daten:
49(52%)
Beim Weggang von Mitarbeitenden müssen diese angeben, an welchem Ort und in welcher Form ihre Daten abgelegt sind:
56(60%)
Die Mitarbeiter sind dafür selber verantwortlich:
Durch welche Massnahme stellen Sie bzw. Ihre Mitarbeiter die Verfügbarkeit Ihrer Daten heute sicher? (Mehrfachnennungen erlaubt)
24© ETH-Bibliothek 2008
Auswahl der Software und PilotAuswahl der Software und Pilot
Schritt 1
Anforderungs-katalog
Schritt 2
Präsentationen Lieferanten
Schritt 3
WorkshopsLieferanten
Schritt 4
Test-Installationen
Ziel: Vergleichende PilotinstallationVergleich zweier unterschiedlicher Ansätze
25© ETH-Bibliothek 2008
Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung:
E-Mail: [email protected] / Telefon: +41 44 632 84 26