In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · ©...

26
Research Collection Presentation Pilotprojekt digitale Langzeitarchivierung Author(s): Boutsiouci, Pascalia; Pika, Jiri Publication Date: 2008 Permanent Link: https://doi.org/10.3929/ethz-a-005552858 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection . For more information please consult the Terms of use . ETH Library

Transcript of In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · ©...

Page 1: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

Research Collection

Presentation

Pilotprojekt digitale Langzeitarchivierung

Author(s): Boutsiouci, Pascalia; Pika, Jiri

Publication Date: 2008

Permanent Link: https://doi.org/10.3929/ethz-a-005552858

Rights / License: In Copyright - Non-Commercial Use Permitted

This page was generated automatically upon download from the ETH Zurich Research Collection. For moreinformation please consult the Terms of use.

ETH Library

Page 2: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

1© ETH-Bibliothek 2008

Pascalia Boutsiouci, Dr. Pascalia Boutsiouci, Dr. JiriJiri Pika Pika –– ETHETH--BibliothekBibliothekISKOISKO--TagungTagung WissensorganisationWissensorganisation 2008, Konstanz, 21. 2008, Konstanz, 21. FebruarFebruar 20082008

Pilotprojekt Digitale Langzeitarchivierung

Page 3: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

2© ETH-Bibliothek 2008

ProjektorganisationProjektorganisation

Kooperation zwischen drei Partnern

Informatikdienste der ETH Zürich

ETH-Bibliothek

Konsortium der Schweizer Hochschulbibliotheken

Phase 1: 01.09.2006 – 31.05.2007Phase 2: 01.06.2007 – ca. Ende 2008

Page 4: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

3© ETH-Bibliothek 2008

Ausgangslage (1)Ausgangslage (1)

Digitale Informationen an der ETH Zürich

Aus der ForschungPrimärdaten: digitale Messdaten

Sekundärdaten: elektronische Auswertungen / Ergebnisse

Aus der Verwaltung

digitale Dokumente: Geschäftsdaten

Page 5: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

4© ETH-Bibliothek 2008

Ausgangslage (2)Ausgangslage (2)

ETH-Bibliothek verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc.

traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form)

An der ETH Zürich fehlt:

ein umfassender Ansatz fein umfassender Ansatz füür die langfristige r die langfristige Archivierung und VerfArchivierung und Verfüügbarkeit von gbarkeit von digitalen Primdigitalen Primäärr-- und Sekundund Sekundäärdatenrdaten

Page 6: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

5© ETH-Bibliothek 2008

OAISOAIS--Referenzmodell als BasisReferenzmodell als BasisISO-Standard 14721 seit 2001

Consultative Committee for Space Data Systems (CCSD) –NASA, ESA, DLR

Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig

Übernahme von Modulen in Projektorganisation und Strukturplan

Page 7: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

6© ETH-Bibliothek 2008

Nutzung von Erfahrungen und Kompetenzen Nutzung von Erfahrungen und Kompetenzen

Austausch international

E-HelveticakopalKB – KoninklijkeBibliotheek der Niederlande

Kooperation mit nestor

Gemeinsame Umfrage 2007Nachnutzung: „Kriterienkatalog vertrauenswürdige digitale Langzeitarchive“

Page 8: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

7© ETH-Bibliothek 2008

Testdaten (1)Testdaten (1)

Primärdaten

Departement Erdwissenschaften der ETH Zürich

Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes

Projekt Replay – Multimedia-Portal System der ETH Zürich

Video-Dateien (Vorlesungen)

Page 9: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

8© ETH-Bibliothek 2008

Testdaten (2)Testdaten (2)

Sekundärdaten

ETH-Bibliothek und KonsortiumE-Journals Elsevier

E-Books (Springer)

E-Pics (Bildarchiv)

E-Collection (Dissertationen und elektronische Publikationen der ETH-Angehörigen

Page 10: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

9© ETH-Bibliothek 2008

Metadatenanalyse (1)Metadatenanalyse (1)

Standards

Möglichst bestehende Standards und offene Formate verwenden

Für möglichst viele Objekttypen ohne Anpassungen

Metadatengewinnung

Möglichst automatisierter Ablauf

Page 11: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

10© ETH-Bibliothek 2008

KategorieKategorieMetadatentypMetadatentyp

CodierungXML

PackagingMETS

administrative u. technische MetadatenLMER / PREMIS

reine Beschreibung der MetadatenDublin Core

Metadatenanalyse (2)Metadatenanalyse (2)

MetadatenstandardsGeeignet für die Langzeitarchivierung

Page 12: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

11© ETH-Bibliothek 2008

PreservationLevel A

PreservationLevel B

PreservationLevel C

Ser

vice

leve

l

Aufbewahrungsdauer

Kurzeitige Datenhaltungmit minimaler Serviceleistung

Mittelfristige Datenhaltungmit geringer Serviceleistung

Dauerhafte Datenhaltungmit umfassender Serviceleistung

Definition von Preservation Levels (1)Definition von Preservation Levels (1)

Definition für die ETH ZürichDrei Stufen und

Kriterien für die Langzeitarchivierung

Page 13: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

12© ETH-Bibliothek 2008

Kriterien Kriterien –– Preservation Levels (2)Preservation Levels (2)

Kriterien für die Archivierung nach den Preservation Levels

Das Dateiformat entspricht einer Positivliste von Formaten (z.B. PDF/A, XML, etc.).C.3

Der Objekttyp entspricht einer Positivliste von Typen.C.2

Umfassende inhaltliche, technische und administrative Metadaten sind vorhanden.Ein Mindeststandard der Metadaten muss definiert werden.C.1

Kriterien für die Langzeitarchivierung gemäss Preservation Level C

Das Dateiformat entspricht einer Positivliste von Formaten.B.2

Metadaten müssen so aufbereitet werden können, dass die Objekte für 5 bis 10 Jahre nutzbar bleiben.B.1

Kriterien für die Speicherung gemäss Preservation Level B

Es ist erkennbar, wer das Objekt abliefert.A.3

Es ist eine Übergabevereinbarung mit der Archiveinrichtung zu schliessen.A.2

Ein Objekt stellt kein Sicherheitsrisiko für das Archiv oder für archivierte Objekte dar.A.1

Kriterien für die Speicherung gemäss Preservation Level A

Page 14: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

13© ETH-Bibliothek 2008

Page 15: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

14© ETH-Bibliothek 2008

ÜÜbergabevereinbarungbergabevereinbarung

Datenlieferant

Art und Umfang der LieferungInhaltliche UmschreibungUmfang, Dateiformate, ÜbergabeverfahrenIT-Umgebung, Metadaten etc.

Verpflichtung des digitalen LZAPreservation LevelsDauer der Archivierung u. Dienstleistungsumfang

NutzungsbedingungenZielgruppen, Nutzungsrechte

Schutzfristen, Kosten

etc.

Page 16: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

15© ETH-Bibliothek 2008

OnlineOnline--Umfrage (1)Umfrage (1)

Bedarfsanalyse April 2007Klärung des Bedarfs an LZA digitaler Objekte an der ETH Zürich

Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen)

AdressatenAlle 15 Departemente der ETH Zürich

Zentrale Dienste

Rücklauf: 20%

Page 17: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

16© ETH-Bibliothek 2008

OnlineOnline--Umfrage (2)Umfrage (2)Allgemeine Aussagen

Über 80 % haben Interesse an einer zentralen Dienstleistung „digitale Langzeitarchivierung“

Page 18: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

17© ETH-Bibliothek 2008

OnlineOnline--Umfrage (3)Umfrage (3)

Vereinbarungen und Vorschriftenca. 80 % geben an, dass es in ihrer Organisationseinheit keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.

Page 19: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

18© ETH-Bibliothek 2008

OnlineOnline--Umfrage (4)Umfrage (4)

Formate der zu archivierenden Daten und ObjekteASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB, NETCDF, PDF, TIF, TXT, WORD, XML

Teilweise proprietäre Formate

17 (18%)keine Antwort

29 (31%)Nein

48 (51%)Ja

Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist?

Page 20: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

19© ETH-Bibliothek 2008

OnlineOnline--Umfrage (5)Umfrage (5)

Gibt es in Ihrem Bereich Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?

<5 Jahre: 5-10 Jahre: dauerhaft:

Einzeldateien (Textdateien, Bilder,

PDFs etc.)

Komplexe Objekte (z.B. Multimedia)

Datenbanken Fachspezifische Formate (GIS, CAD etc.)

Websites Ausführbare Objekte(Programme)

Aufbewahrungsdauer

Page 21: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

20© ETH-Bibliothek 2008

Enthalten die betreffenden Daten eine standardisierte Beschreibung ihrer technischen Eigenschaften?

Ja 27 (29%)

Nein 48 (51%)

keine Antwort 19 (20%)

OnlineOnline--Umfrage (6)Umfrage (6)

Technische MetadatenDaten und Objekte verfügen überwiegend über keine standardisierten Metadaten

Page 22: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

21© ETH-Bibliothek 2008

Enthalten die betreffenden Daten aussagekräftige deskriptive und administrative Beschreibungen, die es erlauben, diese zu einem anderen Zeitpunkt sachlich korrekt zu interpretieren?

Ja 50 (53%)

Nein 24 (26%)

keine Antwort 20 (21%)

Inhaltliche MetadatenRund die Hälfte der Antworten bejaht das Vorhandensein von inhaltlichen (deskriptiven und administrativen) Metadaten.

OnlineOnline--Umfrage (7)Umfrage (7)

Page 23: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

22© ETH-Bibliothek 2008

Entsprechen die technischen und inhaltlichen Beschreibungen einem Standard, der in Ihrem Fach oder allgemein anerkannt und dokumentiert ist?

Ja 39 (41%)

Nein 31 (33%)

keine Antwort 23 (26%)

OnlineOnline--Umfrage (8)Umfrage (8)

Format der technischen u. inhaltlichen Metadaten41 % antworten mit ja, aber nennen kein konkretes Format.

Page 24: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

23© ETH-Bibliothek 2008

OnlineOnline--Umfrage (9)Umfrage (9)Aktuelle Massnahmen

eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum.

18(19%)

Ergänzungen und sonstige Vorgehensweisen:

24 (26%)

Wir haben dafür eine verantwortliche Person benannt, die sich um die Aufbewahrung langfristig relevanter Daten kümmert:

19(20%)

Es gibt klare Richtlinien zur Aufbewahrung der Daten:

49(52%)

Beim Weggang von Mitarbeitenden müssen diese angeben, an welchem Ort und in welcher Form ihre Daten abgelegt sind:

56(60%)

Die Mitarbeiter sind dafür selber verantwortlich:

Durch welche Massnahme stellen Sie bzw. Ihre Mitarbeiter die Verfügbarkeit Ihrer Daten heute sicher? (Mehrfachnennungen erlaubt)

Page 25: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

24© ETH-Bibliothek 2008

Auswahl der Software und PilotAuswahl der Software und Pilot

Schritt 1

Anforderungs-katalog

Schritt 2

Präsentationen Lieferanten

Schritt 3

WorkshopsLieferanten

Schritt 4

Test-Installationen

Ziel: Vergleichende PilotinstallationVergleich zweier unterschiedlicher Ansätze

Page 26: In Copyright - Non-Commercial Use Permitted Rights / License: … · 2021. 2. 14. · © ETH-Bibliothek 2008 1 Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation

25© ETH-Bibliothek 2008

Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung:

E-Mail: [email protected] / Telefon: +41 44 632 84 26