BODDy 2014 - Workshop 6: Andreas Mängel

Post on 26-Jun-2015

511 views 0 download

Tags:

description

Präsentation auf dem Berlin Open Data Day 2014 Thema: Imperia-Tool für die einfache Veröffentlichung digitaler Dokumente im Datenportal

Transcript of BODDy 2014 - Workshop 6: Andreas Mängel

1

Imperia DocumentCenterImperia-Tool fur die einfache Veroffentlichung digitaler Dokumente im Datenportal

Stand: 04. Juni 2014

2

Agenda

• Bestandsaufnahme

• Zielsetzung

• Lösungsskizze

• Fragen

Stand: 04. Juni 2014

3

Agenda

• Bestandsaufnahme

• Zielsetzung

• Lösungsskizze

• Fragen

Stand: 04. Juni 2014

4

Bestandsaufnahme

Stand: 04. Juni 2014

5

Bestandsaufnahme

• Fast 900 Datensätze• 480 GSI

• 72 Amt für Statistik

• 40 aus SimpleSearch

• ca. 500 Einträge mit Dokumenten• Aus vielen Verwaltungen

• Teils Dummy-Einträge

• 21 Anwendungen

Stand: 04. Juni 2014

6

Agenda

• Bestandsaufnahme

• Zielsetzung

• Lösungsskizze

• Fragen

Stand: 04. Juni 2014

7

Zielsetzung

• Bereitstellung von Dokumenten im Datenportal

• Möglichst kein zusätzlicher Aufwand

• Keine zusätzlichen Tools/Logins

• Intelligente Erkennung von Meta-Daten

Stand: 04. Juni 2014

8

Metadaten

Stand: 04. Juni 2014

Titel (Pflichtfeld) Name (Pflichtfeld) Art (Pflichtfeld) Veröffentlichende Stelle (Pflichtfeld)

Kontakt-Email (Pflichtfeld)

Kontaktinformation Name

Veröffentlichende Person Webadresse Kurzbeschreibung Lizenz (Pflichtfeld)

Veröffentlichungsdatum (Pflichtfeld) Aktualisierungsdatum Kategorie (Pflichtfeld) Schlagwörter Zeitraum von

Zeitliche Auflösung Geopraphische Abdeckung

Geopraphische Auflösung Anwendungen Sonstiges

Datei URL API URL Version

9

Agenda

• Bestandsaufnahme

• Zielsetzung

• Lösungsskizze

• Fragen

Stand: 04. Juni 2014

10

Lösungsskizze

• Login via Imperia

• DocumentCenter integriert (ähnlich DLDB)

• Upload von Dokumenten via Browser

• Mail-Weiterleitung von hinterlegten Adressen

• (teil-)automatische Erkennung von Meta-Daten (wenn vorhanden)

• Publikation der Dokumente auf www.berlin.de

• Publikation der Metadaten nach daten.berlin.de

Stand: 04. Juni 2014

11

Agenda

• Bestandsaufnahme

• Zielsetzung

• Lösungsskizze

• Fragen

Stand: 04. Juni 2014

12

Fragen

1. Welche Dokumententypen gibt es?

2. Welcher Art sind die Dokumente inhaltlich?

3. Welche davon können freigegeben werden?

4. Wie viele Dokumente gibt es?

5. Welche Meta-Daten gibt es bisher?

6. Wo stehen diese Meta-Daten?

7. Wer pflegt die Dokumente?

8. Wer stellt die Dokumente bereit?

9. Wo liegen die Dokumente?

10. Wie können sie in Imperia eingepflegt werden?

11. Wo können oder dürfen sie veröffentlicht werden?

12. Gibt es Dokumente, die nach www.berlin.de, aber nicht ins Datenportal veröffentlicht werden sollen?

Stand: 04. Juni 2014

13

Fragen

Welche Dokumententypen gibt es?

- Word-Dokumente, .doc, .xls, .pdf, .ppt

Stand: 04. Juni 2014

14

Fragen

Welcher Art sind die Dokumente (inhaltlich)?

• Telefonliste

• Parlamentsbeschlüsse

• Heimberichte

• Rundschreiben

• Formulare

• Themenbezogene Informationen (Faltblätter, Merkblätter, Broschüren)

• Haushaltspläne

• Publikationen

Stand: 04. Juni 2014

15

Fragen

Welche davon können freigegeben werden?

Fragen:

• Nur „finale“ Daten bereitstellen?

• Wie geht man mit Aktualisierungen um?

• Wie wird Missbrauch verhindert?

Stand: 04. Juni 2014

16

Fragen

Wie viele Dokumente gibt es?

- Beispiel: Heimberichte 50 am Stück

- GSI: 1200 Dokumente im Jahr

Stand: 04. Juni 2014

17

Fragen

Welche Meta-Daten gibt es bisher?

- Wenig bis keine Metadaten

- Eventuell über die Ordnerstruktur

- Gefahr der falschen Metadaten bei Kopieren von Dokumenten bzw. der Verwendung von Vorlagen

Stand: 04. Juni 2014

18

Fragen

Wo stehen diese Meta-Daten?

Stand: 04. Juni 2014

19

Fragen

Wer pflegt die Dokumente?

- Nicht unbedingt die Datenbereitsteller, eher die Fachabteilungen.

Stand: 04. Juni 2014

20

Fragen

Wer stellt die Dokumente bereit?

- Alle Verwaltungen/Bereichen

Stand: 04. Juni 2014

21

Fragen

Wo liegen die Dokumente?

- Fileservern

- Lokale Festplatten, Austausch per Mail

- Bei Projekten Collab-Software (z.B. BSCW)

- Kommen per Mail

- Liegen auf berlin.de und können übergreifend genutzt werden.

Stand: 04. Juni 2014

22

Fragen

Wie können sie in Imperia eingepflegt werden?

- Download-Modul via Media-Datenbank

- FTP-Account und SimpleSearch

- Automatisches Auslesen von Metadaten (Titel, Copyright, Datum) Ziel: 8 von 10 Treffern

Stand: 04. Juni 2014

23

Fragen

Wo können oder dürfen sie veröffentlicht werden?

- Teilweise schon bei berlin.de

- OpenData unklar

Stand: 04. Juni 2014

24

Fragen

Gibt es Dokumente, die nach www.berlin.de, aber nicht ins Datenportal veröffentlicht werden sollen?

- Ja und Nein, Lizenzrechtliche Fragen vs. Datenportal als zentrale Anlaufstelle (Dokumenten Datenbank)

- Aufbereitung im Datenportal aufwendiger als bei Veröffentlichung auf berlin.de (Metadaten)

Stand: 04. Juni 2014

25

Fragen

?

Stand: 04. Juni 2014