Persistent identifiers 20150429_adlibgebruikersdag_v0_2

61

Transcript of Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Page 1: Persistent identifiers 20150429_adlibgebruikersdag_v0_2
Page 2: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENT URI’S IN ADLIB

Bert Lemmens | PACKED

27 april 2015 | Breukelen

Page 3: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

● 2005: opgericht door Museum Dhondt-Dhaenens, S.M.A.K., M HKA & argos.

● 2011: erkend door de Vlaamse Gemeenschap als Expertisecentrum Digitaal Erfgoed.

● Vlaamse projecten: CEST, Scoremodel Digitale Duurzaamheid, TRACKS - Archiefzorg in de Kunstensector, VIAA - digitalisering A/V dragers, opencultuurdata.be, persistente identificatie

● Europese projecten: ATHENAplus, PREFORMA, europeana.space

● Scoremodel | Erfgoedstats | SODA | SIP creator

● packed.be | scart.be | projectcest.be | scoremodel.org

Voor wie ons nog niet kent: Dit is packed.

Page 4: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Project ‘Persistente Identificatie’● okt 2013 – sep 2014

● opdracht en financiering

Vlaamse Overheid, Departement Cultuur, Jeugd, Sport en Media

● partners:

Vlaamse Kunst Collectie (KMSK Antwerpen, MSK Gent, Groeningemuseum Brugge)

Contemporary Art Heritage Flanders (M HKA, Mu.Zee, SMAK, Middelheimmuseum)

● LUKAS

● Collectie Vlaamse Gemeenschap

Deze is een update van het

project persistente

identificatie.

Page 5: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

5

● persistente URI’s● project update● URI’s documenteren● voorstel!

De agenda:

Page 6: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENTE URI’S?

Page 7: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

http://kmska.be/collectie/work/id/1856

kunstwerk

Persistente URI’s zijn webadressen voor kunstwerken.

Page 8: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

m.n. de ‘real life’ kunstwerken op zaal

Page 9: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

http://kmska.be/collectie/work/data/1856

metadata

Persistente URI’s zijn webadressen voor informatie

over kunstwerken.

Page 10: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

De informatie die je bijvoorbeeld op je collectiewebsite

plaatst.

Page 11: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

http://kmska.be/collectie/work/representation/1856

beeld

Persistente URI’s zijn webadressen voor beelden van

kunstwerken.

Page 12: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

De foto’s van de kunstwerken uit je

collectie

Page 13: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENTE URI =

● webadres● naam voor kunstwerk, metadata en beeld● opgesteld volgens standaard regels ● onveranderlijk● leesbaar ● geautoriseerd door het museum

Kortom: het kanaal waarlangs je

betrouwbare informatie over je collectie

verspreid op het web.

Page 14: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENTE URI’S.WAAROM ZOU U?

Page 15: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#1 BETROUWBARE CONTENT NEGOTIATIE

Page 16: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.htmlURI’s zijn

persistent binnen de levensduur van je eigen website

Page 17: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

17

http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg

En ze zijn doorgaans niet bedoeld voor ‘human agents’.

Page 18: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Dat zorgt voor problemen als je URI’s gaat gebruiken voorbij de levensduur van je

website

Page 19: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Persistente URI?

En het maakt jouw beeld moeilijk vindbaar tussen

alle gelijkaardige beelden op het web

Page 20: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

werkhttp://

kmska.be/collectie/

work/id/1856

datahttp://

kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representation

/1856

Persistente URI’s maken jouw informatie en beelden uniek en

langdurig identificeerbaar op het

web.

Page 21: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

werkhttp://cvg.be/

collectie/work/id/1856 data

http://kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representati

on/1856

beeldhttp://

lukasweb.be/collectie/work/representation/

1856

datahttp://cvg.be/

collectie/work/data/

1856

datahttp://

vkconline.be/collectie/work/data/

1856

Het onderscheid met info en

beelden uit andere collecties is helder

Page 22: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#2 INFORMATIE CLUSTEREN OP HET

WEB

Page 23: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

23

Dat wordt erg belangrijk als we

met z’n allen info en beelden op het web

gaan plaatsen

Page 24: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Het wordt pas echt interessant als je zo

nieuwe info en beelden op het

spoor komt.

Page 25: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

CIDOC STATEMENT ON LINKED DATA IDENTIFIERS (2012)

● Museums are the sole authority with responsibility for establishing globally unique and persistent identities (URIs) for each of the objects in their collections;

● Each museum should establish and publish on the internet such a unique and persistent identity – preferably as http URI (= webadres) – for each of its objects;

● This URL should resolve to a human‐readable description of the object, which is sufficiently detailed to identify it unambiguously;

● Ideally, this URL should additionally resolve to a comparable description in a machine processible format, using best practice Linked Data principles;

● When describing the relationship of the collection object to its cultural context (people, places, events, etc.), the museum should where possible reuse URLs from common frameworks, rather than minting its own URLs for these concepts;

http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/PDF/StatementOnLinkedDataIdentifiersForMuseumObjects.pdf

Daarom is het cruciaal dat je jezelf

als autoriteit kenbaar maakt over de info en beelden die jij verspreid.

Page 26: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

werkhttp://cvg.be/

collectie/work/id/1856

datahttp://

kmska.be/collectie/

work/data/1856

beeldhttp://

kmska.be/collectie/

work/representati

on/1856

beeldhttp://

lukasweb.be/collectie/

work/representati

on/1856

datahttp://cvg.be/

collectie/work/data/

1856

makerhttp://

viaf.org/viaf/

312406452/

typehttp://

vocab.getty.edu/aat/

300033799

En het werkt ook omgekeerd: jij

maakt gebruik van de autoriteit van

anderen.

Page 27: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENT?

Kort over hoe we in dit project

‘onveranderlijkheid’ nastreven.

Page 28: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

Eenvoudige vorm

Voor meer details over de principes die we gebruiken: lees

het ISA rapport!

Page 29: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#1 EENVOUDIGE VORM

http://[domein]/ verplicht

[type object]/ optioneel

[type document]/ optioneel

[identificatienummer] verplicht

Een eenvoudige vorm maakt het

makkelijker om de onveranderlijkheid

van URI’s te bewaren.

Page 30: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#2 CONTROLE OVER DOMEINNAAM

museum domein collectiedata

VKC http://vlaamsekunstcollectie.be/collection/

Groeningemuseum http://groeningemuseum.be/collection/

KMSKA http://kmska.be/collection/

MSKGent http://mskgent.be/collection/

LUKAS http://lukasweb.be/collection/

S.M.A.K. http://smak.be/collection/

M HKA http://mukha.be/collection/

Middelheimmuseum http://middelheimmuseum.be/collection/

Mu.Zee http://muzee.be/collection/

CVG http://kunstenenerfgoed.be/cvg/collection/

Elke museum bepaalt een

(sub)domein dat voor onveranderlijke

data dient.

Page 31: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#3 GEBRUIK BESTAANDE ID’S

museum inventaris-nummer

Persistente URI - ID

Groeningemuseum

0.2.GRO0002.II .../collection/work/id/0_2_GRO0002_II

SMAK nvt nvt

MuHKA VH0178.1 .../collection/work/id/VH0178_1

Middelheim MID.B.109 .../collection/work/id/MID_B_109

Mu.Zee B000071(a) .../collection/work/id/B000071_a

MSKGent 1920-DB-1,2,3 .../collection/work/id/1920-DB-1_2_3

KMSKA 831/4 .../collection/work/id/831_4

CVG M423 A - N .../collection/work/id/M423_A-N

VKC nvt nvt

LUKAS nvt nvt

We hergebruiken inventarisnummers

omdat we daar al de ‘onverandelijkheid’

van nastreven.

Page 32: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#4 ZORG DAT HIJ GEBRUIKT WORDT >>> HTTP RESOLVING

naam = Persistente URI locatie = URL

werk http://middelheimmuseum.be/collection/work/id//MID.B.541

n/a

metadata http://middelheimmuseum.be/collection/work/data//MID.B.541

http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.html

beeld http://middelheimmuseum.be/collection/work/representation//MID.B.541

http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg

We gebruikten het http protocol omdat we dan maximaal zeker zijn dat

medewerkers de URI’s ook gaan gebruiken.

Page 33: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PROJECT UPDATE

Page 34: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

34

MILESTONES

● +34.000 kunstwerken met ID● >90% kunstenaars & objectnamen met ID● Demonstrator: clusters werken!● Resolver: gebruik je eigen webserver!● Datauitgever Handboek

De belangrijkste resultaten van 2014:

Page 35: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

35

#1. +34.000 WERKEN MET ID

totaal aantal data pids 43.264

totaal aantal work pids 34.358

aantal work pids met 1 data pid 26.575 77 %

aantal work pids met 2 data pid’s 6.782 20 %

aantal work pids met 3 data pid’s 908 2,5 %

aantal work pids met 4 data pid’s 68 <1 %

aantal work pids met meer dan 4 data pid’s 25 <1 % 

We weten hoeveel informatie we

hebben en hoeveel kunstwerken we

hebben

Page 36: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#2 TERMINOLOGIEEN: VERVAARDIGER

>> 90% van de 10.183 naamsvermeldingen geidentificieerd

>> Aantal unieke personen in de 10 collecties – geschat tussen 7.025 en 7.750

Aantal naams-vermeldingen

Aantal unieke strings in de naams- vermeldingen

Aantal records geïdentificeerd met maar 1 pURI

Aantal records geïdentificeerd met maar 2 pURI

Aantal records geïdentificeerd met maar 3 pURI

Aantal records geïdentificeerd met maar 4 pURI

10.183 7.750 1.373 (14%) 3.424 (34%) 4.083 (40%) 204 (2%)

Externe bron Aantal geïdentificeerde naamsvermeldingen

Aantal unieke kunstenaars

Aantal naamsvarianten gehaald uit de externe bron

RKDartists 8.708 7.025 21.413

VIAF 7.791 4.584 111.711

Wikidata 4.463 2.326 9.156

ODIS 347 165 -

Voor vrijwel alle kunstenaars konden

we bijkomende informatie uit

externe bronnen koppelen.

Page 37: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#2 TERMINOLOGIEEN: OBJECTNAAM

Aantal unieke waarden van objectnamen

Aantal unieke waarden geidentificieerd met een AAT-id

Aantal unieke AAT concepten

Engelse waarden

Franse waarden

Duitse waarden

Nederlandse waarden

697 663 344 1215 649 208 1166

• 958 records aangeleverd door musea

• 697 unieke waardes, waarvan 663 (95%) hebben een AAT-id gekregen

• eigenlijk gaat het over 344 unieke concepten

• nu doorzoekbaar op 3238 termen in meerdere talen

Het gebruik van objectnamen we

verrassend beperkt.

Page 38: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#3 DEMONSTRATOR: CLUSTERS!

Uit de tests met een eenvoudige

aggregator bleek dat persistente URI’s de vindbaarheid van info

een beelden sterk verbetert.

Page 39: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#3 DEMONSTRATOR: VERRIJKING!

En verrijking met dat uit VIAF,

RKDartists, Getty en Wikidata maakt kleine records veel

interessanter.

Page 40: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#4 HTTP RESOLVER TOOL

En we werken aan een tool om beheer

van persistente URI’s haalbaar te maken

voor museummedewerkers

.

Page 41: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#4 HTTP RESOLVER TOOL

Die tool is vrij beschikbaar.

Page 42: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#5 DATA UITGEVER + HANDBOEK

reso

lve

rmanagement

IT-verantwoordelijke

data uitgever

machine applicatie

We maken ook een handboek voor gebruik in het

museum.

Page 43: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

#5 DATA UITGEVER + HANDBOEK

Te vinden op de CEST wiki.

Page 44: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

44

TOEKOMST?

● Events > levensloop persistent identificeren

● Wikidata > LOD publicatie

● Data Cleansing met Open Refine > zelf semi-automatisch persistente URI’s linken voor personen, plaatsen en concepten> zoek Alina en Trinneke! en volg de workshop!

De volgende stappen voor 2015:

Page 45: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENTE URI’S DOCUMENTEREN

Page 46: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

46

VALKUILEN

● URI’s duurzaam documenteren?

● Extra werklast vermijden?

De twee grootste valkuilen voor ons project tot nog toe:

Page 47: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

47

VALKUILEN

● URI’s duurzaam documenteren?● in collectiedata > in het collectiebeheersysteem● standaard beschrijvingsregels voor persistente URI’s

● Extra werklast vermijden?● invoer automatiseren● maar: flexibeliteit om vorm URI’s te bepalen

En hoe we die denken aan te

pakken.

Page 48: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

PERSISTENTE URI’S IN HET WILD!

Daarvoor zijn we inspiratie gaan

opdoen bij anderen.

Page 49: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

49

GEMEENTEMUSEUM

Het Gemeentemuseum documenteert

een persistent ID.

Het ID is niet het inventarisnummer.

Lijkt ook geen priref.

Page 50: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

50

GEMEENTEMUSEUM

Maar gebruikt andere ID’s in zijn

URI’s

Page 51: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

51

RIJKSMUSEUM

Ook het Rijksmuseum

documenteert een persistent ID.

ID is geen inventarisnummer,

lijkt een priref.

Page 52: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

52

RIJKSMUSEUM

En verpakt die in een Handle URI

Page 53: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

53

AMSTERDAM MUSEUM

Amsterdam Museum

documenteert de volledige Handlei

URI.

ID is geen inventarisnummer,

lijkt een priref.

Page 54: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

MIDDELHEIMMUSEUM

Middelheim stopt URI’s voor personen

in de bestaande velden

Zowel domein en ID in aparte velden als

de volledige link.

Page 55: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

55

COLLECTIE VLAAMSE GEMEENSCHAP

Page 56: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

56

COLLECTIE VLAAMSE GEMEENSCHAP

CVG stopt domein en ID in nieuwe

velden.

Page 57: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

VOORSTEL!

Kwestie van iedereen volgens

dezelfde praktijk te laten werken

Page 58: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

58

STANDAARD IMPLEMENTATIE

● PACKED- Project Persistente Identificatie(Alina Saenko) &

● DEN – Netwerk Digitaal Erfgoed(Wilbert Helmus)

● 6 entities/12-17 velden● domain - id● plaats user interface

Samen met DEN om dat dit een structureel

probleem is in de erfgoedsector

Page 59: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

59

VOORSTEL

Element Adlib database

Adlib

tag

Element name Visibility Place in user interface Example value repeatable

Automatic?

Adapl needed?

Work Collect.inf od object.pid.domain Yes with option to override value

Tab Object identification, under inventory number

http://kunstenenerfgoed.be/CVG/collection/work/id/

no yes  

oi object.pid.ID Yes with option to override value

Tab Object identification, under inventory number

BK_2179 no yes yes

?? object.pid.URI Yes with option to override value

Tab Object identification, under inventory number

http://kunstenenerfgoed.be/CVG/collection/work/id/BK2179

no yes yes

Record Collect.inf cd collect.pid.domain Yes with option to override value

Tab Object identification, under inventory number

http://kmska.be/collection/work/data/

no yes yes

ci collect.pid.ID Yes with option to override value

Tab Object identification, under inventory number

BK_2179 no yes yes

?? collect.pid.URI Yes with option to override value

Tab Object identification, under inventory number

http://kmska.be/collection/work/data/BK_2179 

no yes yes

Image Photo.inf pd photo.pid.domain Yes with option to override value

Tab Media identification, under ‘object identifier’

http://kmska.be/collection/work/representation/

no yes yes

pi photo.pid.ID Yes with option to override value

Tab Media identification, under ‘object identifier’

BK_2179 no yes yes

?? photo.pid.URI Yes with option to override value

Tab Media identification, under ‘object identifier’

http://kmska.be/collection/work/irepresentation/BK_2179

no yes yes

Date Collect.inf pt production.date.normalised.type

no   ISO 8601 yes yes yes

pv production.date.normalised.value

no   1901/2000 yes yes yes

Artist or custodian

People.inf pd people.pid.domain yes Tab People identification, under ‘object identifier’

http://viaf.org/viaf/ yes Annotation tool

yes

pi people.pid.ID yes Tab People identification, under ‘object identifier’

71417899 yes Annotation tool

yes

?? people.pid.URI yes Tab People identification, under ‘object identifier’

http://viaf.org/viaf/71417899 

yes yes yes

Objectname

Thesau.inf td thesau.pid.domain yes Tab Objectname identification, under ‘object identifier’

http://browser.aat-ned.nl/ yes Annotation tool

yes

ti thesau.pid.ID yes Tab Objectname identification, under ‘object identifier’

300078925 yes Annotation tool

yes

?? thesau.pid.URI yes Tab Objectname identification, under ‘object identifier’

http://browser.aatned.nl/300078925 

yes yes yes

Tada!

Page 60: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

60

DOCUMENTEN● Projectrapport:

http://www.projectcest.be/index.php/Project_Persistente_identificatie

● Data uitgever handboek:http://www.projectcest.be/index.php/Project_Persistente_Identificatie_II

● Voorstel:http://www.projectcest.be/images/f/fe/20150309_draft_pidimplementation_adlib_V1_2_EN.pdf

● Resolver softwarehttps://github.com/PACKED-vzw/resolver

● Open refinehttp://www.projectcest.be/index.php/Handleiding_Open_Refine

Alle links naar de relevante

documenten. Feedback is van harte welkom!

Page 61: Persistent identifiers 20150429_adlibgebruikersdag_v0_2

BEDANKT!