Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Post on 13-May-2015

221 views 5 download

Tags:

description

Dezvoltarea aplicațiilor Web (7/12) — detalii la http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

Transcript of Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Linked Open Data

Dezvoltarea aplicațiilor Web

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“E mai ușor să negi lucrurile,decât să te informezi despre ele.”

Mariano José de Larra

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Web attitude (Tim Berners-Lee)

anyone can say anything about anything

no one knows everything about anything

my system is most valuablebecause of its interconnection to its peers

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Centrate pe documentepagini statice, situri de companii

Interactiveexpoziţii virtuale, ştiri, e-travel

Tranzacționalee-banking, soluţii B2B, workflow-uri

Colaborativechat, e-learning, servicii peer-to-peer, wiki,…

Orientate spre portaluricomunități, pentru afaceri, Web cetățenesc etc.

De tip ubicuuservicii bazate pe locație, multi-platformă, în timp-realcloud computing

Web socialspații virtuale, activități colaborative, tagging de resurse,volum mare de date (big data)

Web semantic (Web of data)date structurate, recomandare & mediatizare,servicii contextuale, aplicații smartmanagement de cunoștințe + raționament automat

evolu

țiaîn

timp

a com

plexității

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

disponibilitatea datelor la nivel de Web

A fi stocat pe Web(“on the Web”)

ca document “opac”– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,alte resurse de interes

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

disponibilitatea datelor la nivel de Web

A fi descoperibil pe baza standardelor Web(“in the Web”)

folosind modele/formate de date deschise(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,procesabile independent de platformă

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Necesitatea modelării cunoștințelor

knowledge modeling

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Necesitatea modelării cunoștințelor

knowledge modeling

“instrumente” cognitive umane:formal logic, rules, concepts, analogies,

images, neural connections

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Apare necesitatea managementului acestora

knowledge management

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Aspecte privind managementul cunoștințelorShadbolt & O’Hara, 2004

achiziția (acquiring)modelarea (modelling)obținerea (retrieving)reutilizarea (reusing)

publicarea (publishing)mentenanța (maintaining)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

e.g., texte (formatate) preluate din formulare

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

utilizatorii obișnuiți nu vor marca dateleîn formate precum HTML sau JSON, XML, RDF etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

de la limbaj natural la modele conceptuale modelate via RDF – proiectul FRED (F. Draicchio et al., 2012)

http://wit.istc.cnr.it/stlab-tools/fred

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

framework-ul Semarglextragerea datelormodelate cu RDFa

(Lev Khomich, 2013)http://semarglproject.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

conform expresivității dorite

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

în practică, acest aspect este aproape imposibil(vezi dificultățile de dezambiguizare a limbajului natural)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

existența modelelor și formatelor eterogene

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

pași de urmat:identificarea categoriilor (claselor) de resurse,

definirea proprietăților + restricțiilor,completarea – (semi)automată a – datelor despre indivizi:

input explicit, data mining, tagging, microdate HTML5, RDFa etc.

detalii în cursurile viitoare

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Obținerea (retrieving)

mecanisme de interogare și filtrare a cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,

în manieră (semi)automată,pe baza meta-datelor și relațiilor dintre entități

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

fiecare entitate trebuie definită doar o singură dată

identificată printr-un URI

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

“because you can look it up; because you can refer to a URI in any context, unlike 'Q30' which only means something

in a specific context”

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

aspecte importante:disponibilitate în formate standardizate

politici de acces – copyright, proveniență, licențiereconfidențialitate (privacy)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

depinde și de utilizabilitatea sistemului

formate alternative oferind o sintaxă simplă, standardizatăquery by example

interacțiune naturalăflexibilitate – e.g., oferirea de sugestii

etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

de considerat atât utilizatorii umani, cât și aplicațiile

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Mentenanță (maintaining)

necesitatea existenței unor servicii care să asigureconsistența datelor/cunoștințelor

serviciile automate se pot baza pe instrumentede efectuare a raționamentelor (reasoners)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

cu grade de maturitate & adoptie diferite

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Benjamin Nowack, 2009

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Care este arhitectura aplicațiiloraliniate problematicilor Web-ului semantic?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Arhitectura aplicațiilor bazate pe RDF(Allemang & Hendler, 2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Lassila & Hendler (2007)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

exemplificare:arhitectura

framework-uluiApache Jena

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: SWAML

Extragerea datelor din mesaje de e-mail, în vedereainterogării, reutilizării & publicării ulterioare

(Sergio Fernández et al., 2009)

procesează datele în format mailbox (RFC 4155) șioferă descrieri RDF ale mesajelor, listelor de distribuție

și persoanelor, bazându-se pe SIOC

interogări via SPARQL, publicare folosind RDFa

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: SWAML

export în format KML pentru realizarea de mash-up-uripe baza Google Maps (Fernández et al., 2009)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Management colaborativ al conținutuluimodelat semantic (semantic wikis)

Semantic MediaWiki

extensie a sistemului MediaWiki:permite adnotarea semantică a conținutului unui wiki

http://semantic-mediawiki.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Idee: asocierea de perechi proprietate—valoare

fiecărui fragment de informație dintr-un wiki

The title of this book is '''[[Has Title::Cloud Atlas]]'''

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Utilizări în special în e-science(arheologie, biologie, biomedicină,…)

și în domeniul guvernamental, inclusiv în e-learning

http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

constituie o bază de cunoștințe

versiunea în limba engleză: descrieri a peste 4 milioane de „lucruri” (things) via RDF

conținut disponibil în 119 limbi – 25 milioane de „things”

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

recurge la diverse modele conceptuale vizând mai multe domenii

acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess?v=d8c

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicatii rdf: exemplificari

surse de date care referă alte entități DBpediaconform Bizer et al., 2009

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia

labelsrdfs:label, interlanguage links, redirects,imagesfoaf:depiction, geo-coordinates,disambiguationdbpedia:disambiguates,

external linksdbpedia:reference, pagelinksdbpedia:wikilink etc.

DBpedia Information Extraction Frameworkimplementat inițial în PHP, actualmente în Scala

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicatii rdf: exemplificari

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

DBpedia Liveresponsabil cu sincronizarea datelor Wikipedia↔DBpedia

(implementare Java)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: freebase

Freebase (preluat de Google în 2011)

model de date specificat semantic, în mod colaborativ

expune seturi de triple RDF

oferă un API deschis + limbaj de interogare propriu: MQL

utilizatorii finali nu trebuie să aibă cunoștințeprivitoare la Web-ul semantic

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicatii reale

detalii pentru dezvoltatorii de aplicații la https://developers.google.com/freebase/

restaurantele din preajma Bucureștiului

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Cum publicăm datele pe Webastfel încât să fie asigurate

reutilizarea și interoperabilitatea?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011

http://linkeddatabook.com/book

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

reducerea redundanțeifacilitarea reutilizării

permiterea descopeririimaximizarea inter-conectivității între “lucruri” înrudite

adoptarea unei viziuni pragmatice

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Viziune:

Use the Web of Data as a Content Management System

Use the community at large as content editors

Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Ingrediente de bază:

identificare – URIacces – HTTP

modelare – RDFstructurare – schema.org, RDFa, RDF Schema, OWL

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

un „nor” al datelor interconectate extrase din DBpediaexemplu furnizat de R. Meymandpour & J. Davis (2013)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Utilizarea URI-urilor pentru numirea “lucrurilor”

specificarea via URI a oricăror resurse– informaționale sau non-informaționale –,

nu doar a documentelor

identitate unică la nivel global

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Folosirea de URI-uri ce pot fi vehiculate via HTTP

orice URI are un proprietar:persoană, organizație, specificație,…

utilizatorii/aplicațiile pot localiza resursele(oricine posedă un browser/client Web)

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Oferirea de informații utile în format RDF

atunci când o agent (entitate) accesează un URI,poate “afla” (meta-)date de interes

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Includerea în reprezentarea RDFa unor legături spre alte URI-uri

facilitarea descoperirii de informații înrudite(network effect)

http://www.w3.org/DesignIssues/LinkedData.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

S. Buraga, „De câte stele sunt datele d-voastră?” (2012)www.slideshare.net/busaco/de-cte-stele-sunt-datele-dvoastra

date de 5 stele (5 ★ Open Data)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date de 1 stea

conținutul e disponibil pe Web – indiferent de format – conform unei licențe deschise

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

utilizatorii pot vizualiza, lista,stoca local și, eventual, modifica documentul

documentul în sine poate fi partajat via Internet

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

documentul poate fi publicat rapid & facil pe Web

pentru a refolosi datele incluse în documentsunt necesare uneori procesări suplimentare

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date de 2 stele

suplimentar, conținutul este disponibil pe Webîntr-un format structurat

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

utilizatorii pot procesa documentul– folosind, uzual, software proprietar

documentul poate fi exportat în alt format(structurat sau nu)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

documentul poate fi încă publicat facil pe Web

datele sunt în continuare “încuiate” în document,procesarea depinzând de un anumit program

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 3 stele

recurgerea la un format deschispentru a pune la dispoziție pe Web date

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

datele pot fi gestionate (vizualizate, filtrate, procesate, convertite, refolosite etc.) în orice manieră

asigurarea independenței de platforma software

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

în continuare, documentul poate fi publicat facil pe Web

exportarea datelor într-un format proprietarar putea fi problematică

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 4 stele

adoptarea identificatorilor de resurse (URI-uri) pentru a desemna “lucruri” de interes

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

datele, informațiile și cunoștințele se identifică via URI-uripentru a putea fi ulterior referite și (re)utilizate

uzual, se recurge la modelul RDF

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

publicarea poate fi relativ mai dificilă,necesitând de obicei adoptarea de instrumente și

metodologii specifice tehnologiilor Web-ului semantic

“data in the Web”implicații pe termen lung

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 5 stele

în plus, datele sunt inter-relaționateconform principiilor inițiativei linked data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

posibilitatea descoperirii altor date de interes (înrudite)direct la momentul procesării

se oferă premisele efectuării de raționamente automate direct la nivel de Web pe baza modelelor conceptuale

exprimate standardizat via SKOS, OWL,…

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

dificultăți:consistența & reconcilierea datelor și cunoștințelor

probleme legate de adopția lentă de către industrie

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

existența unui magazin virtual destinat connoisseur-uluiafacere online – wiskii.com – fondată de Jeff

informații furnizate de experți ai domeniuluicontribuții realizate și de către utilizatori obișnuițiimplementare bazată pe un server de aplicații Web

date stocate relaționalacces simultan la date în HTML și RDF

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

1. înțelegerea principiilor linked data2. înțelegerea (conceptualizarea) datelor3. alegerea URI-urilor pentru “lucrurile” de interes4. stabilirea infrastructurii5. relaționarea cu alte seturi de date existente6. descrierea & publicarea datelor

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

persoane? locații geografice?

artefacte culturale?comentarii? evaluări?

etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Aspecte – concepte – de interes privindbaza de cunoștințe utilizată de aplicația wiskii.com

distilerii, regiuni & locații geografice, fondatori, proprietari, brand-uri, produse, fotografii,

evaluări (review-uri), comentarii, prețuri & oferte

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

principii:

reutilizarea, nu inventarea unui alt vocabular

combinarea vocabularelor existente

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

în contextul studiului de caz,potențiale modele conceptuale ce pot fi folosite:

Geonames – http://www.geonames.org/ontology

GoodRelationsFOAF (Friend Of A Friend)

Review – http://vocab.org/review/

SIOC (Semantically-Interconnected Online Communities)Whisky – http://vocab.org/whisky/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Term URI Description

Comment http://purl.org/stuff/rev#Comment A comment on a review.

Feedback http://purl.org/stuff/rev#Feedback Feedback on the review.

Review http://purl.org/stuff/rev#Review A review of an work.

commenter http://purl.org/stuff/rev#commenter The commenter on the review.

hasReview http://purl.org/stuff/rev#hasReview Associates a work with a a review.

hasComment http://purl.org/stuff/rev#hasCommentUsed to associate a review with a comment on the review.

hasFeedback http://purl.org/stuff/rev#hasFeedbackAssociates a review with a feedback on the review.

maxRating http://purl.org/stuff/rev#maxRating A numeric value.

minRating http://purl.org/stuff/rev#minRating A numeric value.

positiveVotes http://purl.org/stuff/rev#positiveVotesNumber of positive usefulness votes (integer).

rating http://purl.org/stuff/rev#rating A numeric value.

reviewer http://purl.org/stuff/rev#reviewer The person that has written the review.

text http://purl.org/stuff/rev#text The text of the review.

title http://purl.org/stuff/rev#title The title of the review.

totalVotes http://purl.org/stuff/rev#totalVotes Number of usefulness votes (integer).

type http://purl.org/stuff/rev#type The type of media of a work under review.

concepte & proprietăți definite de vocabularul Review

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

vocabularele (tipurile de date) definite pot avea ulterioratașate specificații formale

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:recurgerea la schema HTTP pentru facilitarea accesului

http://vocab.org/whisky/terms/Brand

versusurn:whisky-vocab:brand

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:evitarea imixtiunii în alte spații de nume

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:abstractizare – evitarea detaliilor de implementare

http://dbpedia.org/resource/Romania

versushttp://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/

resources.php?id=Romania

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:folosirii unei singure convenții de referire

# (hash) sau / (slash)

http://undeva.info/foaf.rdf#me

versushttp://undeva.info/id/me

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

șabloane de stabilire a URI-urilor

http://dbpedia.org/resource/Science Thing (concept)

http://dbpedia.org/data/Science Date RDF

http://dbpedia.org/page/Science Pagină HTML

http://revyu.com/people/tom Thing (concept)

http://revyu.com/people/tom/about/rdf Date RDF

http://revyu.com/people/tom/about/html Pagină HTML

http://undeva.info/concept Thing (concept)

http://undeva.info/concept.rdf Date RDF

http://undeva.info/concept.html Pagină HTML

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Exemplificări (clasă + instanță):

regiuni http://wiskii.com/regions/speyside

distilerii http://wiskii.com/distilleries/talisker

brand-uri http://wiskii.com/brands/talisker

produse http://wiskii.com/products/talisker-10-yo

persoane http://wiskii.com/people/william-matheson

fotografii http://wiskii.com/photos/58

review-uri http://wiskii.com/reviews/271

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Accesul la o anumită reprezentare – exemple:

concept http://wiskii.com/brands/talisker

date RDF http://wiskii.com/brands/talisker/rdf

pagină HTML http://wiskii.com/brands/talisker/html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Stabilirea infrastructurii

HTML RDF

aplicațieWeb

date

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

HTTP 303 See Other HTTP 303 See Other

content negotiation

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Instrumente utile la http://linkeddata.org/tools

a se parcurge și http://www.w3.org/wiki/LinkedData

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de datede revăzut “norul” linked data – http://lod-cloud.net/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

informațiile privitoare la fiecare set de date RDFpot fi explorate via CKAN

(Comprehensive Knowledge Archive Network)

http://ckan.org/

http://thedatahub.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

aspecte de interes privind vocabularele publice:gradul de utilizare

mentenanțaaplicabilitateaexpresivitatea

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

predicate generice folosite uzual:owl:sameAs

foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,foaf:depiction, foaf:primaryTopic,…

rdfs:seeAlso

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date – exemplificare:

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Relații între diverse resurse din seturi de date diferite:

<http://dbpedia.org/resource/Kolkata>

owl:sameAs freebase:Kolkata ;

owl:sameAs <http://sws.geonames.org/1275004> ;

owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ;

...

<http://sws.geonames.org/1275004>

rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>

wgs84_pos:lat "22.56263" ;

wgs84_pos:long "88.36304" ;

gn:parentCountry <http://sws.geonames.org/1269750> ;

...

după Ivan Herman (2013)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Descrierea & publicarea datelor interconectate

voiD (Vocabulary of Interlinked Datasets)

K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010

http://www.w3.org/2001/sw/interest/void/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: cerințe (Health & Bizer)

Calitatea datelor

Disponibilitatea și stabilitatea setului de date

Publicarea direct pe situl public

Claritate privind termenii de utilizare (licențiere)

Existența aplicațiilor

don’t repeat yourself

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

statistici vizând “norul” linked open data (9 ianuarie 2013)http://stats.lod2.eu/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

statistici vizând linked open data (12 noiembrie 2013)http://stats.lod2.eu/

639 vs. 2289 seturi de date1,7 miliarde vs. 62 miliarde de triple RDF

49,8% vs. 61,9% date având erori

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Aspecte privind cele mai bune practici:

identificarea resurselor – identifier patternsmodelare – modelling patterns

publicare a datelor – publishing patternsmanagement al datelor – data management patterns

dezvoltare de aplicații – application patterns

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Mai multe detalii:

Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern catalogue for modelling, publishing, and consuming

Linked Data, 2012:http://patterns.dataincubator.org/

a se studia și http://schoolofdata.org/handbook/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Verificarea corectitudinii sintaxei RDF

W3C RDF Validator – www.w3.org/RDF/Validator/

Eyeball (instrument bazat pe Apache Jena)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Verificarea infrastructurii(e.g., dereferențierea URL-urilor)

RDF:Alerts – http://swse.deri.org/RDFAlerts/

Sindice Inspector – http://inspector.sindice.com/

Vapour Linked Data Validator – idi.fundacionctic.org/vapour

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

manuală

eventual, preluând datele – în stilul REST –via cURL sau un instrument similar

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

recurgerea la un hyperdata (semantic) browser

e.g., instrumentul OpenLink Data Explorer ca extensiea unui navigator Web actual – http://ode.openlinksw.com/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Vizualizarea datelor interconectate

exemplificări:

platforma Callimachus – http://callimachusproject.org/

aplicația Web LodLive – http://en.lodlive.it/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

instrumentul LodLive

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Există aplicații Web realealiniate “curentului” linked data?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicația #1

linked dataserver #1

linked dataserver #2

HTTP

aplicația #2

Ivan

Her

man

(20

13

)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

SPARQL / RDF API

arhitectura tratificată a aplicațiilor bazate pe linked data(Tom Heath & Christian Bizer, 2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Revyu.comSemantic Web reviewing and rating site

(T. Health & E. Motta, 2008)

permite integrarea datelor evaluate de utilizatori

review-urile sunt stocate + publicate transparent în RDF(utilizatorii finali introduc datele în mod tradițional)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Revyu.com

recurge la vocabulare ca Review, FOAF (Friend Of AFriend), SKOS (Simple Knowledge Organizational System)

interogări pe baza unui punct terminal SPARQL

interconectare cu alte seturi de date:DBpedia, OpenGuides, RDF Book Mashup etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Proiectul Europeana

inițiativă de prezervare a conținutul cultural reprezentativ din statele europene

acces deschis la date interconectatevia data.europeana.eu

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

definește EDM (Europeana Data Model) bazat pe standardeRDF și OWL + vocabulare ca DCMI, FOAF, Open Archive

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

myExperiment (David De Roure et al.)

aplicație Web colaborativă – bazată pe Ruby on Rails –pentru managementul workflow-urilor științifice

și a altor obiecte vizând cercetarea

modelarea datelor se bazează pe RDF:http://rdf.myexperiment.org/

acces la date publice via SPARQL

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Inițiativele semantic (open) e-government

linked data în contextul informațiilor publice ale UK:http://data.gov.uk/linked-data

un proiect similar:USA – http://www.data.gov/developers/page/semantic-web

de studiat și prezentările lui Richard Wallis:www.slideshare.net/rjw

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

acces la date publice oficiale după gradul de deschidere (openness score)

http://data.gov.uk/data/search?openness_score=5

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

SIGMA (SemantIc Government Mashup Application)Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,

Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)

platformă Web extensibilă capabilă să creeze mashup-urioferind acces la date guvernamentale deschise

includerea unei soluții proprii de acces via un end-pointSPARQL la date guvernamentale preluate de la gov.ro

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Alte utilizări – conform Stefan Decker et al., 2012:

mass-mediaBBC, Guardian, New York Times

publicații academiceCrossRef, Nature

biblioteci (digitale)Library of Congress, SUDOC (Franța), Vatican,…

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Pentru diverse exemplificări, a se consulta și lucrările atelierelor de lucru LDOW (Linked Data on the Web)

http://events.linkeddata.org/ldow2013/

http://events.linkeddata.org/ldow2012/

http://events.linkeddata.org/ldow2011/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“concluzii”

“Software – as a service or not – is just a container.What makes software valuable has always been what

it does to data. Now, in the same spirit of SOA and SaaS,a new concept is emerging, Data-as-a-Service – DaaS.”

Pete Soderling, august 2010http://goo.gl/S4dYy

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

rezumat

aplicații bazate pe Web of dataarhitectură, linked data, studii de caz

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

episodul viitor: evaluarea proiectului (D)joi, 21 noiembrie, 10:00 – C308