Post on 04-Jun-2015
GetLOD: verso i Linked Open Data geografi ciBologna, 6 Luglio 2012 – Alfredo Abrescia e Stefano Pezzi
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Obiettivi
Rendere disponibili come Open Data (con particolare attenzione per il formato RDF/XML e quindi come Linked Open Data o LOD) dati e metadati gestiti da un’Infrastruttura di Dati Territoriali
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Cosa è
Soluzione OPEN e riusabile che: Si integra alle Infrastrutture di Dati Territoriali grazie agli
standard definiti dall’Open Geospatial Consortium (OGC) WFS e CS-W.
Consente di pubblicare i dati geografici aperti sia in formato RDF (Linked Open Data), sia in altri formati di interscambio non linkabili (Shapefile e GML).
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Architettura
dati.regione.it
GeoRepository
GI Middleware
MD 19115
RDF dump
TripleStore
www
OGC server
OGC WFS
GI Data & Metadata
LOD Back-end
MD server
OGC CSW
Download
Triple server
LOD Front-end
JAVA API
mapping fileF2R
catalogazione
Ricerca
API
connettori
CKAN API
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Wrapper F2R
F2R (Web Feature Service to RDF): consente di estrarre le triple RDF dai servizi OGC:WFS consente di accedere al dato in modalità remota e standard aggancia ai dati, i metadati mediante chiamate ai servizi
OGC:CSW
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Ontologie
Definire una ontologia che descriva il modello dei dati da pubblicare
Definire una ontologia che descriva il significato dei metadati ISO 19115
Individuare i possibili collegamenti con i dataset LOD già esistenti ed appartenenti alla LOD Cloud
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Stack tecnologico
Protegè (OWL) Jena, Sesame (OWL/RDF) Silk (Interlinking) OGC-Server (Data access, WFS-CSW) J2EE (JAX-WS) CKAN (Catalogo dati open) Allegrograph (Triple Store - SPARQL) Sparallax (LOD Browser)
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Caso applicativo
Edifici e terremoti
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD: Caso applicativo
• dal DBTR: estrazione WFS centro storico di Mirandola: 3181 edifici• da ISIDE (Ingv): estrazione CSV 69 scosse dal 19/05 al 28/06 nell’intorno di 20km
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
OntologiaModellata un’ontologia per gli edifici che riusa ontologie diffuse e standard.Per i terremoti utilizzata ontologia SWEET (NASA)
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
Conversione RDF e caricamento in AllegroGraph
I 3.181 edifici e le 69 scosse sono diventatiquasi 100.000 triplette …
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
Il grafo RDF all’interno del TripleStore
Una porzione del grafo attorno al nodo che rappresenta il “Duomo” di Mirandola
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
Il possibile interlink
Al momento il collegamento al catasto non è implementato con un interlink, perché le particelle non sono pubblicate dall’AdT, ma con un nodo anonimo.
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
La geometria WGS84 e GeoSPARQL
La geometria è quella del centroide, ed è replicata sia in W3C WGS84 che in OGC GeoSPARQL
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
La geometria completa come WFS
La geometria completa non è contenuta nel triple store, ma è raggiungibile attraverso un link che contiene la richiesta WFS relativa
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
Interrogazioni possibili
Tutte analisi che si possono fare bene (anzi meglio) all’interno di strumenti GIS desktop e web a disposizione di tutti!
Selezione edifici di tipologia specifica più vicini di X km dagli epicentri con magnitudine maggiore di M
Individuazione date sismi più vicini a edifici industriali… …
Le cose sarebbero ben diverse se esistessero come LOD anche: • dati comunali adempimento obblighi L.R. 19/2008 (schede L0, L1 …) che si
riferiscono agli URI degli edifici• anagrafe comunale degli immobili riferita ai medesimi URI• DB attività economiche (sempre riferite agli edifici)• anagrafe residenti• terremoti da INGV
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
Conclusioni
Pubblicare dati geografici in RDF è utile solo se si punta alle5 stelle ovvero se si creano interlink (o si da' la possibilità ad altri di crearli).
Estrema attenzione nella definizione delle ontologie: non devono essere loro stesse delle isole, ma devono essere collegate e riutilizzare altre ontologie.
Il compito più difficile non è pubblicare in RDF, ma intervenire sui processi di gestione del dato affinché questi possano essere pubblicati in RDF (identificativi persistenti, ciclo di vita chiaro, pubblicazione periodica garantita …)
Il ruolo della PA in questo deve essere centrale.
GETLO
D: VERSO
I LINKED
OPEN
DATA GEO
GRAFICI
GetLOD
Grazie per l’attenzione
Alfredo.Abrescia@planetek.itStefano.Pezzi@sinergis.it