Post on 18-Jul-2015
Dove sono I dati?I dati possono trovarsi sul web in tanti formati ● Tabellari
○ xls xlsx csv tsv ods dbf● Strutturati
○ xml json (shp)● Linked data
○ RDF● Altro…
○ HTML, PDF
70%
20%
10%
50%
Scraping
● Excel● Chrome
○ table extractor○ Scraper
● Firefox – outwit
● I PDF… ○ Zamzar○ Tabula
● Scraperwiki
Scraping
● Excel● Chrome
○ table Capture○ Scraper
● Firefox – outwit
● I PDF… ○ Zamzar○ Tabula
● Scraperwiki
Partiamo dai PDF
Partiamo da qualcosa di facile: http://goo.gl/Wrc9ud
More difficult:http://augusto.digitpa.gov.it/
E ora HTML...
Sarà più facile…..http://it.wikipedia.org/wiki/Presidenti_della_Repubblica_Italiana
o no? http://journalismgrants.org/portfolio_tags/round-1
Ma c’è solo Google Maps...
… oppure no:OpenStreetMap => http://www.openstreetmap.org/
umap =>http://umap.openstreetmap.fr/it/