Linked Open Dataとは

27
Linked Open Dataとは LODチャレンジ実行委員会

Transcript of Linked Open Dataとは

Page 1: Linked Open Dataとは

Linked Open Dataとは

LODチャレンジ実行委員会

Page 2: Linked Open Dataとは

Linked Open Data ?

Page 3: Linked Open Dataとは

Linked Webの仕組みで

相互にリンクされた

Open (一定のルールのもとで) 二次利用可能な

Data RDF形式のデータ

Page 4: Linked Open Dataとは

ボルト?

Page 5: Linked Open Dataとは

CC-BY 2.0 http://en.wikipedia.org/wiki/File:Usain_Bolt_2012_Olympics_1.jpg CC-BY-SA 3.0 http://commons.wikimedia.org/wiki/File:P_Mickey.png CC-BY-SA 3.0 http://en.wikipedia.org/wiki/File:DCA_06_2012_Chevy_Volt_4035.JPG CC-BY-SA 2.5 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Bolt-with-nut.jpg

ボルト

陸上選手 自動車

アニメ映画 部品

Page 6: Linked Open Dataとは

CC-BY-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Berlino_Leichtathletik-WM.jpg CC-By-SA 3.0 http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Olympicstadium2.jpg

100m 9秒58 (WR)

Page 7: Linked Open Dataとは

Web空間上でのデータ共有

100m 9秒58 (WR)

Page 8: Linked Open Dataとは

文書のWeb • 文書ファイル(HTML)+リンク

• 各文書の所在をURIで表す

• 人間が読むことを想定

• 文書群に対してキーワード検索し,必要な情報を取得する

HTML HTML

HTML

HTML

リンク

リンク

Page 9: Linked Open Dataとは

LODによるデータのWeb • データ(RDF)+リンク

• 各データの所在をURIで表す

• 計算機が読むことを想定

• データ群に対してSQLライクな条件式で検索し,必要な情報を得る

RDFデータ

RDFデータ

RDFデータ

Page 10: Linked Open Dataとは

LODの基本的な仕組み 1. 情報とリンクに名前をつける

2. 情報の所在とリンクをURIで表現 – 同じURIは同じモノを表現

3. 名前空間の接頭辞を利用

Japan Tokyo Capital

http://dbpedia.org/resource/Japan

http://dbpedia.org/resource/Tokyo

http://dbpedia.org/ontology/capital

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

Page 11: Linked Open Dataとは

LODの基本的な仕組み

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia:Tokyo dbpedia:Shintarō_Ishihara

dbpedia-owl:leaderName

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia:Shintarō_Ishihara

dbpedia-owl:leaderName

URIが同じノードで2つのグラフを結合

Page 12: Linked Open Dataとは

LODの基本的な仕組み 分野,ドメインを越えてデータどうしをリンクすることで,つながりが広がっていく

dbpedia:Japan dbpedia:Tokyo

dbpedia-owl:capital

dbpedia-owl:leaderName

dbpedia:Shintarō_Ishihara owl:sameAs

http://data.nytimes.com/59436095099277148161

DBpedia

NYTimes

Page 13: Linked Open Dataとは

LODクラウド

分野,ドメインを越えてデータどうしをリンクすることで,データセットどうしがつながったLODクラウドが形成されている

RDFデータ

RDFデータ

RDFデータ

DBpedia NYTimes

BBC

Page 14: Linked Open Dataとは

LODクラウド

2007/5/1 2007/11/7 2008/3/31

http://richard.cyganiak.de/2007/10/lod/

LODとして利用可能なデータセット間のリンク関係を図示

2009/3/27 2010/9/22

Page 15: Linked Open Dataとは

LODクラウド

政府・自治体

地理情報 ライフサイエンス

図書館・出版

ユーザ生成コンテンツ

メディア

http://richard.cyganiak.de/2007/10/lod/

クロスドメイン

2011/9/22

Page 16: Linked Open Dataとは

Linking Open Data

Page 17: Linked Open Dataとは

Linking Open Data運動

• 多くの人々がオープンにしたデータ(Open Data)を,皆でつなげて(Linkして),大きな価値を生み出していく

• Webを発明したTim Berners-Lee氏が提唱し,世界で広まっている

• データの「囲い込み」から「共有」へ

Page 18: Linked Open Dataとは

Tim Berners-Lee

http://www.zdnet.com/uk/web-inventor-tim-berners-lee-stars-in-olympics-opening-ceremony-7000001744/

Page 19: Linked Open Dataとは

改めて,LODとは

• Web技術を利用して,オープンなデータ(Open Data)を公開し,つなげる(Linkする)仕組み

• Web空間を巨大なデータベースとして,問い合わせや利用が可能

データ

データ

データ

公開 問い合わせ

利用 Web空間

Page 20: Linked Open Dataとは

データベース データベース データベース データベース

出版社 書店 図書館 クチコミ

・各Webサイトが持っている

データベースどうしはつながっていない ・同じ書籍に関するデータであるかどうかを計算機に判定させるには,ひと手間必要

HTML HTML HTML HTML

文書のWeb

Page 21: Linked Open Dataとは

データベース データベース データベース データベース

出版社 書店 図書館 クチコミ

萩野達也 斎藤 信男

2,940円

オーム社 author author

publisher

price

セマンティックWeb入門

・データ自体をWeb上に公開し,共有する. ・個々のデータの所在を表すURIで一意に識別できる

RDF RDF RDF

RDF

データのWeb Web空間

Page 22: Linked Open Dataとは

LODの利用と公開

RDFストア 既存データ (RDB,CSVなど)

LOD公開ツール

SPARQL エンドボイント RDFダンプ

LODクラウド (Web空間)

LOD公開 LOD利用 アプリケーション

検索エンジン

RDFストア

ユーザインタフェース などへの出力 RDF

ファイル

C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011

Page 23: Linked Open Dataとは

LODとしてのデータ公開

• LODをWeb上で公開する – 既存データ・新規データをRDF形式で作成する – SPARQLエンドポイントまたはRDFダンプを公開する

• LODを閲覧・検索する – ノードのURIに関してHTTPで問い合わせする – SPARQLエンドポイントを利用してデータを検索する

• 他のLODへRDFでリンクする – LODクラウドとつながって,たどることが可能に – sameAsにより同一のモノを指すURIを結びつける

• 公開情報をリポジトリサイトに登録する – CKANに登録すると,LODクラウドにデータ公開者ノードが作成される

Page 24: Linked Open Dataとは

LODの到達度

★ 形式に関係なく,オープンライセンスで公開する 例:表データの画像

★★ コンピュータで処理可能な構造化データで公開する 例:Excelデータ

★★★ オープンなデータ形式で公開する 例:CSVデータ

★★★★ URIを利用してモノに名前を付ける 例:RDFデータ

★★★★★ 他のデータへリンクする

http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

“Raw data now!” by Tim Berners-Lee

Page 25: Linked Open Dataとは

まとめ:LODの特徴

• だれでもWeb上でデータを公開できる

• 語彙を自由に選んでデータを表現できる

• だれでもデータに情報を付加できる

• データの選択や加工の自由度が高い

• お互いにデータを公開し,共有することで,これらの利便性が高まる

Page 26: Linked Open Dataとは

参考文献

• TED2009 Tim Berners-Lee on the next Web http://www.ted.com/talks/lang/jpn/tim_berners_lee_on_the_next_web.html

• TED2010 Tim Berners-Lee:The year open data went worldwide http://www.ted.com/talks/lang/jpn/tim_berners_lee_the_year_open_data_went_worldwide.html

Page 27: Linked Open Dataとは

参考文献 • Linked Data: Evolving the Web into a Global Data Space,

Chrisitian Bizer and Tom Heath, 2011 http://linkeddatabook.com/editions/1.0/

• リンクするデータ(Linked Data)~広がり始めたデータのクラウド~,長野,萩野(編),情報処理学会誌,vol.52,no.3,2011年. http://www.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=52&no=3

• Linked Dataとオントロジー,長野,山口(編),人工知能学会誌,vol.27,no.2,2012年. http://ci.nii.ac.jp/vol_issue/nels/AN10067140/ISS0000478803_ja.html

• セマンティックHTML/XHTML,神崎正英,毎日コミュニケーションズ,2009年.