ISWC2016 1-slide-survey

11
SIG-SWO 41 st : ISWC2016 Survey Session KAMEDA Akihiro (Kyoto University) Multilinguality 10/19( 水 ) YAGO: a multilingual knowledge base from Wikipedia, Wordnet , and Geonames Thomas Rebele, Fabian M. Suchanek, Johannes Hoffart, Joanna Biega, Erdal Kuzey and Gerhard Weikum Translating Ontologies in a Real-World Setting with ESSOT Mihael Arcan, Mauro Dragoni and Paul Buitelaar Zhishi.lemon On Publishing Zhishi.me as Linguistic Linked Open Data Haofen Wang, Zhijia Fang, Jorge Gracia, Julia Bosque-Gil and Tong Ruan Domain Adaptation for Ontology Localization John P. McCrae, Mihael Arcan, Kartik Asooja, Jorge Gracia, Paul Buitelaar and Philipp Cimiano Natural Language Processing 10/21( 水 ) Linked Disambiguated Distributional Semantic Networks Stefano Faralli, Alexander Panchenko, Chris Biemann and Simone Paolo Ponzetto Abstract Meaning Representations as Linked Data Gully Burns, Ulf Hermjakob and José Luis Ambite A Replication Study of the Top Performing Systems in SemEval Twitter Sentiment Analysis Efstratios Sygkounas, Giuseppe Rizzo and Raphaël Troncy Building event-centric knowledge graphs from news Marco Rospocher, Marieke van Erp, Piek Vossen, Antske Fokkens, Itziar Aldabe, German Rigau, Aitor Soroa, Thomas Ploeger, Tessel Bogaard

Transcript of ISWC2016 1-slide-survey

Page 1: ISWC2016 1-slide-survey

SIG-SWO 41st : ISWC2016 Survey SessionKAMEDA Akihiro (Kyoto University)

Multilinguality 10/19(水 )

YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames

Thomas Rebele, Fabian M. Suchanek, Johannes Hoffart, Joanna Biega, Erdal Kuzey and Gerhard Weikum

Translating Ontologies in a Real-World Setting with ESSOT

Mihael Arcan, Mauro Dragoni and Paul Buitelaar

Zhishi.lemon:On Publishing Zhishi.me as Linguistic Linked Open Data

Haofen Wang, Zhijia Fang, Jorge Gracia, Julia Bosque-Gil and Tong Ruan

Domain Adaptation for Ontology Localization

John P. McCrae, Mihael Arcan, Kartik Asooja, Jorge Gracia, Paul Buitelaar and Philipp Cimiano

Natural Language Processing 10/21(金 )

Linked Disambiguated Distributional Semantic Networks

Stefano Faralli, Alexander Panchenko, Chris Biemann and Simone Paolo Ponzetto

Abstract Meaning Representations as Linked Data

Gully Burns, Ulf Hermjakob and José Luis Ambite

A Replication Study of the Top Performing Systems in SemEval Twitter Sentiment Analysis

Efstratios Sygkounas, Giuseppe Rizzo and Raphaël Troncy

Building event-centric knowledge graphs from news

Marco Rospocher, Marieke van Erp, Piek Vossen, Antske Fokkens, Itziar Aldabe, German Rigau, Aitor Soroa, Thomas Ploeger, Tessel Bogaard

Page 2: ISWC2016 1-slide-survey

Natural Language Processing

Session

左上にトラックタイプ {Research, Resources, Applications, Journal}

Page 3: ISWC2016 1-slide-survey

Linked Disambiguated Distributional Semantic Networks

WordNet とかBabelNet とか

説明側ベクトルもdisambiguate

Resources

Page 4: ISWC2016 1-slide-survey

Abstract Meaning Representations as Linked DataSerpinE2 is overexpressed in intestinal epithelial cells transformed by activated MEK1 and oncogenic RAS and BRAF これを Linked Data 化

- RDF 化し URL とスキーマを与えるhttps://github.com/BMKEG/amr-ld/

- 外のリソースにマッピングhttp://fril.sourceforge.net/+tf-idf ベースのシンプルな方法で補った

Resources

Page 5: ISWC2016 1-slide-survey

A Replication Study of the Top Performing Systems in SemEval Twitter Sentiment Analysis• SemEval Twitter Sentiment Analysis

• Twitter 上のツイートの感情判別(ポジ・ネガ・中立)を行うタスク• 2013-2015 で好成績を収めた 5 つのアルゴリズムの再現性確認( Replication Study ) • ついでに、その 4 つ+ Stanford Sentiment System でアンサンブル学習• 学び:パラメータとかは論文に書かれてなくて GitHub のコードで助けられた。データとかライブラリとか特徴量設計の部分で差異が出てしまった(まあ大体あってたけど)• Feature engineering is an art and the devil is in the details.

Resources

Page 6: ISWC2016 1-slide-survey

Building Event-Centric Knowledge Graphs from News• ニュースからイベント・セントリックな知識グラフを抽出する

• 既存の知識グラフは百科事典的で静的なものが多いからそれを補完• English and Spanish, Italian and Dutch.

• まず文書ごとに抽出してから(Step1) 繋げる (Step2)

Journal

Page 7: ISWC2016 1-slide-survey

MultilingualitySession

Page 8: ISWC2016 1-slide-survey

YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames• YAGO は Wikipedia に基づいて 10 の言語を横断して作られていて、空間・時間の情報も付けられている。このプロセスおよび品質保証の詳細

• 時間情報 : Infobox に正規表現• 空間情報 : GeoNames が Wikipedia へのリンクを持っている。説明を手掛かりに高 F 値で WordNet にもマッピング• 「 15 人が 76 の関係に関する 4412 の事実を検証。 98% が正しかった。 2 カ月かかった」

Resources

Page 9: ISWC2016 1-slide-survey

Translating Ontologies in a Real-World Setting with ESSOT• オントロジーを翻訳するときに、人手で修正・承認をするためのサポートシステム作りました。

• 統計ベースの機械翻訳システムも自分でトレーニングしましたMicrosoft の翻訳 API よりはつよかった(使ったデータの違い以外に NLP 的新規性はなさそうだけど、 BLEU とかで比較して勝っている)

Applications

Page 10: ISWC2016 1-slide-survey

Zhishi.lemon : On Publishing Zhishi.me as Linguistic Linked Open Data• Lemon (The Lexicon Model for Ontologies)

• Lexical schema 最大手WordNet も BabelNet もこれ

• Zhishi.me• Baidu Baike, Hudong Baike

and Chinese Wikipedia.• DBpedia と BabelNet を介在させ西と英に対応付け

• DBpedia は C-Wikipedia 。 BabelNet はカテゴリの重複度を手掛かりに曖昧性解消

百度百科 互动百科

Resources

Page 11: ISWC2016 1-slide-survey

Domain Adaptation for Ontology Localization

tokenization

Phrase table Explicit Semantic Analysis ( 分散表現の一種 , not Latent) のCross-Language 版。コサイン距離で意味の近さを測る

N-gram モデルの各 gram をドメインオントロジの freq と対象言語文書の freq のコサイン距離cos(tf_o, tf_d) で重みづけ

Journal

3つの Domain Adaptation 工夫