ISWC2016 1-slide-survey
-
Upload
akihiro-kameda -
Category
Science
-
view
103 -
download
2
Transcript of ISWC2016 1-slide-survey
SIG-SWO 41st : ISWC2016 Survey SessionKAMEDA Akihiro (Kyoto University)
Multilinguality 10/19(水 )
YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames
Thomas Rebele, Fabian M. Suchanek, Johannes Hoffart, Joanna Biega, Erdal Kuzey and Gerhard Weikum
Translating Ontologies in a Real-World Setting with ESSOT
Mihael Arcan, Mauro Dragoni and Paul Buitelaar
Zhishi.lemon:On Publishing Zhishi.me as Linguistic Linked Open Data
Haofen Wang, Zhijia Fang, Jorge Gracia, Julia Bosque-Gil and Tong Ruan
Domain Adaptation for Ontology Localization
John P. McCrae, Mihael Arcan, Kartik Asooja, Jorge Gracia, Paul Buitelaar and Philipp Cimiano
Natural Language Processing 10/21(金 )
Linked Disambiguated Distributional Semantic Networks
Stefano Faralli, Alexander Panchenko, Chris Biemann and Simone Paolo Ponzetto
Abstract Meaning Representations as Linked Data
Gully Burns, Ulf Hermjakob and José Luis Ambite
A Replication Study of the Top Performing Systems in SemEval Twitter Sentiment Analysis
Efstratios Sygkounas, Giuseppe Rizzo and Raphaël Troncy
Building event-centric knowledge graphs from news
Marco Rospocher, Marieke van Erp, Piek Vossen, Antske Fokkens, Itziar Aldabe, German Rigau, Aitor Soroa, Thomas Ploeger, Tessel Bogaard
Natural Language Processing
Session
左上にトラックタイプ {Research, Resources, Applications, Journal}
Linked Disambiguated Distributional Semantic Networks
WordNet とかBabelNet とか
説明側ベクトルもdisambiguate
Resources
Abstract Meaning Representations as Linked DataSerpinE2 is overexpressed in intestinal epithelial cells transformed by activated MEK1 and oncogenic RAS and BRAF これを Linked Data 化
- RDF 化し URL とスキーマを与えるhttps://github.com/BMKEG/amr-ld/
- 外のリソースにマッピングhttp://fril.sourceforge.net/+tf-idf ベースのシンプルな方法で補った
Resources
A Replication Study of the Top Performing Systems in SemEval Twitter Sentiment Analysis• SemEval Twitter Sentiment Analysis
• Twitter 上のツイートの感情判別(ポジ・ネガ・中立)を行うタスク• 2013-2015 で好成績を収めた 5 つのアルゴリズムの再現性確認( Replication Study ) • ついでに、その 4 つ+ Stanford Sentiment System でアンサンブル学習• 学び:パラメータとかは論文に書かれてなくて GitHub のコードで助けられた。データとかライブラリとか特徴量設計の部分で差異が出てしまった(まあ大体あってたけど)• Feature engineering is an art and the devil is in the details.
Resources
Building Event-Centric Knowledge Graphs from News• ニュースからイベント・セントリックな知識グラフを抽出する
• 既存の知識グラフは百科事典的で静的なものが多いからそれを補完• English and Spanish, Italian and Dutch.
• まず文書ごとに抽出してから(Step1) 繋げる (Step2)
Journal
MultilingualitySession
YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames• YAGO は Wikipedia に基づいて 10 の言語を横断して作られていて、空間・時間の情報も付けられている。このプロセスおよび品質保証の詳細
• 時間情報 : Infobox に正規表現• 空間情報 : GeoNames が Wikipedia へのリンクを持っている。説明を手掛かりに高 F 値で WordNet にもマッピング• 「 15 人が 76 の関係に関する 4412 の事実を検証。 98% が正しかった。 2 カ月かかった」
Resources
Translating Ontologies in a Real-World Setting with ESSOT• オントロジーを翻訳するときに、人手で修正・承認をするためのサポートシステム作りました。
• 統計ベースの機械翻訳システムも自分でトレーニングしましたMicrosoft の翻訳 API よりはつよかった(使ったデータの違い以外に NLP 的新規性はなさそうだけど、 BLEU とかで比較して勝っている)
Applications
Zhishi.lemon : On Publishing Zhishi.me as Linguistic Linked Open Data• Lemon (The Lexicon Model for Ontologies)
• Lexical schema 最大手WordNet も BabelNet もこれ
• Zhishi.me• Baidu Baike, Hudong Baike
and Chinese Wikipedia.• DBpedia と BabelNet を介在させ西と英に対応付け
• DBpedia は C-Wikipedia 。 BabelNet はカテゴリの重複度を手掛かりに曖昧性解消
百度百科 互动百科
Resources
Domain Adaptation for Ontology Localization
tokenization
Phrase table Explicit Semantic Analysis ( 分散表現の一種 , not Latent) のCross-Language 版。コサイン距離で意味の近さを測る
N-gram モデルの各 gram をドメインオントロジの freq と対象言語文書の freq のコサイン距離cos(tf_o, tf_d) で重みづけ
Journal
3つの Domain Adaptation 工夫