Использование данных семантического веба поисковыми...

Post on 21-Dec-2014

816 views 2 download

Tags:

description

Владимир ГоровойВШМ СПбГУ

Transcript of Использование данных семантического веба поисковыми...

Использование данных семантического веба поисковыми

системами

Владимир ГоровойВШМ СПбГУ

gorovoy@gsom.pu.ruhttp://twitter.com/vgorovoy

Содержание

• Семантическая разметка• Использование FOAF• Использование Freebase

Поисковые системы стимулируют вебмастеров для получения

семантических данных

Основной тренд

Сниппеты

RDF

subjectsubject objectobject

predicate

Cambridge SemanticsCambridge Semantics

headquartered

MassachusettsMassachusetts

Тройки (Triples):

“Cambridge Semantics is headquartered in Massachusetts”:

Микроформаты и RDFa

Аннотирование HTML метаданными

Отличие: Жестко заданные виды метаданных в микроформатах (hCard, hReview …) и использование словарей (Dublin Core, словарь Гугла и т.д.) в RDFa

RDFa

Микроформаты

Подход Google (Rich Snippets)

• Google сам формирует сниппеты• Поддержка hReview, hCard, hProduct,

hReview_Aggregate (не утвержден даже на microformats.org)

• Свой словарь для RDFa (http://rdf.data-vocabulary.org/rdf.xml)

• Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com)

• Не влияет на ранжирование

Подход Yahoo (Search Monkey)

• Формирование сниппетов силами пользователей

• Большой словарь для RDFa , использующий существующие словари (http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs)

• Не влияет на ранжирование

Подход Яндекса

• Сами формируем сниппеты• Поддержка микроформатов (hCard,

hRecipe) и XML-фидов в специальных форматах

• Не влияет на ранжирование

Адреса организаций

hCard, выгрузка в специальном формате и заполнение в Я.Вебмастере

Рецепты

hRecipe и в виде XML-фида

Рефераты

В виде XML-фида

Словари

Внимание: microdata (html5)

Словари

Поддержка в CMS

• Drupal (много в модулях, обещают в ядре Drupal 7)

• Wordpress (XFN; в модулях: hAtom, hCard)• Movable Type (XFN, hAtom; в модулях:

hCard, rel-tag)

Где RDFa и микроформаты уже есть?

STW Thesaurus for Economics

FOAF

FOAF (Friend of a Friend) – онтология для описания людей, групп и отношений между ними

Yandex FOAF Extension – расширение FOAF, определяющее классы для постов, комментариев, читателей и т.п. (http://api.yandex.ru/blogs/doc/indexation/appendices/yandex-foaf-ext-rdf.xml)

Использование FOAF

API поиска по блогам: http://blogs.yandex.ru/search_profiles_atom.xml?text=лебедев

Использование Freebase

Спасибо!

?Владимир Горовой

ВШМ СПбГУgorovoy@gsom.pu.ru

http://twitter.com/vgorovoy