Использование данных семантического веба поисковыми...

22
Использование данных семантического веба поисковыми системами Владимир Горовой ВШМ СПбГУ [email protected] http://twitter.com/vgorovoy

description

Владимир ГоровойВШМ СПбГУ

Transcript of Использование данных семантического веба поисковыми...

Page 1: Использование данных семантического веба поисковыми системами

Использование данных семантического веба поисковыми

системами

Владимир ГоровойВШМ СПбГУ

[email protected]://twitter.com/vgorovoy

Page 2: Использование данных семантического веба поисковыми системами

Содержание

• Семантическая разметка• Использование FOAF• Использование Freebase

Page 3: Использование данных семантического веба поисковыми системами

Поисковые системы стимулируют вебмастеров для получения

семантических данных

Основной тренд

Page 4: Использование данных семантического веба поисковыми системами

Сниппеты

Page 5: Использование данных семантического веба поисковыми системами

RDF

subjectsubject objectobject

predicate

Cambridge SemanticsCambridge Semantics

headquartered

MassachusettsMassachusetts

Тройки (Triples):

“Cambridge Semantics is headquartered in Massachusetts”:

Page 6: Использование данных семантического веба поисковыми системами

Микроформаты и RDFa

Аннотирование HTML метаданными

Отличие: Жестко заданные виды метаданных в микроформатах (hCard, hReview …) и использование словарей (Dublin Core, словарь Гугла и т.д.) в RDFa

Page 7: Использование данных семантического веба поисковыми системами

RDFa

Page 8: Использование данных семантического веба поисковыми системами

Микроформаты

Page 9: Использование данных семантического веба поисковыми системами

Подход Google (Rich Snippets)

• Google сам формирует сниппеты• Поддержка hReview, hCard, hProduct,

hReview_Aggregate (не утвержден даже на microformats.org)

• Свой словарь для RDFa (http://rdf.data-vocabulary.org/rdf.xml)

• Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com)

• Не влияет на ранжирование

Page 10: Использование данных семантического веба поисковыми системами

Подход Yahoo (Search Monkey)

• Формирование сниппетов силами пользователей

• Большой словарь для RDFa , использующий существующие словари (http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs)

• Не влияет на ранжирование

Page 11: Использование данных семантического веба поисковыми системами

Подход Яндекса

• Сами формируем сниппеты• Поддержка микроформатов (hCard,

hRecipe) и XML-фидов в специальных форматах

• Не влияет на ранжирование

Page 12: Использование данных семантического веба поисковыми системами

Адреса организаций

hCard, выгрузка в специальном формате и заполнение в Я.Вебмастере

Page 13: Использование данных семантического веба поисковыми системами

Рецепты

hRecipe и в виде XML-фида

Page 14: Использование данных семантического веба поисковыми системами

Рефераты

В виде XML-фида

Page 15: Использование данных семантического веба поисковыми системами

Словари

Внимание: microdata (html5)

Page 16: Использование данных семантического веба поисковыми системами

Словари

Page 17: Использование данных семантического веба поисковыми системами

Поддержка в CMS

• Drupal (много в модулях, обещают в ядре Drupal 7)

• Wordpress (XFN; в модулях: hAtom, hCard)• Movable Type (XFN, hAtom; в модулях:

hCard, rel-tag)

Page 18: Использование данных семантического веба поисковыми системами

Где RDFa и микроформаты уже есть?

STW Thesaurus for Economics

Page 19: Использование данных семантического веба поисковыми системами

FOAF

FOAF (Friend of a Friend) – онтология для описания людей, групп и отношений между ними

Yandex FOAF Extension – расширение FOAF, определяющее классы для постов, комментариев, читателей и т.п. (http://api.yandex.ru/blogs/doc/indexation/appendices/yandex-foaf-ext-rdf.xml)

Page 20: Использование данных семантического веба поисковыми системами

Использование FOAF

API поиска по блогам: http://blogs.yandex.ru/search_profiles_atom.xml?text=лебедев

Page 21: Использование данных семантического веба поисковыми системами

Использование Freebase

Page 22: Использование данных семантического веба поисковыми системами

Спасибо!

?Владимир Горовой

ВШМ СПбГУ[email protected]

http://twitter.com/vgorovoy