Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo...

© Tefko Saracevic 1 Principles of Searching La búsqueda en la La búsqueda en la web & la web web & la web invisible invisible Buscando lo difícil de buscar

Transcript of Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo...

Page 1: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 1Principles of Searching

La búsqueda en la La búsqueda en la web & la web invisibleweb & la web invisible

Buscando lo difícil de buscar

Page 2: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 2Principles of Searching

Definiciones de diccionario

World wide web :Archivos conectados a través de Internet

Enorme conjunto de documentos y otros archivos enlazados localizados en ordenadores conectados a través de Internet y utilizados para acceder, manipular, y descargar datos y programas

Invisible - Definición de diccionario:

Que no puede ser visto

Web Invisible– No está en el diccionario

Page 3: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 3Principles of Searching

Page 4: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 4Principles of Searching

Qué es “web invisible?” Materiales que no incluyen, o no quieren incluir, los

buscadores generales en su colección de páginas web (índices) Inencontrables a través de los buscadores generales

Contiene una enorme cantidad de recursos de información En buena medida de mayor calidad y autoridad que la de la web

visible La calidad es su principal característica

Especializada Parte de ella fluye, o está en streaming o en tiempo real

“No puedes bañarte dos veces en el mismo río” Parte de ella gratuita

Mucho más extensa que la Web visible

Page 5: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 5Principles of Searching

en otras palabras…Hay mucho más en la web que


Page 6: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 6Principles of Searching

¿Porqué los buscadores no cubren todo?

Tamaño: La web es enorme, no pueden abarcarlo todo Factores Económicos: Los costes asociados son altos

Los buscadores viven de la publicidad Cierto número de buscadores ofrecen resultados de pago

FactoresTécnicos: Capacidad limitada Algunos formatos de archivo son difíciles de tratar

Spam: Eliminan lo malo pero se puede perder lo bueno Restricciones: Algunos sitios no permiten acceso a los

buscadores Estructura profunda : Algunos sitios son complejos

Page 7: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 7Principles of Searching

Cómo trabajan los buscadores?

Crawlers, spiders: buscan contenido Localizan sitios nuevos o modificados De maneras periódica, no en cada búsqueda

Ningún buscador trabaja en tiempo real (salvo Gnews) Organización de contenido: etiquetado, ordenación

Indización para búsquedas o clasificación en directorios

Bases de Datos, cachés: almacenamiento de contenidos Motor de búsqueda: en función de las demandas Interface: petición de búsqueda, visualización de resultados

Todo ello basado en algoritmos varios, habitualmente ocultos o secretos

Page 8: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 8Principles of Searching

Cobertura de los buscadores

No cubren más allá de un 20% Difícil (imposible) discernir & comparar cobertura

Buscadores nacionales Cobertura y orientación propia

Muchos buscadores especializados Cobertura propia hacia un tema de interés

Fuentes independientes de material útil Recopilaciones de recursos evaluados

Page 9: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 9Principles of Searching

Los buscadores difieren

Hay diferencias muy importantes entre los tipos de buscadores citados Necesidad de saber cómo funcionan y en qué

difieren Información sobre buscadores:

Search Engine Watch noticias estadísticas, explicaciones, tutoriales…

Search Engine Showdown La guía de uso de la búsqueda web. Cuenta con

biblioteca, nuevos enlaces, estadísticas, etc…

Page 10: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 10Principles of Searching

Búsqueda en la web Invisible : Datos básicos

Primer paso: Saber claramente qué estás buscando. Limitar la búsqueda a recursos y herramientas

apropiadas al tipo de información que estás buscando Conocer las fuentes Saber encontrar fuentes

Page 11: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 11Principles of Searching

Fuentes especializadas -en la web invisible

1. Meta buscadores

2. Buscadores y catálogos especializados

3. Buscadores y catálogos temáticos

4. Fuentes de referencia

5. Bibliotecas

6. Bibliotecas virtuales

7. Bases de datos especialiuzadas

8. Sociedades, organizaciones

9. Libros!!!

Page 12: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 12Principles of Searching

Metabuscadores Metabuscadores buscan en otros B.

Combiando resultados Dónde encontrar buscadores o


Búsqueda en motores por asunto, localización geográfica o referencia

Search Engine Guide Búsqueda categorizada por materias

Search Engine Colossus Directorio internacional de motores de búsqueda por países

y materia entre 198 países y 61 territorios. Motores por idioma

Page 13: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 13Principles of Searching

Ejemplos de motores Algunos motores ofrecen resultados

organizados:Dogpile Devuelve resultados de motores de búsqueda determinados; ofrece

la fuente, lo que facilita la comparación Surfwax Proporciona estadísticas y fuente; en algunos casos ofrece

términos afines para delimitar la búsqueda

TeomaOfrece resultados con sugerencias para afinar la búsqueda. Está

gestionado por

Turbo10Facilita los resultados en clústers y se pueden seleccionar los diez

motores con los que trabajar entre 1000 aprox.

Page 14: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 14Principles of Searching

metabuscadores (cont.)

Gran directorio Complete Planet

directorio con más de 70,000 bsd y motores especializados

Resultados con devolución gráfica Vivisimo

Resultados en clústers Webbrain

Resultados en estructura arbórea. Original

KartooMeta motor de búsqueda visual. Ofrece los resultados de una

forma muy gráfica

Page 15: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 15Principles of Searching

Motores y catálogos

Cobertura general y específica Open Directory Project

Catálogo de la web global, llevado a cabo por voluntarios BUBL LINK

Recursos seleccionados de internet de cobertura académica (materias) organizado por la clasificación decimal de Dewey

Resource Discovery Network – UKPlataforma de búsqueda británica para contenidos


Page 16: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 16Principles of Searching

Materias y dominios específicos… Think Quest – Oracle Education Foundation

Recursos educativos, programas, sitios web creados por estudiantes

All Music Guide Recurso sobre música, álbums y canciones

Internet Movie Database Cine

Genealogy links and surname search enginesMuy especializado sobre genealogía y apellidos

Page 17: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 17Principles of Searching

Ciencias, académico Psychcrawler - Amer Psychological Association

Psicología Entrez PubMed – Nat Library of Medicine

Literatura y publicaciones periódicas médicas CiteSeer - NEC Research Center

Literatura científica, índices de citas; fuerte en tecnología informática

Scholar GoogleBúsquedas de artículos y recursos académicos

InfomineColecciones de investigaciones académicas en internet

Page 18: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 18Principles of Searching

Servicios de referencia

Servicios de referencia - modelos Preguntas frecuentes, directorios, listas de preguntas

Ask Jeeves! Muy popular, comercial

Information Please Preguntas de tipo almanaque

RefDeskInformación factual

WikipediaEnciclopedia web

Page 19: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 19Principles of Searching

referencia …

• Referencia digital – nuevos servicios en bibliotecas QuestionPoint L of Congress & OLC

Proyecto de servicio de referencia global Virtual Reference Desk – L of Congress

Amplia compilación de sitios web LiveRef – mantenida por Iowa State U

Registro en tiempo real de servicios de referencia digitales

Page 20: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 20Principles of Searching

Bibliotecas virtuales

Bibliotecas académicas y nacionales que tienen recursos web Rutgers libraries – proyecto a largo plazo University of California, Berkeley

Uno de los más complicados esfuerzos con Sun Corporation

LibWeb U California, Berkeley

“más de 7700 páginas de bibliotecas en 146 países”

Bibliothèque Nationale de France Incluye, entre otras cosas, exposiciones virtuales

Page 21: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 21Principles of Searching

Bibliotecas virtuales Bibliotecas sólo web

Virtual Library – Suiza, USA, UK y otros países – “la más antigua biblioteca


Internet Public Library U of Michigan Uno de los grandes esfuerzos

Librarians Index of the Internet Muy popular y accesible

Digital librarian

“la selección de lo mejor en la web de un bibliotecario “ – recogida y anotada por un bibliotecario

Page 22: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 22Principles of Searching

virtual libraries …

Academic Info Digital Library many links to digital collections & resources in various subjects

Gabriel Gateway to European National Libraries

Museum of online museums a delight

Stanford Encyclopedia of Philosophy

a comprehensive encyclopedia and libraryThe historical New York Times Project

universal library – ongoing digitization

Page 23: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 23Principles of Searching

Subjects resources Many subject specific sites

rich & often unique coverage & services different approaches & requirements

Examples in health related domains: WebMDHealth

news, medical information Rxlist

The Internet Drug Index Mayo Clinic HealthOasis

health advice

Kidshealthsites for parents, kids, teens

Page 24: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 24Principles of Searching

Subject resources …

Scholarship, humanities, government KIRKE - Katalog der Internetressourcen für die

Klassische Philologie aus Erlangen German; a variety of resources for classics

Perseus Digital Library Tufts University covers antiquity to renaissance; one of the best subject

sites on the web; affected the whole field Sch of Slavonic & East European Studies, University

College London includes country resources, e.g. Croatia U Mich Document Center official documents from all over the world

Page 25: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 25Principles of Searching

Subject resources … Growing number of resources in arts, museums

“We have 1000's of museums, zoos, historical societies and related organizations in our database”

The State Hermitage Museum

One of the greatest museums in the world, and one of the best museum site – developed with IBM help

National Museum of Science and Technology Leonardo da VinciGuess where those pictures came from. A delight!

Page 26: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 26Principles of Searching

subject resources …

DiotimaMaterials for study of women and gender in the Ancient World

Moving Images Collections“MIC documents moving image collections around the world.”

Part particularly oriented toward science educators. Now at Library of Congress, but developed at Rutgers.

And, of course …


The Official Peanuts Website

Page 27: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 27Principles of Searching

Societies, organizations Many societies, agencies developed their sites

great many rich sources for searching & resources differences in requirements, depth, richness Assoc. for Computing Machinery

Digital Library; subscription or registration or through RUL US State Department

about the U.S & other countries

FirstGovthe US government official web portal

Ocean Planet NASApresentation of earth & its vast oceans

ArXiv Cornell U, National Science Foundatione-print service in the fields of physics, mathematics, non-linear

science, computer science, and quantitative biology

Page 28: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 28Principles of Searching

Archiving, books on the web Internet Archive – a large undertaking

includes web archive & lots more publicly available & free 10 billion web pages archived from 1996 to a few months ago Wayback Machine – search to look at old versions of web

pages Books on the web

Million Book Project digitizing books and providing free access

International Children’s Digital Libraryonline children books

Digital books Index“links to more than 105,000 title records from more than 1800

commercial and non-commercial publishers, universities, and various private sites”

Page 29: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 29Principles of Searching

Language barriers on the Web

English still the major language but declining, now slightly over 50%

Multilingual retrieval search engines Euroseek

searches in a number of languages All the Web

results in 45 languages

Page 30: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 30Principles of Searching

Web news; keeping up

What is going on on the Web? Some major sources of news and evaluations: Free Pint

newsletter, articles, links; nice & sometimes quirky Internet Resources Newsletter

UK based; monthly newsletter for “academics, students, engineers, scientists and social scientists”

ResearchBuzz daily updates; many aspects; “Collection of items on search

engines, online databases, and other information resources” Web Search

tools, Web Search Forum

Page 31: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 31Principles of Searching

keeping up …

Information Todaytrade & professional monthly newspaper & web site; industry

news; searcher columns; general analyses of trends

Keeping up through blogosphere: Resource Shelf

bloger about internet (and some other stuff) with archive; it has really good and really bad exchanges & threads

New York Times blogrunner - The annotated NYT blog tracking of NYT articles, topics, authors; thread into

discussion of many other weblogs; includes net & web topics

Page 32: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 32Principles of Searching

Finding links & listings – back to good old books with a new twist

Number of books on web searching have also sites with links in the book, updates, news Extreme Searcher Randolph Hock

update of a popular book; links by chapter topics

The web library Nicholas G. Tomaiuolospotlights free resources, links by chapter and new topics –

done by a librarian

The invisible web Chris Sherman & Gary Priceoriginal book on the topic, links organized by subject

p.s. most, but not all, of the sites in this lecture can be found on those sites – and much, much more

Page 33: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 33Principles of Searching

Evaluations, ratings Evaluating web sites: a prime responsibility of

searchers & all information professionals Many sources evaluate web sites:

The Scout Report – librarians’ BIBLE! Annotations. Comprehensive.

Medical Library Association ten most useful sites for consumer health

MLA user guide for finding & evaluating health information on the web

Web 100 commercial, user ranking & evaluation of web sites Evaluating web pages UC Berkeley

tutorial and guide

Page 34: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 34Principles of Searching

Needed for Web searching Knowledge & competencies on

variety of web sources & their organization search engines web search strategies search dynamics, feedback

Keeping up & up & up Why? many reasons, such as:

constant updates, changes, innovations many domain/subject specific fluidity very high

Page 35: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 35Principles of Searching

Needed for web searching by professionals

Knowledge of SOURCES in area of interest search engines not enough

not too helpful in finding these other sources; structure hard to discern

find & use specialized sources Evaluation of sources

a key professional skill! application of standard criteria & web criteria:

authority; accuracy; currency (timeliness); objectivity; coverage, persistence, usability

Page 36: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 36Principles of Searching

Needed competencies …

Knowledge of users & use Knowledge of searching Use of technology Adaptability, flexibility Integration with other resources Teaching others Constant learning & update

again: keeping up, keeping up, keeping up and again: keeping up, keeping up, keeping up

Page 37: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 37Principles of Searching



But now really: How to do it?

Page 38: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 38Principles of Searching

Page 39: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 39Principles of Searching

Page 40: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 40Principles of Searching

Imagesfrom the invisible web

Page 41: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 41Principles of Searching

images …

Page 42: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 42Principles of Searching

images …

Page 43: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 43Principles of Searching

and of course…

Page 44: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 44Principles of Searching

P.S. a nice site

Poem by Emily Dickenson:

In a library

Who will write a poem:

In a digital library?

Page 45: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 45Principles of Searching

P.S. a few weird sites… all kinds of quizzes for you

James Dean official web site Deaducated

Dead Librarians’ Society Livejournal

blogs & authoring tools; and many pathetic entries

Page 46: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 46Principles of Searching

Sources Web Search Academic Info Digital Library All the Web Ask Jeeves! Assoc. for Computing Machinery Bibliothèque Nationale de France BUBL LINK CDNET CiteSeer CompletePlanet Deaducated Digital book index Digital librarian Diotima Dogpile Entrez PubMed Extreme Searcher Free Pint Gabriel Genealogy

Page 47: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 47Principles of Searching

sources … Hermitage Information Please International Children’s Digital Library Internet Archive Internet Public Library, Michigan Internet Resources Newsletter. James Dean Kartoo KIRKE Leonardo da Vinci Museum Librarians Index to the Internet Live Journal LiveRef Mayo Clinic Medical Library Assoc. ten top sites Medical Library Assoc. user guide for health inf. Medscape

Page 48: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 48Principles of Searching

sources … Million Book Project Museum of online museums. MuseumStuff NYT blogrunner NYT historical project OCLC Web Characterization Project Open Directory Project Perseus Digital Library Profusion Psychcrawler QuestionPoint ResearchBuzz. Resource Shelf Rutgers Libraries RxList Sch of East Eur & Slavonic Studies Search Engine Colossus Search Engine Guide Search Engine Showdown

Page 49: Principles of Searching © Tefko Saracevic1 La búsqueda en la web & la web invisible Buscando lo difícil de buscar.

© Tefko Saracevic 49Principles of Searching

sources … Search Engine Watch Select Snoopy Stanford Encyclopedia of Philosophy Surfwax Teoma The invisible Web The Scout Report. The Web Library Think Quest Turbo10 U California Berkeley U Mich Documents Center US State department Virtual Library Virtual Reference Desk Vivisimo Web 100 Webbrain WebMD Wikipedia