Collectiemanagement in digitale tijden ... voor openbare bibliotheken
Zoeken in collecties van Openbare Bibliotheken
-
Upload
rosemie-callewaert -
Category
Technology
-
view
668 -
download
2
description
Transcript of Zoeken in collecties van Openbare Bibliotheken
zoeken in collecties van openbare bibliotheken
onder de loep
Rosemie Callewaert, Metadata Architectuur bij Bibnet
Bibliotheekschool Gent , 1 juni 2010Gastles
Metadata en indexeringImpliciete en expliciete metadataHerkomst metadata zoeken.bibliotheek.beDoel zoeken.bibliotheek.be
Manuele indexeringBibliografische recordsAuthority records
Machine indexeringRelevantie sorteringQuery expansionStemming en compoundFuzzy searchRecommendations
data metadata
over
object
datametadata
object
Data en metadata
objecten
Impliciet en expliciet
object
Doel van indexeringterugvindbaar maken
ordening
Doel van metadatadata terugvinden mogelijk maken
ordening mogelijk makeninformeren over data
etaleren van data
Herkomst metadata zoeken.bibliotheek.be
Open VlaccFysieke collectie 6 grote openbare bibliothekenMuziekcollectie Centrale Discotheek RotterdamSelectie van websites
VakorganisatiesBoekbesprekingen Leeswolf en LeeswelpCovers van Bowker en de Centrale Discotheek van Rotterdam (CDR)Meer Over Media van NBD/Biblion
UitgeversAankondigingen van uitgevers via BoekbankFlapteksten en coversMetadata bij krantenartikelen
InternetLeestips LibraryThingLuistertips Last.fm
PubliekTagsBesprekingenLijstjes
gecontroleerd
niet gecontroleerd
data en metadataimpliciet en expliciet
Doel zoeken.bibliotheek.be
Voorbeeld publiekscatalogus voor openbare bibliothekenModel zal uitgebreid worden naar de Provinciale en VGC Bibliotheeksystemen (PBS)Elke Openbare bibliotheek aangesloten op het PBS een publiekscatalogus geënt op zoeken.bibliotheek.be
Integratie fysieke en digitale bibliotheekcollectie
Verdeelplatform data en metadataPersmappen MediargusBoekbesprekingenDigileenDigitale Bibliotheek voor de Nederlandse Letteren (DBNL)…
Zoeken in collecties van verschillende bibliotheken
Metadata Open Vlacc
Titelbeschrijving, explicite metadata, manuele indexering
Beschrijving van formele en inhoudelijke kenmerken
Open Vlacc invoerregelgevingverschillende soorten en materialen
tekst, beeld, klank, boek, bladmuziek, cd, dvd, tijdchrift, artikel, …verschillende doelgroepen en inhoudelijke types
volwassenen, jeugd, fictie, non-fictieverschillende bibliografische types
monografie, onderdelen, meerdelig, serieel, koepel, deeluniforme ingangen
auteurs, titels, onderwerpeninhoudelijke ontsluiting
trefwoorden, thema’s, genresclassificaties
SISO, ZIZO, Vlaamse muziekclassificatie, NBLC
Bibliografisch record
Authority Record
• Gebruik van consequente terminologie bij het toevoegen van nieuwe gegevens• Mogelijkheid om items van dezelfde auteur, hetzelfde onderwerp, hetzelfde werk, …. te
groeperen
=databankrecord waarin een term vastgelegd wordt voor het uniek
benoemen van een concept, onderwerp, auteur, …
Waarom?
Hoe?• Zie verwijzingen (see references): een term die hetzelfde impliceert en verwijst naar de
vastgelegde term• Zie ook verwijzingen (see also references): een term die verwant is aan de vastgelegde
term en ook als term kan gebruikt worden in de databank
Voor catalogusbouw
Authority Bestanden
AuteursPersoonsnamenOrganisaties en instellingen (corportaties)
OnderwerpenTrefwoorden volwassenenTrefwoorden jeugdThema’s jeugdThema’s volwassenen
GenresMuziekVolwassenen (film, literatuur)Jeugd (film, muziek, literatuur)
Titels Uniforme titels en reekstitels
Verwijzing van Nicci French naar 2 andere namenVerwijzing van Nicci French naar 2 andere namen
jaargetijden = seizoenenzie ook verwijzingen naar afzonderlijke seizoenen
jaargetijden = seizoenenzie ook verwijzingen naar afzonderlijke seizoenen
Metadata van het publiek
Tags Bespreking
Waardering
bibliotheek
publiek
Andere organistaties
25.000 getagde titels2,5% van alle titels
1.500 besproken titels0,15% van alle titels
11.O00 titels met steraanduidingen1,1% van alle titels
Machine indexeringenRelevance rankingQuery expansion
Stemming en compoundFuzzy search
Recommendations
Relevantie sortering
Exacte match
Frequentie zoekwoord(en) in geïndexeerde gegevens van een publicatie *
Locatie van zoekwoord(en) in geïndexeerde gegevens van een publicatie *
Aantal edities van een publicatie/werk
Aantal bibliotheken met publicatie/werk in bezit
Materiaaltype
Niet exacte match
* gewicht per soort informatie: titel, auteur, onderwerp, fulltext, …
=relatie tussen zoekwoord(en) en
volgorde van titels in het zoekresultaat
RelevantiesorteringZichtbare invloed van aantal edities en bezit
RelevantiesorteringZichtbare invloed van aantal edities en bezit
RelevantiesorteringZichtbare invloed van aantal voorkomens van de zoekterm
RelevantiesorteringZichtbare invloed van aantal voorkomens van de zoekterm
Query expansion
=De zoekvraag (query) achter de schermen uitgebreiden
(expanding) met andere zoektermenhttp://en.wikipedia.org/wiki/Query_expansion
Op zoeken.bibliotheek.be- machine uitbreidingen- uitbreidingen op basis van Authority Records
Seizoenen = Seizoenen OR JaargetijdenZoekterm heeft meer gewicht in relevantiesortering
Seizoenen = Seizoenen OR JaargetijdenZoekterm heeft meer gewicht in relevantiesortering
Luc Zeebroek = Luc Zeebroek OR KamagurkaLuc Zeebroek komt niet voor
Luc Zeebroek = Luc Zeebroek OR KamagurkaLuc Zeebroek komt niet voor
Authority Records hebben ruimere werking dan enkel het zoeken in bibliografische records ondersteunen.
Ook relevant voor full text!
Authority Records hebben ruimere werking dan enkel het zoeken in bibliografische records ondersteunen.
Ook relevant voor full text!
Stemming
=Gebruik van computeralgoritmes die gebouwd zijn op de taalkundige morfologie die
bepaalt dat een werkwoord voor vervoeging herleid moet worden tot de stam.De computer zou hierdoor mits voldoende interpretatiemogelijkheden woorden kunnen
vervoegen.De algoritmes die dit doen worden “stemmers” genoemd.
Eerste stemmer °1970: Porter Stemmer
http://en.wikipedia.org/wiki/Stemming
Enkelvoud zoeken, meervoud vindenEnkelvoud zoeken, meervoud vinden
Compound
=Compound is een samengesteld begrip waarvan de stam een onderdeel is.
De samenstelling wordt gebouwd door het gebruik van bestaande woorden.
Door het hersamenstellen van woorden kan een begrip een afgeleide betekenis of een bijna niet meer verwante betekenis hebben.
http://en.wikipedia.org/wiki/Compound_%28linguistics%29
“Fietsen” wordt herleid tot “fiets” (stemming)“Techniek” wordt gecombineerd met “fiets” (compound)
“Fietsen” wordt herleid tot “fiets” (stemming)“Techniek” wordt gecombineerd met “fiets” (compound)
Fuzzy search
In de woordenwolk worden spellingsverianten getoondHet woord dat meest voorkomt wordt gesuggereerd
In de woordenwolk worden spellingsverianten getoondHet woord dat meest voorkomt wordt gesuggereerd
Zoek de “juiste” spellingsvariant.Waar zijn de thesaurustermen?
Zoek de “juiste” spellingsvariant.Waar zijn de thesaurustermen?
http://zoeken.bibliotheek.be/?q=dostoyevsky
Authority Bestanden van Nationale Bibliotheken Verzameld virtueel internationale Authority Records
Authority Bestanden van Nationale Bibliotheken Verzameld virtueel internationale Authority Records
Recommendations
Leestips
Luistertips