Journées ABES 2014 - intervention sponsor - OCLC

39
The world’s libraries. Connected. Développements récents chez OCLC Journées ABES, Montpellier, 2014-05-20 Janifer Gatenby EMEA Program Manager Metadata, OCLC OCLC – face services & produits OCLC – face données ISNI Projet Structure bibliographique multi-langues

description

Journées ABES 2014 - 20 mai 2014 - Intervention Sponsor - Janifer Gatenby - OCLC : "Développements récents chez OCLC"

Transcript of Journées ABES 2014 - intervention sponsor - OCLC

Page 1: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Développements récents chez OCLC

Journées ABES, Montpellier, 2014-05-20

Janifer Gatenby

EMEA Program Manager Metadata, OCLC

OCLC – face services & produits

OCLC – face données

• ISNI

• Projet Structure bibliographique multi-langues

Présentateur
Commentaires de présentation
Janifer Gatenby is Program manager at OCLC in the Leiden office in the Netherlands where her main project is the ISNI database and system. She is also working on a project with OCLC Research to generate data that will improve mult-lingual displays and the discovery of translated works. She has been working in library automation since the late 1970s and has been working on standards since 1993 (SRU, openURL Request Transfer Message, ISO Holdings, ISO data elements, ISNI, ISCI, Z30.50 among others).
Page 2: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Face services

Un Workflow intelligent

Connecté à un réseau global de données

Soutenu par la communauté des bibliothèques

Catalogue (E & P & D)

E-Articles (Mega Index)

Fournisseurs E-Collections E-Licences

Metadonnées Ingest

Metadonnées Syndication

Services et Produits

Page 3: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Nouveautés WMS FY14

• Gestion des Groupes • Prêt secouru • Gestion multi thesauri • Résolveur de liens et KB améliorés et plus

Page 4: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

La communauté OCLC WMS (en Europe)

• Tilburg University Tilburg, The Netherlands

• Instituto de Empresa, Madrid, Spain

• Bishop Grosseteste University Lincoln, United Kingdom

• Ifremer Brest, France

• Bientôt le consortium de bibliothèques universitaires néerlandaises UKB et la Bibliothèque Nationale des Pays-Bas

Page 5: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Centres de données

US2 EMEA 1

US1

CAN 1

EMEA 2 Partner 1

APAC 1

Data Centers - rappels

Présentateur
Commentaires de présentation
The OCLC WorldShare Platform is the technical infrastructure on which OCLC’s Webscale services are built and provides data, tools and services for library developers, users and partners to create and share applications collectively. This means libraries can build applications to meet local needs, while benefiting from the innovation of the broader global library community.
Page 6: Journées ABES 2014 - intervention sponsor - OCLC

Identités publiques des individus et organisations)

Qui créent, fabriquent, gèrent, distribuent ou ont un rôle dans la production des œuvres créatives

Y inclus auteurs, artistes, créateurs, acteurs, chercheurs, éditeurs, et davantage

e.g.: ISNI 0000 0001 2133 4104

Unique

Global

Persistante

Exprimé en HTTP URI http://isni.org/isni/0000000121334104

ISO 27729 International Standard Name Identifier

pour

www.isni.org

Page 7: Journées ABES 2014 - intervention sponsor - OCLC

Bibliothèques

La Gestion des droits du texte

La Gestion des droits de la musique

Sources commerciales

Encyclopédies

La Recherche Organismes subventionnaires Sociétés professionnelles Bases de données d’articles Bases de données de thèses

Inter-domaines Identifiant “pontage”

Archives et Musées

Présentateur
Commentaires de présentation
Page 8: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

ISNI Mei 2014

• 8 million ISNIs avec statut “attribué” (en 3 ans)

• 16 million liens; ISNI comme « linked data »

# Sources Attribué Liens Recherche 11 832,931 1, 88 million

Droits du texte 6 129,312 675,000 Droits de la musique 5 337,585 442,000

Bibliothèques & commerce 4 6.8 million 12.95 million Organisations 3 408,309 56,000

Présentateur
Commentaires de présentation
BnF as registration agency for all of France – will bring in Archives and museums VIAF / ISNI interoperability meeting – including BNF, BL, BNE, DNB & Thom Hickey
Page 9: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

DROITS DU TEXTE Access Copyright, Canada ACCE

Authors’ Licensing and Collecting Society, UK

ALCS

Centrum Dienstverlening Auteurs- en aanverwante Rechten, Netherlands

CEDA

Centro Español de Derechos Reprográficos

CEDR

Irish Copyright Licensing Agency ICLA

Prolitteris, Switzerland PROL

VG WORT, Germany

VGWO

MUSIQUE

American Musicological Society AMS

British Library Sound Archive BLSA

International Performers’ Database Association

IPDA

MusicBrainz MUBZ

SwissPerform SWISP

RECHERCHE & PROFESSIONNEL

American Musicological Society AMS

Authors Guild AGLD

British Library Theses BRTH

Digital Author identifier, Netherlands DAI

Jisc Names Project, UK JNAM

La Trobe University AU:VLU

Modern Languages Association MLA

OCLC Theses OCLCT

ORCID and DataCite Interoperability Network

ODIN

AuthorClaim and RePec OPENL

Proquest Theses PROQ

Scholar Universe, Proquest SCHU

Electronic tables of content ZETO

ORGANISATIONS

American Chemical Society ACS

Boekenbank, Belgium BOEK

Bowker Publishers BOWP

Publishers Licensing Society, UK PLS

Ringgold RING

SOURCES GENERAUX

BookNet Canada BNC

Bowker Books in Print BOWKER

The European Library (48 national libraries)

TEL

Virtual International Authority File (33 libraries)

VIAF

Sources actuelles 33… en plein croissance

Page 10: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

ISNI pour les bibliothèques

• Contrôle d’autorité ensemble • Fusions et scissions en ISNI prennent effet en VIAF

• Economies de gestion collective, inter-domaines

• Plus de données, plus de confiance

• « Crowd sourcing » (homologué par ISNI QT – équipe de qualité)

• Infrastructure de contrôle de la qualité • BnF / BL = QT

• Programmes et indexes pour la détection d’anomalies = OCLC

• Système de notification • Diffusion de corrections

• Liens inter-domaines • Base de données de référence

Présentateur
Commentaires de présentation
BnF RAG (ISNI agence) pour toute La France
Page 12: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Données de qualité

Liens

Diffusion

Exposition

Identifiant partagé

Echange de données

Synchronisation

Recherche

Focalisé sur le chercheur

Articles et publications

Subventions

Présentateur
Commentaires de présentation
ISNI has provided ORCID with a range of identifiers. ISNI and ORCID are sharing the same scheme. ORCID has a beta implementation of accessing the ISNI database during researcher registration using the ISNI SRU API. I (Janifer) am on the ORCID Technical Advisory Board and also the Working Group on Multiple Assertions. ORCID and ISNI are working together on a single identifier per researcher; the first phase will be to align the identifiers, then to declare a preferred one. ISNI will harvest from ORCID and can store the ORCID identifier. 70% of the 300,000 ORCIDs so far registered only contain name and email address. In ISNI terms this is sparse data that cannot reliably be used for matching and linking. We are considering whether we can use the email address (if it is available) to determine and institution affiliation so as to pass the ISNI sparseness test. ISNI does not collect email addresses.
Page 13: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

WorldCat OCLC – face données

• Ressources en presque tous les langues

• En provenance de plus de 20,000 bibliothèques

• Moins de 50% anglais (français 3ème)

Présentateur
Commentaires de présentation
There are more than 300 million records in WorldCat today representing holdings of the world’s libraries. There are also another 200 million articles. Of the 300 million, more than half are in languages other than English.
Page 14: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Architecture actuel

Authors Author

s Auteurs

Subj Classif Subj

Classif Vedettes,Classif.

Holding Holdin

g Localis’n

Notice Bibliographique

Grappe œuvre

Grappe Contenu

Grappe Manife-station

Présentateur
Commentaires de présentation
The existing architecture is bibliographic record centric. There may be links to author and subject authority records. The work, manifestation and content clusters only contain identifiers, no metadata at present.
Page 15: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Initiatives Complémentaires

Métadonnées niveau œuvre

GLIMIR Grappes sous

œuvres – contenu /

manifestation

Structure bibliographique multi-langues

Présentateur
Commentaires de présentation
Three complementary initiatives are in progress concerning multi-lingualism and WorldCat.
Page 16: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Métadonnées au niveau Œuvre

http://www.oclc.org/research/activities/workrecs.html

Présentateur
Commentaires de présentation
The first project – generation of metadata at work level to make better presentations.
Page 17: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• La Grappe des notices ou le Contenu est égal • Permet une amélioration d’affichage • Permet un choix de format et présentation des formats qui peuvent servir comme

substituts • Consolidation des localisations & exemplaires

• La Grappe des notices au niveau Manifestation • Consolidation des localisations & exemplaires • Dans un premier temps permet la sélection d’une notice la plus appropriée en

langue de catalogage qui correspond avec la langue de l’utilisateur • Réduit l’apparence de doublonnage • Permet un chiffre plus fiable du nombre de manifestations dans WorldCat (par

apport le nombre de notices)

GLIMIR

Présentateur
Commentaires de présentation
The GLIMIR project creates clusters of parallel records for the same manifestation (manifestation cluster) and also clusters for the same content, though the form may be different (print, microform, digital). We are in the process of trawling thorugh the database to make these clusters. Only the part in blue will be changed by the multi-lingual bibliographic structure approach
Page 18: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Création de vrai affichage multi-langues • Au niveau œuvre et manifestation

• Reconstruction utilisant tous les données appropriés au lieu de “la notice la plus appropriée”

Correction des 28 million notices en langue “und” • Si possible

Amélioration du traitement des traductions Affinage des grappes œuvres

Projet Structure bibliographique multi-langues

Présentateur
Commentaires de présentation
Concerning correcting records coded as “und” = “undetermined”, we expect that we can correct about 7 million by searching for the same title string in other records.
Page 19: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Worldcat.org fait un choix d’une seule notice pour la représentation de l’œuvre dans la liste des résultats

• Même avec les grappes GLIMIR, cela ne donne pas une expérience satisfaisante pour l’utilisateur.

• Pourquoi..

“Plus approprié” en question

Présentateur
Commentaires de présentation
Currently when the short list and full displays are created, the system selects the most appropriate record for display. The most appropriate record is determined by its size and the number of associated holdings and it was envisaged to extend this to include the language of cataloguing. But we think we can do much better by questioning the “most appropriate record” concept.
Page 20: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Quelle notice est la meilleure pour un allemand?

Comment choisir entre une notice avec sommaire et une autres avec vedettes?

Présentateur
Commentaires de présentation
Here the first record is catalogued in German but has no significant German content – no subject headings and no notes. There are other richer records that could inform the user better.
Page 21: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Nouveau architecture suggéré

Œuvre

eng fre

ger

jpn

Manif eng Manif

eng Manif eng

Manif eng

Manif eng Manif

eng

o fre Notes Sommaire

++

Holding Holdin

g Localis’n

Holding

Subj sif

Vedettes Classif

eng

fre ger

jpn

Authors Author

s Auteurs eng

fre ger

jpn

eng

fre

ger

jpn

eng

fre

ger

jpn

Translations (Language of work)

Manif fre

Localis’n

Présentateur
Commentaires de présentation
This is the theoretical bibliographic structure that will no longer be bibliographic record centric but work centric. All information – authors, notes, summaries, subject headings will be flagged with the language of cataloguing.
Page 22: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Codage des éléments par langue, en particulier: • Titres

• Titres originaux

• Sommaires

• Vedettes

• Affichage dans la police préférée d’un utilisateur si possible

• Affichage des localisations par œuvre, contenu, manifestations

Principes

Présentateur
Commentaires de présentation
The work level metadata will be tagged with language for each data element. Instead of always showing the data from the main title in the record, the alternative script fields may be chosen for display, depending on what the system can determine about the user, e.g. from IP address range or expressed preference. Worldcat.org already includes the ability to change language of display, but the numbers of fields that change will be enhanced and the tabulation of several displays will be improved. Consolidate holdings from all records that re applicable to a display (work, content, manifestation level)
Page 23: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
The Grand Design; English in Italian UI with Translations table.
Page 24: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
Same in Japanese interface
Page 25: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Traductions

Page 26: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• La crème de la littérature, discours scientifiques, écologique, économique, c’est-à-dire le culture, l’héritage est partagée par moyen de traduction.

• WorldCat contient les notices pour la plupart de ces traductions importantes

Les grandes œuvres sont traduits

BUT: Utiliser les notices de qualité pour améliorer les autres et en même temps

améliorer les grappes, présentations, notices d’autorité et « linked data »

Présentateur
Commentaires de présentation
Instead of working directly with lesser quality records to improve the quality in WorldCat and instead of working with the long tail, we are turning our attention to the most important works and working ways to use the good records to improve the quality.
Page 27: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Contenu – l’œuvre et ses expressions - traductions

• Amélioration des grappes FRBR

• Ajouter à VIAF

• Diffusion à partir de VIAF comme « linked data »

Gérer les notices d’autorité œuvre

Page 28: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Titre: Journey to the West Langue: Anglais Traducteur: Anthony C. Yu Date: 1977 IsTranslationOf:

Titre: Journey to the West Langue: Anglais Traducteur: W. J. F. Jenner Date: 1982-1984 IsTranslationOf:

Titre: 西遊記 Langue Chinois Auteur: 吳承恩 Crée: 1592 HasTranslation:

Titlr: Tây du ký bình khảo Langue: Vietnamienne Traducteur: Phan Quan Date: 1980 IsTranslationOf:

Titre: 西遊記 Langue: Japonais Traducteur: 中野美代子 Date: 1986 IsTranslationOf:

Titre: Pilgerfahrt Langue: Allemand Traducteur: Georgette Boner Date: 1983 IsTranslationOf:

Un œuvre peut avoir maintes traductions. -Traduit en plusieurs langues -Traduit plus d’une fois en une langue

Présentateur
Commentaires de présentation
Thank you to Dan Benson and Karen Smith Yoshimura for this slide
Page 29: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Les notices d’autorité pour les traductions

Présentateur
Commentaires de présentation
Il y a une notice pour l’œuvre crée par NLA, LC et XR (OCLC Research). Pour les traductions, XR a augmenté le nombre considérablement. Le programme détecte le titre original, le traducteur et le titre traduit et il lie les traductions avec la notice pour l’œuvre et pour l’auteur.
Page 30: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
VIAF Consolidated display – shows work with expressions summary.
Page 31: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
This is the full expressions summary for the work Pêcheur d’Islande
Page 32: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
VIAF Full display – shows all the expressions, e.g. different translations with the title and the translator and the earliest determined publication date
Page 33: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Enrichissement important de VIAF

Auteur Titre Expressions dans VIAF Nombre de traductions dans WorldCat

Atwood Blind assassin 8 31

Guevara Notas de viaje 0 11

Hawking Grand design 0 18

Lenard Grosse naturforscher 1 3

Loti Pêcheur d’Islande 1 31

Présentateur
Commentaires de présentation
These records will enrich VIAF. There is no risk of generating bad records. The translation records will include both the translated title and the translator (both are not usually included in existing records in VIAF) Most of the expression records will be new to VIAF.
Page 34: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• # manifestations au lieu de # notices

• # œuvres avec traductions

• Les auteurs les plus traduits et leurs titres

• Et davantage

Bientôt on va savoir

Présentateur
Commentaires de présentation
Just think. How many of the 150+ million records that are for non English language works are actually translations of English language records. And how many of the English language records are also translations? It could be as high as 25%? Once we have these records generated, it will open many new possibilities. Also, we know we have 300 million records, but how many real resources do we have? GLIMIR will produce these figures. We are just starting…
Page 35: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Merci

Page 36: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Formats disponibles de VIAF • MARC-21

• XML

• RDF (linked data)

• Just links in JSON

• Et autres possibilités dans l’avenir

Diffusion des notices

Présentateur
Commentaires de présentation
The newly generated records will be available in the formats as distributed by VIAF.
Page 37: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

WorldCat Today

• Bibliographic Records • Hybrid records

• Parallel records

• Clustered at Work level (FRBR)

Présentateur
Commentaires de présentation
The 300 million records are clustered into works. The records may be in just one language of cataloguing or they may have a mixture of language of cataloguing, e.g. subject heading in more than one language. Parallel records may exist, i.e. records in different languages of cataloguing describing the same resource.
Page 38: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

• Work level data, mined from all associated bibliographic records will be displayed supplemented with expression / manifestation level data as the user drills through the short to fuller versions of the metadata.

Multilingual Bibliographic Structure Project

End user interface will show works and manifestations not bibliographic records; the cataloguing client will also show bibliographic records

Présentateur
Commentaires de présentation
Build the information to display to users from all available records and show them all relevant holdings. Do not display just one selected record from the work set. Cataloguers too will benefit from this, being able to drill down to actual records where appropriate.
Page 39: Journées ABES 2014 - intervention sponsor - OCLC

The world’s libraries. Connected.

Présentateur
Commentaires de présentation
Same record with Chinese interface