BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality
-
Upload
alberto-gonzalez-talavan -
Category
Education
-
view
291 -
download
0
Transcript of BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality
August 24th, 2016THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Data publishing concepts and introduction to the IPT
Nicolas Noé
August 24th, 2016THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Publication de données: concepts et introduction à l’IPT Nicolas Noé
Publishing
“Publishing” refers to making biodiversity datasets publicly accessible and discoverable, in a standardized form, via an access point, typically a web address (a URL).
Pub
lishi
ng
Publication
“La publication a pour but de rendre un jeu de données de biodiversité accessible publiquement et découvrables, dans un format standardisé via un point d’accès, typiquement un adresse (URL).”
Pub
licat
ion
Pub
lishi
ng Publishing
Pub
licat
ion
Publication
Classes of dataset: occurrencesD
atas
et c
lass
es
Digital text or multimedia data record detailing facts about the instance of occurrence of an organism, i.e. on the what, where, when, how and by whom of the occurrence and the recording.
Type de jeu de donnée: occurrencesTy
pe d
e je
u de
don
nées
Texte numérisé ou données multimédia détaillants des faits sur l’occurrence d’un organisme: le quoi, où, quand, comment et par qui de l’occurrence et de son enregistrement.
Classes of dataset: checklist
“A catalogue or list of named organisms, or taxa.”
Possibly also: vernacular names, literature, relationships, ...
Typically categorize information along taxonomic, geographic, and thematic lines, or some combination of the three.
Dat
aset
cla
sses
Type de jeu de données: checklist / liste d’espèce
“Un catalogue, ou une liste de taxons.”
Éventuellement aussi: noms vernaculaires, citations, ...
Classent généralement l’information par taxonomie, géographie et statut ou en combinant les trois.Ty
pe d
e je
u de
don
nées
Classes of dataset: sampling-event
Datasets sometimes provide greater detail, not only offering evidence that a species occurred at a given location and date, but also making it possible to assess community composition for broader taxonomic groups or even the abundance of species at multiple times and places. These datasets typically derive from standard protocols for measuring and monitoring biodiversity like vegetation transects, bird censuses and freshwater or marine sampling. By indicating the methods, events and relative abundance of species recorded in a sample, these datasets improve comparisons with data collected using the same protocols at different times and places—in some cases, even leading researchers to infer the absence of particular species from particular sites.
Dat
aset
cla
sses
Type de jeu de données: données d’échantillonage
Parfois, les ensembles de données fournissent de plus amples détails, mettant en évidence non seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant, lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites spécifiques
Type
de
jeu
de d
onné
es
Classes of dataset: metadata-only
● “Data about data”● Always mandatory● Very important to assess
fitness for use
Dat
aset
cla
sses
Type de jeu de données: métadonnées uniquement
● “Données sur les données”
● Toujours obligatoire● Crucial pour l’adéquation
à l’usage
Type
de
jeu
de d
onné
es
Licenses
●Everything at GBIF now has a licenses●Choice between:
• Public domain: CC0• Creative Commons Attribution: CC-BY• Creative Commons Attribution Non Commercial: CC-
BY-NC
Lice
nses
Licences
●Toutes les données GBIF on maintenant une licence claire
●Choix possibles:• Domaine public: CC0• Creative Commons Attribution: CC-BY• Creative Commons Attribution Non Commercial: CC-
BY-NC
Lice
nces
Darwin Core, Simple Darwin Core and Darwin Core Archive
Darwin Core: a list of terms
Dar
win
cor
e
Darwin Core, Simple Darwin Core et Darwin Core Archive
Darwin Core: une liste de termes
Dar
win
cor
e
Darwin Core, Simple Darwin Core and Darwin Core Archive
Simple Darwin Core: Darwin Core expressed in a simple table structure.
Dar
win
cor
e
Darwin Core, Simple Darwin Core et Darwin Core Archive
Simple Darwin Core: Darwin Core exprimé sous forme de structure tabulaire simple
Dar
win
cor
e
Darwin Core, Simple Darwin Core and Darwin Core Archive
Darwin Core Archive: more complex format, allows extensions.E
xten
sion
s
Darwin Core, Simple Darwin Core et Darwin Core Archive
Darwin Core Archive: un format plus avancé, qui permet l’usage d’extensions.E
xten
sion
s
Data Publishing methodP
ublis
hing
Méthodes de publication de donnéesP
ublic
atio
n
Data Publishing method: IPT
●Server-side software, needs a stable connection●One IPT can host many datasets, on behalf of
several institutions, while giving proper credit ●Main (but not only) publishing tool for GBIF●Test mode and production mode●Multilingual
IPT
Méthode de publication: IPT
●Logiciel serveur, nécessite une connexion stable●Un IPT peut héberger plusieurs datasets, pour
plusieurs institutions, et toujours donner crédit/attribution
●Modes test et production
IPT
STEP 1: Get access and log in an IPT instance
Etape 1: Accédez à l’IPT et connectez-vous !
STEP 2: Create a new resource
Etape 2: Création d’une nouvelle ressource
STEP 3: Get familiar with the main resource configuration page
Etape 3: Familiarisez-vous avec la page de configuration de la resource
STEP 4: Author metadata
Etape 4: Rédigez les métadonnées
STEP 5: Publish, make visible and register the dataset
Etape 5: Publiez, rendez visibles et enregistrez l’IPT
August 24th, 2016THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Data publishing concepts and introduction to the IPT
Nicolas Noé
August 24th, 2016THE BID PROGRAMME IS FUNDED BY THE EUROPEAN UNION
Publication de données: concepts et introduction à l’IPT
Nicolas Noé