data sprint des archivesForum des Archivistes, Troyes, 30, 31 mars, 1er avril 2016
Réunion d’information sur le data sprint des archives
1.“data sprint des archives” ?
où, quoi, qui, comment, pourquoi
planning, licences de réutilisation
2.exemples de visualisation de données
3.focus sur les données collectéesexemples
critères (structuration des données)
4.questions
Tour de table
Source : BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons
“Data sprint des archives” ?
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
● Pourquoi ?
Souhait du comité scientifique d’organiser un événement participatif
● Quoi ?
Choix du format de l’événement : un data sprint étalé dans le temps
Collecte de données > réutilisation et développement de dispositifs et dataviz par des équipes > restitution
“Data sprint des archives” ?
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
● Planning
● Comment
Des équipes, à distance voire locales // des outils collaboratifs en ligne
> Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers, découvrir, apprendre et échanger
mars 2015 : début de la
réflexion
juin 2015 : choix du format, appel
à participation (archives)
mars 2016 : FORUM
après ? SAV et débrief
juillet-déc. 2015 : collecte des données
janvier-mars 2016 : conception et dév.
des dispositifs
nov. 2015 : réunion d’information
déc. 2015 : appel à participation
(non archives)
“Data sprint des archives” ?
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
● Les licences des données collectées
Au choix : - durée du forum (mais les dispositifs ne seront pas pérennes)- ouverture des données (dispositifs pérennes et ouverts après le forum,
contenu open data / licences CC / ouvertes), avec accompagnement de l’équipe data sprint (y compris après le forum)
Sur l’ouverture des données : - impact très important en matière de communication très important
(visibilité, relais Etalab, etc.)- tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun- tutoriel : Les licences Creative Commons (MCC, 2013) :
http://dai.ly/x1tg4gv
Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
Exemples de visualisation de données
ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...
Exemples de visualisation de données
Archives de la Manche (Pinterest)
Gallica (Pinterest)Archives de Boulogne-Billancourt
Exemples de visualisation de données
Archives des Yvelines, liste des machines à vapeur (données non exhaustives et non corrigées)
Voir carte de chaleur animée (heatmap)
Fichier XLS
CartoDB
Statistiques sur la structuration de fichiers XML et l’utilisation des balises EAD
> les données comme aide à la décision
Exemples de visualisation de données
Avant-Après avec juxtapose.js http://goo.gl/yh0i00
Lieu de naissance et de mort à partir de fichiers XML-EAC
Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux #archives du Ministère des Affaires étrangères et européennes
Exemples de visualisation de données
Visualisation des expositions dans les musées français (1900-1950)
Fichier TXT initial
Exposition Fragonard au Petit Palais, paris, du 21/02/1902 au 12/05/1902
“Plaisirs d’ornements”, Musée des Beaux-Art de Lille, Lille, janvier 1904
Fichier CSV_1
Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin
Exposition Fragonard
Petit Palais paris 21/02/1902 12/05/1902
“Plaisirs d’ornements”
Musée des Beaux-Art de Lille
Lille janvier 1904
SPLIT + REGEX
OpenRefine
Titre_expo Lieu_musee Lieu_Ville Année Geoloc
Exposition Fragonard
Petit Palais Paris 1902 51.45643;-124789
Plaisirs d’ornements
Musée des Beaux-Art de Lille
Lille 1904 31.45643;-024789
OpenRefineNettoyage + REGEX + API
Dataviz des relations autour de la #Galerie Bonnier grâce à <cpfRelation> des notices XML-EAC
Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux Beaux-Arts de Paris
Exemples de visualisation de données
Focus sur les données collectées
données structurées : fichier XML, fichier Excel normalisé, etc.
vs
données non structurées (beaucoup plus difficilement utilisables) : fichier Word, listes non normalisées
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
Fichier Sénateurs Second Empire
Focus sur les données collectées
On recherche encore : des statistiques (de type Google Analytics), des données XML EAC, des images libres de droit, etc.
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
Participants actuels Thèmes
AD10, AD26, AD31, AD35, AD50, AD51, AD62, AD71, AD78, AD89, AD95, AM Toulouse, AM Dijon, AM Beaune, AM Orléans, AM Rennes, Sénat, Inserm, Mémoire des Hommes, La Parisienne de Photographie, INHA, …
+ données disponibles sur les portails open data
guerre et vie militaire, économie et travail (machines à vapeur, syndicats, grèves, factures), personnes (cartes postales, bases nominatives), monuments (MH, architectes), lieux (cartes postales, plans, monographies), héraldique, associations, surveillance
Données de gestion (stats de service), statistiques sites Internet)
1. “Data sprint des archives” ?
2. Exemples de visualisation de données
3. Focus sur les données collectées
4. Questions
A vos questions !
Question Mark Graffiti (Flickr) , CC BY 2.0
contact : [email protected]ïwenn Bourdic - Antoine Courtin
Top Related