20130314 - Historical sources and data in the digital age

61
Historische bronnen & data in het digitale tijdperk Digital Humanities Bootcamp 13-15 maart 2013 Universiteit Utrecht - 14 maart 2013 Gerben Zaagsma | Huygens ING / KNHG

description

This is a lecture on historical sources and data in the digital age, given at the digital humanities bootcamp at Utrecht University (13-15 March 2013).

Transcript of 20130314 - Historical sources and data in the digital age

Page 1: 20130314 - Historical sources and data in the digital age

Historische bronnen & data in het digitale tijdperk

Digital Humanities Bootcamp 13-15 maart 2013Universiteit Utrecht - 14 maart 2013

Gerben Zaagsma | Huygens ING / KNHG

Page 2: 20130314 - Historical sources and data in the digital age

/ 59

“One of the problems confronting data enthusiasts in the humanities is that we feel a need to convince our more old-fashioned colleagues about what can be done. But our role as advocates of data shouldn't mean that we lose our critical sense as scholars.

[....] there is a risk that we look more carefully at the technical components of the datasets than the historical context of the information that they represent.

Andrew Prescott, ‘The Deceptions of Data’, Digital Riffs (13 January 2013). URL http://digitalriffs.blogspot.nl/2013/01/the-deceptions-of-

data.html (accessed March 7, 2013). 2

Page 3: 20130314 - Historical sources and data in the digital age

/ 59

inleiding

1) digital humanities in historische context2) bronnenkritiek 2.0: digitalisering en selectie3) bronnenkritiek 2.0: data en werken met digitale bronnen

3

--> stelling: neiging tot technologisch determinisme in digital humanities: meer aandacht nodig voor methodologische en epistemologische zaken

Page 4: 20130314 - Historical sources and data in the digital age

/ 59

#1 digital humanities in historische context

4

Page 5: 20130314 - Historical sources and data in the digital age

/ 59

digital humanities

„not a unified field but an array of convergent practices that explore a universe in which:

1) print is no longer the exclusive or the normative medium in which knowledge is produced and/or disseminated; instead, print finds itself absorbed into new, multimedia configurations; and

2) digital tools, techniques, and media have altered the production and dissemination of knowledge in the arts, human and social sciences”.

Jeffrey Schnapp and Todd Presner, Digital Humanities Manifesto 2.0 (Los Angeles: UCLA, March, 2009).

5

Page 6: 20130314 - Historical sources and data in the digital age

/ 59

digitale humanities

wat zijn digital humanities:

• array of practices geen veld of discipline• voordeel: focus op practices positioneert DH als integraal

deel van alle geesteswetenschappen• voor historici: meer dan werken met digitale bronnen &

data, met behulp van bepaalde tools -> veranderingen in kennis productie

• geen aparte digital history/ digital philology etc; nadruk op gemeenschappelijke methodologische uitdagingen/problemen

6

Page 7: 20130314 - Historical sources and data in the digital age

/ 59

definities

McCarty: “a methodological commons for all to draw from”

7

Page 8: 20130314 - Historical sources and data in the digital age

/ 59

definities

John Unsworth’s scholarly primitives: “some basic functions common to scholarly activity across disciplines, over time, and independent of theoretical orientation”

• Discovering • Annotating • Comparing • Referring • Sampling • Illustrating • Representing

8

Page 9: 20130314 - Historical sources and data in the digital age

/ 59

historische achtergrond

hoe nieuw? --> digital humanities hebben een 60-jarige geschiedenis, geschiedenis als moderne academische discipline 19e eeuw

9

1949: Roberto Busa en de Index Thomisticus.

Page 10: 20130314 - Historical sources and data in the digital age

/ 59

“To repeat: the use of computers in the humanities has as its principal aim the enhancement of the quality, depth and extension of research and not merely the lessening of human effort and time.”

Roberto Busa, ‘The Annals of Humanities Computing: The Index Thomisticus’, Computers and the Humanities 14/2 (1980) 83-90, 89.

“understanding the computer as a machine to think with”.Willard McCarty, ‘In the Age of Explorations’, Closing keynote for Exploring the

Archive in the Digital Age, King’s College London, 8 May 2010.

10

historische achtergrond

Page 11: 20130314 - Historical sources and data in the digital age

/ 59

Fasering digital humanities/history:

• 1940s-1950s: eerste kwantitatieve fase in VS, Busa• 1960s-1980s: social science history/ kwantitatief • 1980s-1990s: opkomst PC & Internet >

• elektronische communicatie en online informatie & bronnen zoals databases en elektronische tekstedities

• 2000s -nu: schaalvergroting en uitbouw:• online archives/libraries en ‘big data’• andere publicatie- en communicatievormen: blogs, etc.• collaboratie

11

historische achtergrond

Page 12: 20130314 - Historical sources and data in the digital age

/ 59

Algemene trend (sterk gesimplificeerd): Focus op tekst analyse in humanities computing en

databases history and computing

Niettemin sterk verschillende trajecten in Europa en VS afhankelijk van o.m. historiografisch trends waarbij computer al dan niet ingezet kon worden

zie voor uitstekende analyse: Greenstein, Daniel. "Bringing Bacon Home: The Divergent Progress of Computer-

Aided Historical Research in Europe and the United States." Computers and the Humanities 30/5 (1996) 351-364.!

12

historische achtergrond

Page 13: 20130314 - Historical sources and data in the digital age

/ 59

terminologie

Verschuiving in terminologie:• humanities computing --> digital humanities• history and computing• computational history• historische informatiekunde• digital history/ digitale geschiedenis• history in the digital age

N.B.: In Nederland wordt vaak ehumanities gebruikt ipv digital humanities en soms ook computational humanities: dit laatste ten onrechte want reductionistisch pars pro toto.

13

Page 14: 20130314 - Historical sources and data in the digital age

/ 59

terminologie

14

Page 15: 20130314 - Historical sources and data in the digital age

/ 59

terminologie

Overgang humanities computing / history and computing naar digital humanities / digital history

--> meer dan discursieve verschuiving:

• traditioneel: focus op tekst analyse (humanities computing) en databases (history and computing)

• nu: born digital bronnen, online archieven, etc.

• traditioneel: duidelijk afgebakende groep gebruikers• nu: nieuwe influx van deelnemers zonder ‘traditionele’

humanities computing achtergrond

15

Page 16: 20130314 - Historical sources and data in the digital age

/ 59

Geschiedenis in digitale tijdperk = hybride:• balans tussen analoog en digitaal• misverstand dat er gekozen zou moeten of kunnen worden

--> we werken allemaal in meer of mindere mate digitaal• de hybride historicus/a• vertrouwheid met nieuwe methodes• werken aan een bronnenkritiek die ook digitaal

toepasbaar is

--> overgangsterm? digitale geschiedenis = geschiedenis

16

historisch onderzoek 2.0

Page 17: 20130314 - Historical sources and data in the digital age

/ 59

Typen bronnen, digitaal en analoog door elkaar:• boeken, tijdschriften• beeldmateriaal• film/video• geluid• born digital: databases, email, web zélf (web archiving)

age of abundance maar the infinite archive bestaat niet

17

historisch onderzoek 2.0

Page 18: 20130314 - Historical sources and data in the digital age

/ 59

Vele vragen en uitdagingen:• onze intellectuele agenda?

18

historisch onderzoek 2.0

Page 19: 20130314 - Historical sources and data in the digital age

/ 59

agenda setting

“But nevertheless I feel confident in my general charge: to judge from the projects it produces, the digital humanities as formally constituted has been party to a concerted attempt to reinstate an outmoded and conservative view of the humanities.”

Andrew Prescott, “Making the Digital Human: Anxieties, Possibilities, Challenges”, Digital.Humanities@Oxford Summer School (6 July 2012).

19

Page 20: 20130314 - Historical sources and data in the digital age

/ 59

Vele vragen en uitdagingen:• onze intellectuele agenda?• hoe verandert de historische onderzoekspraktijk door het

werken met digitale bronnen en big data?• nieuwe type bronnen = nieuw type analyse• historische kennisproductie en representatie

20

historisch onderzoek 2.0

Page 21: 20130314 - Historical sources and data in the digital age

/ 59

hermeneutics of data & historical writing

“historians need to embrace new priorities for research publications that explicate their process of interfacing with, exploring, and then making sense of historical sources in a fundamentally digital form—that is, the hermeneutics of data.This may mean de-emphasizing narrative in favor of illustrating the rich complexities between an argument and the data that supports it..”

Frederick W. Gibbs and Trevor J. Owens, ‘The Hermeneutics of Data and Historical Writing (Spring 2012 Version)’ in: Jack Dougherty and Kristen

Nawrotzki eds.,Writing History in the Digital Age (2012).

21

Page 22: 20130314 - Historical sources and data in the digital age

/ 59

historische kennisproductie

Historisch onderzoek en ‘big data’: meer dan data en tools alleen:

• schaalvergroting en technologische uitdagingen: “data driven history”: aanbod- versus vraag gestuurd?

• samenwerking/ collaboratories/ VREs• gaat ook om verwetenschappelijking historisch onderzoek;

nieuwe claims wat betreft historische kennisproductie, meer “beta” -> patronen en structuren

• angst voor karakter geesteswetenschappen/geschiedenis

--> of-of dichotomie misleidend en simplistisch: meer dan kwantitatie vs. kwalitatief of positivistisch vs. narratief!

22

Page 23: 20130314 - Historical sources and data in the digital age

/ 59

big data

23

Page 24: 20130314 - Historical sources and data in the digital age

/ 5924

#2 bronnenkritiek 2.0: digitalisering en selectie

Page 25: 20130314 - Historical sources and data in the digital age

Source:  h"p://ec.europa.eu/informa1on_society/ac1vi1es/digital_libraries/index_en.htm.

Digital Agenda for Europe: Digital Libraries Initiative

Europe's cultural and scientific riches at a click of a mouse

In ancient times, the library of Alexandria was said to contain up to 70% of all human knowledge. The challenge for the digital age is to do even better than

that – and make the result last longer.

25

digitalisering

Page 26: 20130314 - Historical sources and data in the digital age
Page 27: 20130314 - Historical sources and data in the digital age

Source:  Study  Report  Numeric-­‐  Sta1s1cs  on  digi1sa1on  of  cultural  materials  in  Europe  (2009):h/p://cordis.europa.eu/fp7/ict/telearn-­‐digicult/numeric-­‐study_en.pdf.

27

digitalisering

Page 28: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering

Source: Study Report Numeric- Statistics on digitisation of cultural materials in Europe (2009):http://cordis.europa.eu/fp7/ict/telearn-digicult/numeric-study_en.pdf.

28

Natasha Stroeker and René Vogels, Survey Report on Digitisation in European Cultural Heritage Institutions 2012 (ENUMERATE, May, 2012).

Page 29: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering

• digitalisering wordt voorafgegaan door selectie:• welke collecties of delen binnen collecties worden

gedigitaliseerd?• redenen voor selectie:

• behoud van erfgoed & conservering van kostbaar/fragiel materiaal

• frequentie van gebruik door publiek en onderzoekers• academische onderzoeksagenda’s• publieke debatten over het verleden, herinneringspolitiek,

nationale belangen• selectie is verbonden met financiering

29

Page 30: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering

Hoe verhoudt digitalisering zich tot de natie? Roy Rosenzweig voorzag problemen in 2003:

“If national archives were part of the projects of state-building and nationalism, then why should states support post-national digital archives?”

Roy Rosenzweig, ‘Scarcity or Abundance? Preserving the Past in a Digital Era’, The American Historical Review 108 (2003) 735-762, 752.

--> echter...:

30

Page 31: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst

31

Page 32: 20130314 - Historical sources and data in the digital age
Page 33: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst

• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk

33

Page 34: 20130314 - Historical sources and data in the digital age
Page 35: 20130314 - Historical sources and data in the digital age
Page 36: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst

• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk

• Europa: creëren bewustzijn Europees verleden via digitalisering erfgoed + economisch belang

36

Page 37: 20130314 - Historical sources and data in the digital age
Page 38: 20130314 - Historical sources and data in the digital age
Page 39: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

• Duitsland: systematisch inspanning om het gedrukte joodse verleden te bewaren voor de digitale toekomst

• voormalig Oostblok: hervonden nationale trots/onafhankelijkheid en veranderde verhoudingen in het post-communistische tijdperk

• Europa: creëren bewustzijn Europees verleden via digitalisering erfgoed + economisch belang

--> digitalisering niet puur functionalistisch verklaren maar de natie of supra-natie speelt wel een belangrijke rol in prioritering/onderzoeksagenda’s en/of financiering

39

Page 40: 20130314 - Historical sources and data in the digital age

/ 59

de digitale paradox

Hoe zit het met ‘marginale’ en niet-nationale onderwerpen?

40

Page 41: 20130314 - Historical sources and data in the digital age

/ 59

de digitale paradox

Jiddisch hoort niet bij één land: wie neemt verantwoordelijkheid om transnationaal erfgoed te digitaliseren?

de digitale paradox: wordt marginaliteit versterkt?41

Page 42: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering

Digitalisering = selectie --> wat wordt niet gedigitaliseerd en waarom:

• geen ‘nationaal’ onderwerp• valt buiten bestaande (nationale) master narratives? • frequentie van gebruik

Welke geschiedenis kan met digitale bronnen wel of niet geschreven worden?

Voorbeeld: Compactmemory, Duits-joodse geschiedenis en joodse migranten/Jiddisch

42

Page 43: 20130314 - Historical sources and data in the digital age

/ 59

selectie: the infinite archive?

43

Page 44: 20130314 - Historical sources and data in the digital age

/ 59

selectie: the infinite archive?

44

focus  op  belangrijkste  elites  en  bewegingen  die  het  Duitse  jodendom  karakteriseerden  en  op  emancipa8e-­‐processen:  

• klassieke  historiografische  visie  • versterking  master  narra8ves

Page 45: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering = curatie

Data curatie:

45

Page 46: 20130314 - Historical sources and data in the digital age

/ 5946

#3 bronnenkritiek 2.0:data en werken met digitale

bronnen

Page 47: 20130314 - Historical sources and data in the digital age

/ 59

digitale bronnen en data

Overvloed aan digitale bronnen en data (“data as computer-processable information”).

Allerlei vragen en claims:• ‘big data’, maar: how big is big data?• veranderende manier van wetenschap bedrijven: beleven

we the end of theory?

47

Page 48: 20130314 - Historical sources and data in the digital age

/ 59

the ‘end of theory’?

“The new availability of huge amounts of data, along with the statistical tools to crunch these numbers, offers a whole new way of understanding the world. Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.”

Chris Anderson, ‘The End of Theory: The Data Deluge Makes the Scientific Method Obsolete’, Wired Magazine (23 June 2008). URL http://www.wired.com/science/

discoveries/magazine/16-07/pb_theory (accessed March 11, 2013).

48

Page 49: 20130314 - Historical sources and data in the digital age

/ 59

the ‘end of theory’?

“What is too often forgotten, though, is that our digital helpers are full of ‘theory’ and ‘judgement’ already. As with any methodology, they rely on sets of assumptions, models, and strategies. Theory is already at work on the most basic level when it comes to defining units of analysis, algorithms, and visualisation procedures.”

Bernhard Rieder and Theo Röhle, ‘Digital Methods: Five Challenges’ in: David M Berry ed., Understanding Digital Humanities (Houndmills, Basingstoke, Hampshire:

Palgrave Macmillan, 2012) 67-85, 70.

49

Page 50: 20130314 - Historical sources and data in the digital age

/ 59

digitale bronnen en data

Overvloed aan digitale bronnen en data (“data as computer-processable information”).

Allerlei vragen en claims:• ‘big data’, maar: how big is big data?• veranderende manier van wetenschap bedrijven: the end

of theory?• hoe verandert de rol van de onderzoeker? verhouding

mens/machine en angst traditionele geestes-wetenschappers voor overbodigheid

50

Page 51: 20130314 - Historical sources and data in the digital age

/ 59

digitale bronnen en data

“Ideally, we want to combine the human ability to understand and interpret— which computers can’t completely match yet—and the computer’s ability to analyze massive data sets using algorithms we create.”

Lev Manovich, ‘Trending: The Promises and the Challenges of Big Social Data’ in: Matthew K Gold ed., Debates in the Digital Humanities

(Minneapolis: Univ Of Minnesota Press, 2012) 460-476, 469.

51

Page 52: 20130314 - Historical sources and data in the digital age

/ 59

Werken met digitale bronnen:• bronnenkritiek: extern versus intern• in digitale context: nadruk vaak op externe kritiek -->

authenticiteit & herkomst • nadruk op websites en niet op interpretatie van bronnen die

aangeboden worden via die websites!

52

digitale bronnen en data

Page 53: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

Roy Rosenzweig:• externe/ interne bronnenkritiek• nadruk op extern: beoordelen websites e.d. (

53

Page 54: 20130314 - Historical sources and data in the digital age

/ 59

digitalisering en de natie

Roy Rosenzweig:• externe/ interne bronnenkritiek• nadruk op extern: beoordelen websites e.d. (

54

Page 55: 20130314 - Historical sources and data in the digital age

/ 59

Werken met digitale bronnen:• bronnenkritiek: extern versus intern• in digitale context: nadruk vaak op externe kritiek -->

authenticiteit & herkomst • nadruk op websites en niet op interpretatie van bronnen die

aangeboden worden via die websites!

andere dimensies: • verlies van materialiteit en dus kennis van onze bronnen• materialiteit en de historische verbeelding• bewustzijn van context verandert/ verlies van context

55

digitale bronnen en data

Page 56: 20130314 - Historical sources and data in the digital age

/ 59

context

Historical  Jewish  Press:Bulle1n  de  l’Alliance  Israélite  Universelle:            full-­‐text  search  =  socialistes 56

Page 57: 20130314 - Historical sources and data in the digital age

/ 59

context

Historical  Jewish  Press:Bulle1n  de  l’Alliance  Israélite  Universelle:            full-­‐text  search  =  socialistes 56

Page 58: 20130314 - Historical sources and data in the digital age

/ 59

context

56

Page 59: 20130314 - Historical sources and data in the digital age

/ 59

context

57

Page 60: 20130314 - Historical sources and data in the digital age

/ 59

context

58

Page 61: 20130314 - Historical sources and data in the digital age

/ 59

slotopmerkingen

1) digital humanities/ history minder nieuw dan het soms lijkt, wel stroomversnelling laatste 10 jaar

2) digitalisering: kritisch kijken wat wel/niet wordt gedigitaliseerd en welke geschiedenissen verteld kunnen worden

3) werken met digitale bronnen & data: ontwikkelen kritische blik op verschil traditionele en digitale bronnen & data

59