Digital Milton

Vrijdag, 10 januari, 2020

Geschreven door: Islam Issa, David Currell
Artikel door: Lucas van der Deijl

Digitaal isolement

[Recensie] Als neerlandicus met een zwak voor digitale methoden word ik groen van jaloezie bij het zien van de megalomane vormen die de digitalisering aanneemt in het Engelse taalgebied. In zijn bijdrage aan de bundel Digital Milton noemt Anupam Basu de aantallen: Early English Books Online (EEBO) biedt inmiddels online toegang tot gescande versies van ruim 100.000 Engelstalige vroegmoderne teksten (1475-1700). (113) Bovendien zijn in de afgelopen twintig jaar 65.000 teksten uit dit corpus met de hand getranscribeerd, die momenteel in fases open access beschikbaar gesteld worden via EEBOTCP. (114)

Het zijn geen kinderachtige aantallen: de English Short Title Catalogue (ESTC), gebaseerd op de bibliografieën van Pollard en Redgrave (1926) en Wing (1945-1951), documenteerde in totaal zo’n 125.000 teksten uit deze periode. Ter vergelijking: het digitale platform Nederlab biedt momenteel toegang tot 725 machine-leesbare Nederlandstalige teksten die oorspronkelijk gepubliceerd werden tussen 1475 en 1700 en beschikbaar zijn op de DBNL, de belangrijkste bron van digitaal literair erfgoed in ons taalgebied. Dat is minder dan 1,3 procent van de 56.817 Nederlandstalige teksten uit deze periode die beschreven zijn in de Short Title Catalogue Netherlands (STCN).1 Canonkritiek is een belangrijke drijfveer voor de literatuurwetenschappelijke beweging die we vaak ‘distant reading’ noemen, maar de geldigheid van dat argument verschilt dus per taalgebied en periode. Britse letterkundigen hebben in ieder geval niets te klagen. In deze florissante onderzoeksomstandigheden komt een alternatief voor canonieke literatuurgeschiedenis wel heel dichtbij.

Miltonstudies

In dit licht is het een opvallende keuze van David Currell (American University of Beirut) en Islam Issa (Birmingham City University) om een bundel te wijden aan “scholarship on John Milton that engages with digital methods and digital media”. (1) In plaats van nieuwe aderen te zoeken in digitale goudmijnen als EEBO hijsen ze juist die o zo bekende klomp opnieuw op de weegschaal: de Engelse dichter John Milton (1608- 1674). Currell en Issa verantwoorden hun keuze vanuit de vaststelling dat ‘the digital’ slechts zeer zelden doordringt tot het veld van de Miltonstudies. Het is een schril contrast met dat andere kanon uit de Engelse letterkunde, zo vervolgen ze: Shakespeare is wél enthousiast omarmd door de digital humanities. Hun vergelijking met The Bard is veelzeggend voor de canonieke bril die ook in digitaal literatuuronderzoek opvallend vaak de corpusselectie kleurt: Franco Moretti schreef over Hamlet in zijn paradigmatische Distant Reading (2005), John Burrows analyseerde Jane Austen in zijn klassieke Computation into Criticism (1987)2 en Stephen Ramsay illustreerde zijn digitale literatuurkritiek met Virginia Woolf in zijn even invloedrijke Algorithmic Criticism (2011).

Tot zover het tweede woord uit de titel; wat betekent ‘digital’ in deze bundel precies? De verschillende bijdragen zijn geordend in drie delen waarin het digitale steeds een andere functie vervult. Textual Remediations behandelt digitale edities en remediëring van Miltons werk, Scale, Space, and Sociality bundelt digitale analyses van Miltons teksten en New Audiences, Novel Engagements is gewijd aan de invloed van online media op de receptie en toegankelijkheid van Milton. Onder deze noemers vallen uiteenlopende artikelen, bijvoorbeeld over digitale edities als de John Milton Reading
Room
en Paradise Lost Audiotexts, over digitaal gekwantificeerde verwijzingen naar regels uit Paradise Lost in de Oxford English Dictionary, en over de digitale verspreiding van Miltons werk in de hedendaagse Arabische wereld. Los van de evidente waarde van sommige bijdragen (waarover straks meer) dringt zich toch de vraag op wat de gemeenschappelijke deler is van deze artikelen over John Milton, behalve dat ze allemaal iets ‘digitaals’ doen. In hun inleiding citeren Currell en Issa de volgende probleemanalyse van Matthew Gold instemmend, maar ik vraag me af of hun bundel voor dat probleem een oplossing biedt: “the challenges currently associated with the digital humanities involve a shift from congregating in the big tent to practicing DH at a field-specific level, where DH work confronts disciplinary habits of mind.” (geciteerd in Currell en Issa 2018: 4) De emancipatie en integratie van digitale benaderingen in geesteswetenschappelijke disciplines is in mijn ogen niet geholpen met de bundeling van uitsluitend digitale benaderingen rond een favoriet thema binnen zo’n discipline. Het gevolg is het gedrukte equivalent van de panels over digital humanities die steeds vaker geboekt worden op disciplinaire congressen, met papers die behalve een vaag gerelateerde methodologische oriëntatie thematisch niets met elkaar gemeen hebben.

Wordt Vervolgd

Deze digitale focus in Digital Milton op slechts één auteur heeft niettemin ook belangrijke voordelen. Met name de bijdragen in het tweede, meer hermeneutische deel Scale, Space and Sociality tonen overtuigend de waarde van de hoofdredactionele keuze voor “mechanisms whereby the digital can engender ideational, hermeneutic, generative, and productive encounters with Milton”. (6) Ik had graag gelezen hoe ‘the digital’ Milton ook hermeneutisch kon verrijken volgens de redacteuren: wat betekent het precies om Milton computationeel te lezen, welke redenen kunnen er zijn om talige kenmerken van een werk als Paradise Lost te kwantificeren en welke specifieke conceptuele of literatuurtheoretische problemen dienen zich aan bij deze methodologische ambities? Dergelijke vragen worden niet beantwoord in het inleidende hoofdstuk of de epiloog, maar de hoofdstukken spreken soms voor zichzelf en dat is eigenlijk wel charmant. ‘Show, don’t tell’; er wordt al genoeg in abstracto gepalaverd over ‘distant reading’.

Micro-analyse

De bijdrage Mapping the Moralized Geography of Paradise Lost van Randa El Khatib en David Currell is zo’n hoofdstuk dat de waarde van distant reading gewoon laat zien. Daarin visualiseren de auteurs met Geographical Information Systems (GIS) een temporeel-ruimtelijke geografie op basis van de plaatsnamen in Paradise Lost. Ze maken mooi duidelijk hoe een dergelijke kaart als een soort paratext de tekstuele laag kan aanvullen in een literaire interpretatie. El Khatib en Currell illustreren zo de waarde van ‘distant reading’ voor de micro-analyse van individuele teksten in plaats van de macro-analyse van corpora: analyses die literaire betekenis compliceren en nieuwe vragen opwerpen. Dat is een toepassing die navolging verdient met het oog op de beoogde integratie en normalisering van digitale analyse. Het is bovendien een type analyse dat relatief eenvoudig is en geen infrastructurele investeringen vereist. De methode kan daardoor makkelijk gereproduceerd worden, ook door studenten – altijd een pre in digitaal onderzoek.

Naast deze hermeneutische oefening op microniveau bevat de bundel ook een hoofdstuk dat op verbluffend slimme wijze de waarde demonstreert van digitalisering en computationeel onderzoek op het macroniveau van het corpus. In Form and Computation: A Case Study doet Anupam Basu een Morettiaans voorstel tot de kwantitatieve studie van de literaire vorm. Zijn doel is om op basis van formele kenmerken van de gedigitaliseerde documenten in het EEBO-TCP-corpus clusters van verwante teksten op te sporen. Die formele informatie verkrijgt Basu uit de mark-ups van de teksten, die allemaal netjes in de TEI-standaard (Text Encoding Initiative) beschikbaar gesteld zijn. Simpel gezegd gaat het om een uitgebreide set van tags die gebruikt kunnen worden om de tekst te verrijken met meta-tekstuele informatie over vormgeving, bladspiegel en structuur. De even simpele als slimme truc van Basu is vervolgens om elke tekst te converteren naar een vector (reeks) van de relatieve frequentie van alle tags uit de tagset van TEI voor zover aanwezig in die tekst (‘relatief’ wil zeggen in relatie tot het totale aantal aanwezige tags in de tekst): markeringen van tussenkopjes, cursieven, witregels, regie-aanwijzingen et cetera. In plaats van vectoren van woordfrequenties – de gebruikelijke basis voor vector-based tekstanalyse – berekent Basu dus vectoren van formele meta-tekstkenmerken. De aanname is dat teksten met vergelijkbare frequenties van dergelijke vormmarkeerders inderdaad vergelijkbaar zijn. Dit principe stelt Basu niet alleen in staat om genre te formaliseren, maar ook om associaties zichtbaar te maken tussen teksten van dezelfde auteur, in casu John Milton (wie anders). Basu evalueert zijn methode niet volgens de conventies in het vakgebied (met zogenaamde ‘precision’ en ‘recall-scores’), maar zijn verkennende bijdrage zet op zijn minst aan tot verder onderzoek. De aanbeveling luidt tot slot dat computationele literatuurwetenschappers
de mark-ups van gedigitaliseerde teksten (met name bedoeld ten behoeve van digitale edities) in hun voordeel kunnen gebruiken. Ze hoeven de tags
niet klakkeloos uit de tekst te slopen, zoals vaak gebeurt in computationeel werk. Dat punt is gemaakt.

Als digitaal georiënteerde vroegmodernist juich ik het type onderzoek toe dat gebundeld is in Digital Milton. Maar ik hoop ook dat dergelijk onderzoek voortaan niet meer gebundeld wordt. In plaats daarvan zou het goed zijn als digitale methodologie zich inschrijft in disciplinaire discussies en niet langer het digitale isolement verkiest. Het bijvoeglijk naamwoord ‘digitaal’ verovert in een rotgang ons taalgebruik en ik kan niet wachten tot het daarmee ophoudt. Want het uitsterven van het adjectief zou een normalisering van het digitale markeren die ik, in het academische discours althans, tegemoet zie. Pas dan kan er een inhoudelijke dialoog ontstaan die zich afwisselend bedient van kwantitatieve en kwalitatieve argumenten, over Milton, Shakespeare en al die tienduizenden andere auteurs uit het Engeland van de zeventiende eeuw.

Noten
1. Zowel Nederlab als de STCN raadpleegde ik op 15 maart 2019.
2. Liefhebbers van het werk van Burrows zullen zich overigens herinneren dat hij zijn beroemde Delta afstandsmaat, inmiddels een standaard in de stylometrie, illustreerde aan de hand van Miltons poëzie. (Burrows 2002)

Eerder verschenen in Vooys