De dood van ChatGPT en de premisse van technologie
De mate waarin technologie zich in de afgelopen dertig jaar heeft opgerukt, is aardig weergaloos. Als kind moest ik nog inbellen naar het internet, en dan vooral niet te lang want dat was duur en ook nog eens onhandig omdat ik de lijn bezet hield. Bovendien was er ook nog veel minder te doen op het internet, dus wat had ik er te zoeken? Van wat ik mij vagelijk herinner bezocht ik voornamelijk jaren 90 websites met Comic Sans en dergelijke, die je nu alleen nog in het internetarchief of misschien in de krochten van het web kan vinden.
Persoonlijk kreeg ik de expansiedrift van technologie thuis goed te zien. Mijn vader had een zaak en menig oud computer passeerde daardoor de revue. Zo heb ik van jongs af gezien hoe harde schijven werkten – omdat ik computers vaak uit elkaar haalde – en speelde ik MAMBA op mijn eigen DOS-pc. Als jongste van vier was er ook altijd wel sprake van foefjes, omdat mijn broers zich inlieten met dit soort zaken. Mobieltjes volgden al spoedig – al bleef ik op dat vlak vaak haken – en had ik pas een ‘serieus’ mobieltje toen ik het afdankertje van mijn moeder – een HTC Wildfire – overnam. Een mobiel die richting de zes jaar trouwe dienst leverde1.
De tijd van toen versus nu, is ergens bijzonder klein. Van eind jaren negentig tot nu is eigenlijk niets in termen van onze beschaving. En toch werd het met de toegang tot meer computerkracht tussen 2010 en 2012 opeens veel beter mogelijk om neurale netwerken (een veelgebruikte techniek in AI en machine learning) te trainen en te gebruiken. Alhoewel de techniek al ‘oud’ was2 werd het toen hervonden en begon misschien wel een gouden tijd voor dit gedeelte van AI.
Het is niet mijn doel om de geschiedenis van AI hier uiteen te zetten. Dat is een leuk onderwerp maar een discussie voor een andere keer. Die kleine dertig jaar waarin het internet zich heeft ontpopt van een ontoegankelijk stuk technologie tot een megalomaan wereldfenomeen is slechts een achtergrond schets. Want waar het mij werkelijk om gaat, is dat we deze doorbraken in technologie ook breed hebben uitgesmeerd over onze maatschappij. Netflix gebruikt een algoritme om te zien wat voor films je wilt, Google heeft een zoekalgoritme waar Alphabet groot mee werd, Tinder verkoopt algoritmische liefde, enzovoorts. Nog afgezien van het feit dat je voor Streaming en Tinderen apparatuur nodig hebt die tot voor kort behoorde tot de wereld van sciencefiction.
Een van de recentere technologische opschuddingen zijn Large Language Models (LLM) – en specifiek doel ik hier op ChatGPT – die we de klaslokalen en collegezalen laten binnendringen. ChatGPT kan hele teksten produceren en doet dat vrij overtuigend, en kan ook nog gebruikmaken van alle informatie die het kan vinden. Echter, als ChatGPT hele essays kan schrijven en ze niet te onderscheiden zijn van werkelijke essays dan is het gevolg helder: scholieren en studenten leren niet meer schrijven of onderzoeken. Dit terwijl het ophalen van informatie en het samenvoegen tot een coherent verhaal niet alleen het denken aanscherpt, maar ook essentieel is voor goed wetenschappelijk onderzoek. Er zit een wezenlijk verschil tussen het passief opnemen en iets moeten uitwerken en analyseren en er mogelijk bredere conclusies uit trekken. Sprekend als iemand die teveel YouTube heeft gekeken en daar veel te weinig van onthoudt kan ik in ieder geval garanderen dat passiviteit niet de weg is naar het ontwikkelen van belangrijke vaardigheden of het opnemen van kennis.
Ik hoorde een tijdje terug veel over of de vraag of dit eigenlijk nog wel toelaatbaar is. Docenten kunnen niet onderscheiden of een tekst door een student geschreven is en vinden dat kwalijk. Dat klinkt als een taak voor wetenschappers. Ze zouden een AI-systeem kunnen ontwikkelen als ChatGPT tegenhanger die kan onderscheiden of de tekst geschreven is door een AI-systeem of niet3. Natuurlijk nodigt dit alleen maar weer uit tot betere ChatGPTs om die systemen te omzeilen.
Ik las recentelijk over ChatGPT in de NRC, ik zie wetenschappelijke papers over het onderwerp verschijnen, en bovendien krijg ik in bijna ieder gesprek waar men erachter komt dat ik filosoof en computerwetenschapper ben (al is AI-deskundige misschien juister), de vraag over wat ik vind van ChatGPT. En veelal laat men dit soort dingen ook niet los. Bij AlphaGo kreeg ik eveneens dezelfde vraag. Ik kan (waarschijnlijk vanwege beroepsdeformatie) slecht inschatten of het voor veel mensen een werkelijk indrukwekkend stuk technologie is, of dat er gewoon een wanhopige zoektocht in zit naar een antwoord op de vraag wat we hier überhaupt mee moeten. Ergens vermoed ik dat het beide is.
Vaak verwacht men dat je in enkele zinnen kunt samenvatten waar het fenomeen ChatGPT op gestoeld is, en of het blijft, en wat men er van moet verwachten. Het is haast alsof men de overtuiging heeft dat je het kan beantwoorden in termen van ben je politiek links of rechts? Om die analogie even voort te borduren: we weten allemaal dat het onderscheid tussen links en rechts vrij slecht werkt. Bijvoorbeeld men kan links zijn op zaken van klimaat en rechts op zaken van immigratie of andersom. Eigenlijk zijn zaken als hoe overheidsfinanciën geregeld moeten worden of wat we vinden van medisch-ethische zaken niet zomaar te vangen in een simpele tweespalt. Zelfs met de toevoeging van progressief of conservatief kom je er niet gauw. Toch is de vraag van tribalisme net als met veel andere labeltjes en kwestie van in-crowds: Wil je bij ons horen of niet? Die onderliggende gevoelskwestie voel ik vaak ook bij tech: ben je voor of tegen ChatGPT?
Als computerwetenschapper heb ik sterk de neiging om uit te leggen wat voor technieken er relevant en interessant zijn in ChatGPT, en daarbij waarom large language models eigenlijk nog veel grotere corpora nodig hebben. Echter, ik moet mezelf hier beheersen omdat anders zo’n 99% interesse verliest. Je denkt dat je het wilt weten, maar uiteindelijk wil iedereen een beetje magie heb ik gemerkt. Men is onder de indruk van wat ChatGPT kan, maar als ik kort probeer uit te leggen wat het probleem is, dan volgen er behavioristische stuiptrekkingen. Want het enige wat voor veel mensen er toe doet, is het gedrag van zo’n stuk technologie en als ik dat betwist dan verschijnt er vaak een 404 pagina op hun gezicht. Om ChatGPT goed uit te leggen – en wat wij ermee moeten – ga ik een vraag stellen die vooral bij ChatGPT van grappig is. Hoe werkt de intentie van de auteur bij ChatGPT?
De intenties van een auteur
In literatuurkritiek is er een debat over de vraag of de auteur relevant is voor de betekenis van een tekst. We kunnen als lezer ons afvragen wat de auteur heeft bedoeld met een tekst. Echter, doet dat ertoe? Wie heeft uiteindelijk de betekenis in handen van een tekst, de auteur of de lezer? Is het nodig om wat van Kurt Vonnegut te weten – en zijn liefde voor sciencefiction – om Slaughterhouse 5 beter te begrijpen? Is Kurt Vonnegut de arbiter van de waarheid als het aankomt op zijn teksten? Of is het de tekst die voor zichzelf spreekt en door ieder individu dat het oppakt opnieuw in een context geplaatst wordt. Of zit het ertussenin dat iedere lezing van de tekst op Gadameriaanse wijze een herijking is van realiteit dat het een proces van interactieve hercontextualisatie is waarbinnen we de tekst moeten begrijpen – en dus dat zowel de kennis over Kurt Vonnegut de tekst kan vervormen als de tijdgeest waar de lezer zich in waant?
Ik snap dat dit soort vragen niet aan iedereen besteed is, maar dit is relevant voor ChatGPT. Dit stuk technologie produceert teksten. Wie is de auteur van die teksten en is de intentie erachter belangrijk? Er is een analogie voor ChatGPT die ook meteen inhaakt op het debat over tekst intentie. Het klassieke voorbeeld dat ik hier meteen van stal haal zijn aapjes en typmachines. Voor iedereen die de infinite monkey theorem niet kent: Gegeven genoeg tijd – en genoeg aapjes (of één onsterfelijk aapje) – zullen de aapjes die willekeurig toetsen inrammen ooit elke mogelijke tekst schrijven. De kans is haast nihil, maar gegeven statistiek is het ook niet nul.
Echter, wat is de waarde van die tekst? Als Don Quixote precies herschreven is in deze nieuwe context, is het dan werkelijk wat waard? De connectie tussen aapjes en ChatGPT is ergens makkelijk en snel gemaakt. We hoeven slechts oneindig veel vragen te stellen, totdat er in hapklare brokjes wel een keer een geschreven tekst uit rolt. Natuurlijk, ChatGPT gebruikt meer input en is minder arbitrair dan aapjes die op typmachines rammen, maar laten we er voor nu nog even geen onderscheid tussen maken.
Deze aapjes/ChatGPT Don Quixote tekst, wie draagt daarvan de betekenis? Het is een ingewikkelde propositie, want ik kan wat leren als lezer van de tekst. Ik kan er dingen bij voelen en overwegen. Het kan zogezegd iets met mij doen. Tegelijkertijd vraag ik mij af of het wat met me zou doen als ik wist dat aapjes dat boekwerk hadden geproduceerd. Want dan heeft niemand het zo bedoeld. Als ik kijk naar natuur en daar een persoonlijke onthulling door krijg, mij opeens besef hoe de liefde werkt, of een eureka moment over de innerlijke werking van een algoritme, is dat dan de intentie van die natuur?
Barthes probeert, in zijn bekende artikel over The Death of the author, net als een paar anderen eigenlijk te stellen dat de auteur dood is omdat de tekst te gelimiteerd zou zijn als het slechts de auteurs intentie is die er toe doet. Voor iemand die ook kennis heeft van filosofie van technologie is dit een bekende insteek. In filosofie van technologie zijn unintended uses, zeker een onderwerp van gesprek. Denk bijvoorbeeld aan het gebruik van een oud mobieltje als deurstop, of zoals ik het op vakantie wel eens gebruikte: als frisbee. Denken dat slechts de maker de heilige intentie heeft van de technologie is daar een limiet op zetten en ook simpelweg niet hoe we tech gebruiken. Dan zou het fout zijn om mijn mobieltje over te gooien als een kleine slecht werkende frisbee. Barthes beargumenteert eigenlijk hetzelfde over de betekenis van teksten.
Een simpel voorbeeld voor een tekst is een ironische of sarcastische tekst die opgevat wordt alsof het serieus is. Denk bijvoorbeeld aan een artikel van De Speld dat door een lezer onbedoeld als waar aangenomen wordt. In het geval van nieuws is het dan meteen misinformatie, zeker als de tekst feitelijke onjuistheden bevat, maar als het literatuur is, als ik Slaughterhouse 5 als een waanzinnig sci-fi boek lees over Tralfamadorians en niets echt snap van hoe Billy Pilgrims los komen van de tijd een briljant beeld van PTSS schept, of nog gechargeerder: als ik The Picture of Dorian Gray als lofzang lees voor simpel hedonisme, heb ik het dan fout?
In filosofie van techniek kunnen we unintended uses heel goed zien in een dilemma dat werd opgeworpen in de jaren negentig: The Collingridge Dilemma. Het dilemma stelt dat we niet kunnen overzien hoe die technologie gebruikt zal worden, en dat we dat ook nog eens totaal niet kunnen inschatten van tevoren. Was het bijvoorbeeld werkelijk de bedoeling dat we ChatGPT gingen gebruiken zodat scholieren geen essays meer hoeven te schrijven? Het lijkt mij niet, en iedereen met een half brein had dat kunnen zien. Dat zeggen we nu, maar er zullen nog veel andere neveneffecten zijn die we nu nog niet eens doorhebben. Unintended uses en daarmee de dood van de maker is in filosofie van technologie eigenlijk een gegeven.
Aangezien tekst (zeker literair) en kunst minder utilistisch is van insteek kunnen we het makkelijker hebben over de intentie van de kunstenaar dan dat van een programmeur. Bij Don Quixote van aapjes was er nooit een intentie om mij dat gevoel te geven. Echter, het gevoel dat ik kreeg, had ik ook van de werkelijk Don Quixote kunnen krijgen. Dus waar ligt dan het verschil? Als we het hebben over de intentie van de auteur dan kunnen we wel wijzen op het doel om iets te bewerkstelligen. Zoals kritiek leveren op de maatschappij en ridderlijke waardes, wat Cervantes (de werkelijke auteur van Don Quixote) wilde4. Dat zouden we meteen overboord moeten gooien bij de aapjes die tenslotte als intentie niets meer hadden dan toetsen in rammen.
Grappig genoeg botsen het idee van The Collingridge Dilemma en het idee van Barthes hier tegen elkaar op. De auteur is dood, want anders limiteert het de tekst. Maar in termen van The Collingridge Dilemma kan de auteur dus zoveel willen als hij wil, dat betekent niet dat die het ook voor elkaar krijgt. Of de auteur dood is of niet is eigenlijk irrelevant, want zelfs als de auteur een intentie heeft en we die zoeken is het nog maar de vraag of we die vinden en als we die vinden, of die dan ook op die manier begrepen wordt5.
Het lijkt nu of we uitkomen op het feit dat zowel tekst als technologie ongebonden is aan de auteur. De intentie van beide doet er niet toe omdat het aan de lezer is om te bepalen wat het gebruik ervan is. Echter, met tech is de aanname dat de maker dood is en ook niet weet hoe zijn spul gebruikt gaat worden een logische, simpelweg omdat de insteek van het voorwerp niet altijd helder is en het gebruik erg open ligt. De neveneffecten van technologie zijn daarbij heel helder onoverzichtelijk. Hier hoef ik alleen maar weer te zeggen dat niemand waarschijnlijk intentioneel bij ChatGPT: hé, nu gaan we lekker al die leraren even het leven zuur maken door studenten dit in handen te geven. Terwijl we bij een maker van tekst veel meer kunnen vragen(van de auteur) wat er aan de hand is, zo’n tekst kan gestoeld zijn op bepaalde principes of overtuigingen, zoals deze tekst dat bijvoorbeeld al is. We kunnen teksten in context plaatsen van andere teksten, van de tijdgeest, en op wie gereageerd wordt. Natuurlijk kan het jaren later nog iets anders betekenen, maar bij teksten lijkt het dus of de neveneffecten van een geheel andere orde zijn6.
Het onderscheid tussen auteurs
Hier moet ik echter het punt introduceren waarom ChatGPT deze vraagstelling zo helder en grappig maakt. ChatGPT wijst ons op het verschil tussen de schrijver en de programmeur. Het legt namelijk een vergeten aspect van de infinite monkey theorem bloot.
De aapjes in kwestie zijn namelijk ergens door iemand neergezet, in een of andere hal. Iemand heeft typmachines aan de lopende band moeten kopen en bananen om de aapjes te voeren. Kort gezegd, om de infinite monkey theorem waar te maken hebben we niet alleen te maken met die aapjes. We hebben ook te maken met en groot institutioneel fenomeen waar waarschijnlijk talloze mensen in rondlopen die onder andere: typmachines moeten repareren, apen moeten verzorgen, geschreven blaadjes moeten verzamelen, het moeten bundelen, en dan ook nog eens moeten verifiëren of het enigszins leesbaar is.
Als we dit veel willen versimpelen (lees: platslaan) zouden we kunnen zeggen dat er een persoon is die dit regelt – die de touwtjes in handen heeft – en dus de auteur is van het systeem. Om dit onderscheid expliciet te maken: er is in de infinite monkey theorem een auteur die teksten schrijft (de aap) en een auteur die de teksten financieert en het insitutionele aspect regelt. Ze zijn beide auteur van de tekst, want alhoewel de apen schrijven, hadden ze niets kunnen doen zonder tijd, eten, en gemaakte typmachines. In het geval van ChatGPT hadden studenten niets kunnen doen als er niet een heel onderzoeksteam aan de basis van stond en een geschiedenis van onderzoek naar Large Language Models en Artificial intelligence. Deze tweede auteur is nevelig en slecht te duiden als het gaat om termen van een individu, maar deze auteur/maker van het systeem, heeft hij of zij een hand in de in intentie van de tekst?
Voor ChatGPT zal ik even aannemen dat het geheel wollige institutioneel auteur zowel alle programmeurs als testers bevat (dit zijn dus een boel mensen). De institutionele auteur lijkt in ieder geval te moeten beseffen dat door het ontstaan van dit fenomeen er een onderscheid gemaakt kan worden tussen ‘normale’ teksten en ChatGPT-teksten. Het onderscheid is dus bewust in het leven geroepen. Als we zeggen iemand heeft aapjes in een grote loods geplempt, dan kan die persoon zich niet verschuilen achter het idee dat ze daar onbedoeld zijn. Hoogstens kan iemand zich verdedigen met het idee dat ze er geen actieve herinnering aan hebben en dat alle aapjes en het hele instituut een grote verstandsverbijstering voor ze is. Echter dan moeten we ze misschien een functie elders toewijzen, een met beduidend minder verantwoordelijkheid.
Het punt is dat dit onderscheid tussen teksten bedoeld de wereld is ingeworpen. Zelfs als je stelt dat men wil zien of het “kan,” dan nog steeds is het dus met intentie gedaan. We kunnen het hebben over de onbedoelde gebruiken van technologie, maar als je een technologie maakt die teksten genereert, kun je niet opeens zeggen dat dit niet de bedoeling was. Dat is een bom bouwen en zeggen dat het niet je bedoeling is iets op te blazen. Je kunt verwachten dat er iemand langs komt met een lucifer. Je kunt stellen dat het gebruik in het klaslokaal niet de bedoeling is. Echter, wat we moeten erkennen is dat niet alles van technologie over uses gaat. Een deel gaat simpelweg ook over de premisse van technologie. In dit geval kun je stellen: het automatisch genereren van teksten, al verwoord ik het liever als het produceren van niet-menselijke teksten.
Deze premisse – en daarmee ook het institutionele gedeelte van de auteur – kan niet miskend worden. In het geval van aapjes kan deze maker inschatten dat – indien er sprake is van onsterfelijkheid en diens naam verschijnt onder geschreven teksten van apen – dat alle boeken onder zijn naam verschijnen. Is het hier te overzien wat de consequenties zijn? Weet deze auteur wat hij hiermee de wereld in slingert?
Wat deze auteur in ieder geval weet is dat, met de introductie van aapjes in de maatschappij, wij burgers plots blootgesteld worden aan een nieuw fenomeen. We hebben opeens onszelf te verhouden tot dit ding: aapgegenereerde teksten. Dit geldt eveneens voor zaken zoals Google’s gigantische knowledgebase of Tinder’s algoritme. Weg zijn de dagen dat iedereen gebonden was aan het echte leven om liefde te ontmoeten, nu kan het ook gewoon digitaal. In essentie is de institutionele auteur een verkenner van grond. Met het ontwikkelen van zo’n fenomeen is er nieuw terrein bijgekomen waar we onszelf op kunnen begeven. We kunnen mensen digitaal ontmoeten versus offline.
Door de aapjes en ChatGPT, is er dus opeens een nieuw onderscheid in de wereld geslingerd: dat wat geproduceerd is door zelf te schrijven en dat wat ondersteund is door een AI-systeem. Elke maker die zichzelf naar binnen ramt in een bepaalde sfeer zal daarmee dus een nieuwe ruimte maken. We hoeven alleen maar te denken aan hoe Uber dat heeft gedaan met taxi’s of AirBnB met de hotelindustrie. Dit hele onderscheid wordt dus iets waar men dan rekening mee moet houden7. Ik stel hier plots moeten in plaats van kunnen, want we moeten ons in ieder geval verhouden tot het fenomeen. We moeten er tegen of voor zijn, of het moet ons koud laten, maar we moeten er iets mee. Zelfs als we het stelselmatig negeren worden we blootgesteld aan ons negeren.
Het voorbeeld hiervan is mijn mobiel die mij niet in staat stelt QR-codes te scannen. Als ik in een restaurant zit waar de kaart alleen met een QR-code te vinden is, ben ik dus meteen blootgesteld aan dit stukje technologie waar ik niets mee kan. Op technologisch vlak ben ik te arm, te dom, of te onhandig om toegang te krijgen tot die ruimte. Hierin zit dat moeten en dat is pas voorbij wanneer de strijd tussen de opties volledig voorbij is. Om terug te komen bij Tinder, pas wanneer we volledig digitaal liefde zoeken en het uitgebannen is in de offline sferen, pas dan zal er weer een soort uniformiteit ontstaan.
De premisse van technologie, kort samengevat als het bouwen van nieuwe ruimtes, stelt ons dus wel degelijk een verplichting. We moeten ons verhouden tot een fenomeen. Dat er dan onbedoelde gebruiken zijn die de maker niet voorzien had, is zeker iets wat we niet kunnen ontkennen. Hier komen we dan eigenlijk terug bij af. Want het klopt dat de auteur dood is en dat de maker niet kan inschatten wat de consequenties (lees: uses) zijn van de technologie. Echter, de premisse van de technologie en tekst, ongeacht wat auteur/maker heeft bedoeld is wel het creëren van een fenomeen. Want dit bouwen van ruimtes geldt eveneens voor auteurs die boeken schrijven. Ongeacht wat de tekst eenmaal doet wanneer deze de wereld in gaat, de schrijver is zich bewust van het feit dat de geschreven tekst nu eenmaal iets zal doen, op een manier die anders is dan de ongeschreven tekst die nooit geschreven blijft. Iedere tekst is in dat opzicht een minuscule variant van de kamers die bedrijven zoals Uber en Tinder oprichten. Het kan zijn dat een tekst een leven verandert zoals een aantal teksten mijn leven wezenlijk hebben veranderd (al kan ik dat natuurlijk niet bewijzen.). De auteur is zich er van bewust dat sommigen die blootgesteld worden aan de tekst zich er toe moeten verhouden – al is het slechts een koppige partner die de tekst niet wil lezen.
Het verschil tussen maker en auteur kunnen we in termen van die premisse dan wel uitvergroten. Deze tekst heeft een afzetmarkt, een bepaalde groep lezers, maar dat is onvergelijkbaar met het boek Nooit Meer Slapen van Hermans, bijvoorbeeld. Maar als we nadenken over hoeveel mensen dagelijks zoeken op Google (er zijn zo’n vijf en een half miljoen zoekopdrachten per minuut). Dan kunnen we in termen van schaal simpelweg wel zeggen dat de ruimte waartoe we ons moeten verhouden van een dusdanige andere kardinaliteit is dat ze in andere categorieën vallen.
We hebben nu grip op het verschil tussen gebruiken en de premisse, maar wat zegt dat precies over de intentie van de auteur? En over welke auteur moeten we dan spreken?
Het onderscheid tussen type auteurs, wordt door Harvey Hix in Morte D’Author: An autopsy ook gemaakt. Hij schetst de auteur als origine van een tekst (institutioneel) en auteur als effect (geschreven tekst / de aapjes). De mensen die tegen de dood van de auteur zijn – en dus zich willen beroepen op de intentie van de auteur – kijken naar degene die de aapjes beheert, die kritiek wil leveren zoals Cervantes dat deed. De groep voor de dood van de auteur zoekt eigenlijk naar het effect van de tekst en hoe de lezer het opvat. Het onderscheid klinkt wat als semantisch gekonkel, maar voor zowel programmeurs als auteurs is dit onderscheid dus wezenlijk in termen van intentie en het belang ervan. Want we kunnen in ieder geval stellen dat de auteur als origine (het institutionele aspect) zich bewust is van het feit dat er een onderscheid gemaakt zal worden.
Dus, terug naar ChatGPT. Hier is een onderscheid te vinden opmerkelijk anders dan de aapjes metafoor omdat we met onze prompts vrij letterlijk intentie verklaringen hebben: ‘leg mij dit uit in de taal van Trump’, en ChatGPT gaat rollen – daar zit een intentie in die we letterlijk kunnen lezen – namelijk de prompt die we gaven – maar is dat wel volledig? Want ChatGPT gaat op een eigen manier met die prompt aan de haal. Wat voor intentie zit daar? Kunnen we zeggen dat het de intentie van de ‘promptwizard’ is, of zit er een soort ‘betekenisloze’ aapachtige toevalligheid in ChatGPT’s interpretatie daarvan? Want wij schrijven de tekst uiteindelijk niet8.
En dat niet schrijven maakt onze intentie als ‘promptwizard’ onduidelijk, want in eerste instantie lijkt het op de intentie van onszelf plus een bak statistiek. Echter, stel je voor dat de institutionele auteur andere aapjes (of data) erbij had gepakt en dus eerst andere teksten zou produceren – natuurlijk zijn het uiteindelijk alsnog alle teksten – maar het is wel een andere volgorde, en dat zou weer effect kunnen hebben op de tijdgeest van mensen die prompts opstellen. Als Google stelselmatig (onbedoeld of niet) klimaatsceptische dingen van de eerste pagina weert, heeft dit dan effect op het maatschappelijk denken? Voor ChatGPT is er sprake van data, maar ook van de ‘promptwizard’ die alles vraagt aan ChatGPT. Wat voor antwoord er echter uit ChatGPT rolt is onlosmakelijk verbonden aan de keuzes van de institutionele auteur die bepaald heeft wat voor soort data gebruikt werd en hoe het ding werd getraind.
Hier moeten we dan toch echt een onderscheid gaan maken tussen aapjes en ChatGPT. Ik had beloofd er nog op terug te komen dat ChatGPT en de aapjes niet helemaal gelijk zijn, en als het belangrijk wordt dat we weten welke aapjes waar zitten, dan moeten we daar ook iets dieper in duiken. Hiervoor moeten we zien dat aapjes die op typmachines rammen een statistische onwaarschijnlijkheid hebben die niet geëvenaard wordt door ChatGPT. Het model wordt getraind op heel veel tekst, het heet niets voor niets een Large Language Model.
Gedurende het trainen van het algoritme wordt er geprobeerd te leren wat het waarschijnlijke woord is dat op een woord volgt, voordat het overgaat op nadenken over classificatie of categorisatie of genereren. In de collegebanken leerde ik over uni-grammen bi-grammen, tri-grammen, en N-grammen – en die kunnen het concept vrij helder maken. Bij ChatGPT willen we eerst weten welke woorden waarschijnlijk op elkaar volgen. Voor uni / bi / tri betekent vooral dat er dus gekeken woord naar een bepaalde hoeveelheid tekst (1 of 2 of 3 of n woorden) als raamwerk. Bij een trigram wordt er dus gekeken naar de vorige 2 woorden om te bepalen wat de volgende is. Als je dan een paar miljard woorden hebt in je corpora, dan zal er statisch een waarschijnlijkheid optreden dat bijvoorbeeld jam en brood dichter bij elkaar zitten dan jam en stoeptegel9. De woorden ‘jam’ en ‘brood’ staan vaker na elkaar, of in ieder geval dichter bij elkaar in de buurt en die relatie kun je uit tekst halen. Om het volledig plat te slaan: ChatGPT werkt door eerst waarschijnlijkheden te gebruiken om output te geven.
Als we de techniek van ChatGPT samennemen met het aspect van de institutionele auteur vinden we dus nog wel iets wat een uitweg biedt voor de maatschappelijke kwestie of het gebruik acceptabel is. Ongeacht of we het willen hebben over de intentie van de tekst kunnen we iets zeggen over de intentie van de institutionele auteur. Die bepaalt dat zulke teksten geschreven worden en onder welke voorwaarde dat gebeurt.Het onderscheid dat de institutionele auteur maakt tussen ChatGPT teksten en gewone teksten kunnen we op zichzelf moreel al op tegen zijn. Bij literaire teksten is een intended use misschien niet altijd even helder, maar bij tech zoals ChatGPT kunnen we in breedste zijn wel zeggen dat er een intended use is, namelijk het maken van teksten. Het is dus niet zozeer de inhoud, maar juist de vorm die het probleem veroorzaakt. Ik stel dat er drie heldere problemen zijn. Waarvan de premisse van technologie – in het geval ChatGPT teksten produceren – de grootste is. De andere twee zijn onbedoelde discriminatie en versmalling van de vrijheid.
De problematiek van de ChatGPT
De twee ietwat technische problemen zijn simpeler uit te leggen en hebben te maken met de puur technische kant van ChatGPT. Deze technologie is getraind op een gigantische hoeveelheid tekst10. In essentie betekent het dat, omdat we gebruikmaken van een corpus (de deftige term voor een collectie teksten), we eigenlijk minder moeten spreken van aapjes die zomaar rammen en meer moeten denken in termen van aapjes die semiabitriar woordjes uitkiezen uit een gigantische hoop tekst. Semiarbitrair is hier het goede woord, want omdat we natuurlijk nette zinnen willen hebben moet het model wel goede teksten kunnen produceren. Vandaar dat we ook kijken naar de statistische waarschijnlijkheid tussen woorden. Als het opeens schrijft: Green dreams sleep furiously. Dan beginnen we al gauw te twijfelen of de auteur van dit werk wel taal begrijpt, tenzij de auteur in kwestie Chomsky heet, dan vergeven we het hem allemaal11. ChatGPT is dus eigenlijk voor een deel een statistiektrucje aan het doen om te bepalen welk woord op elk ander moet volgen – gebaseerd op andere teksten. Er vallen dus een hele hoop woorden af en er wordt gecorrigeerd op wat er al was.
Hier moeten we meteen erkennen dat dit een probleem met zich meedraagt. Oudere teksten bevatten misschien ouderwetse waardes over mannelijkheid en vrouwelijkheid (en hebben daardoor minder oog voor gevoeligheden van nu), of gebruiken woorden die we nu discutabel vinden (zoals bepaalde groeperingen primitief noemen). Natuurlijk kunnen we hier wel op selecteren, maar als we vijftig jaar verder zijn zitten we weer met teksten van nu die dan niet meer door de beugel kunnen. Je zou dus ergens ook een beetje moeten denken aan ChatGPT alsof het je oom is die nog steeds serieuze scheldwoorden gebruikt voor zwarte mensen, terwijl dat echt als nagels op een krijtbord voor je klinkt. Zelfs als dat soort woorden niet gebruikt wordt, zit de waarschijnlijkheid van zulke relaties er wel ingebakken.
De waarschijnlijke discriminatie en seksisme van zulke algoritmes daargelaten, als een student of scholier gebruikt maakt van ChatGPT om een tekst te schrijven ontvouwt zich een bizarre mogelijkheid. Niet alleen kunnen we de auteur beschouwen als dood omdat de tekst op zichzelf kan staan. De auteur sterft in dat proces ergens tweemaal omdat de bandbreedte van dat schrijven op zichzelf is ook nog versmald. Diversiteit van vorm – naast diversiteit van inhoud – gaat verloren omdat het ten eerste een eenvoudige (niet simpel maar enkel) uiting is – ChatGPT is getraind en heeft misschien wat beweegruimte, maar is niet equivalent aan het open spectrum van mensen die dingen lezen. Tevens, heeft het een gebrek van openheid in spelregels.
En natuurlijk kan men hier tegenin brengen dat ook wij geleerd worden te schrijven op een bepaalde manier, en dat het niet te bewijzen is dat zoiets als ChatGPT werkelijk minder divers is. Dat gegeven geef ik meteen toe: Ik heb de cijfers niet. Maar het idee alleen al, dat zo’n tekst gebaseerd op waarschijnlijkheden van woorden die naast elkaar horen te staan – want dat is uiteindelijk waar NLP om draait – geeft aan dat er een gebrek aan speling is, aanbreken met de regels, aan de vrijheid en ongebondenheid van de menselijke geest12. Statistische waarschijnlijkheid mag handig zijn om de correlatie tussen kaasconsumptie en zelfmoord bloot te leggen, het is bepaald geen goede basis voor het schrijven van poëzie.
Bovenal kunnen we erkennen dat de institutionele auteur willens en wetens een onderscheid aan het maken is tussen ChatGPT teksten en menselijke teksten. Zelfs als dit met goede bedoelingen is – en het misschien heel erg positieve kanten kan hebben voor de mate waarin we tekst genereren – kunnen we op dit onderscheid zelf tegen zijn. We zijn geneigd om te denken dat een verscheidenheid aan keuzes de vrijheid verbreed voor mensen. Echter, wat veel blijkt met zulke technologieën is dat we vereist zijn om meer te doen. Willen we het grootste aanbod aan mogelijke partners dan moeten we niet alleen offline zoeken, we moeten ook toetreden tot de Inner Circle, Tinder, Happn, Bumble, Hinge en nog meer. Onze toevlucht in zulke apps – waar we allemaal een account bij moeten hebben en onze dierbare minuten aan moeten spenderen – is de manier geworden waarop de verscheidenheid aan partners het grootst is. Terwijl dit ook al het geval was toen dit gehele idee nog niet bestond. In de offlinewereld voor liefde had iedereen gelijke toegang. In termen van auteurschap beschouw ik dit onderscheid niet alleen als de dood van de auteur, maar we nagelen hem ook nog eens aan het kruis van technologische vooruitgang. Het onderscheid tussen menselijke teksten en ChatGPT teksten is dus eigenlijk een verlies voor de algehele groep ‘tekst’ omdat we nu niet alleen moeten nagaan of de auteur dood is, maar ook of die überhaupt ooit geleefd heeft. We hebben ons te verhouden tot een nieuw fenomeen, en niemand heeft ons ooit gevraagd of dit wenselijk is.
We kunnen stellen dat deze ruimtes misschien een verandering zijn voor sommige omdat ze beter kunnen chatten dan kunnen praten, en we geven ze daarmee dus hoop op een goede toekomst. Echter, dit is weer een consequentie en heeft het totaal niet over de premisse an sich en de verplichting die wij ertoe hebben.
Als we helemaal terugkomen bij de intentie van de auteur in ChatGPT, dan stel ik dat het, op vlak van tekst, niet veel meer is dan statistiek en dat dit een slechte basis is voor een betekenisvolle interactie. Echter, de intentie van de auteur bij ChatGPT – wie die fabelachtige auteur dan ook mag zijn – dwingt ons in verhouding tot een nieuw fenomeen. Toevallig zijn in dit geval leraren de dupe ervan, maar het had ook een volledig andere groep kunnen zijn. En het is die intentie, die we best kwalijk kunnen vinden op zichzelf. Desalniettemin stoten we hier wel meteen tegen het lijf van een bepaalde groepering aan, namelijk de deterministen13. Zij zullen zeggen: ‘Wen er maar aan. De technologie gaat het toch wel veranderen.’
Het antwoord is dus dat we niet kunnen inzien wat de technologie gaat doen, afgezien van het feit dat het iets gaat doen. De premisse van tech – dus wat het doet, denk teksten produceren, liefde vinden, informatie verschaffen – is echter iets wat we kunnen doorgronden. Daarop kan men wel veroordeeld worden. Dat is namelijk geen onbedoeld neveneffect, maar simpelweg algemeen gebruik. Je kunt stellen dat ChatGPT niet bedoeld is om in klaslokalen essays te maken, maar wel dat het bedoeld is om teksten te maken. Hetzelfde kun je zeggen over deepfakes, daar kun je stellen dat er foto’s worden gegenereerd. Misschien hebben de makers van ChatGPT niet ingezien wat het zou doen met klaslokalen, maar het onderscheid an sich tussen ChatGPT teksten en normale teksten kunnen we ze al kwalijk nemen. Idem voor Uber en Tinder en AirBnB. Hier komt dan ook de aap uit de mouw. Als we de gevolgen willen bespreken van technologie zoals: hoort het in het klaslokaal? Dan geven we via The Collingridge Dilemma alle institutionele auteurs een vrijbrief om te doen wat ze willen. Want ze kunnen zich dan verschuilen achter: wij hadden het ook niet verwacht! Terwijl, als wij het erover eens zijn dat dat zulk onderscheid op zichzelf een moreel oordeel draagt, dan kunnen we deze mensen verantwoordelijk houden. Wat ons dan rest is een maatschappelijke discussie – wanneer zulke technologieën zich aandienen – of het werkelijk iets is dat wij moeten ambiëren. Dat is zeker een ingewikkeld vraagstuk, maar hier kunnen we in ieder geval nog een raamwerk voor bedenken. En dat hoeft niet een neoliberale oplossing te zijn zoals de deterministen stiekem suggereren. Want die stellen: implementeer er maar op los, want het gaat gebeuren. De rest die misschien niet zit te wachten op dit alles zit dan eigenlijk met de geïmplementeerde gebakken peren. Die insteek negeert dus mijns inziens steevast een belangrijk moreel vraagstuk.
We kunnen blijven twisten over de vraag of de tekst betekenis draagt en of voor technologie de intentie van de auteur geëerd zou moeten worden, maar afgezien daarvan – zelfs als we meegaan in het concept dat het ‘de taal’ is die ‘spreekt’ en dat de auteur irrelevant is zoals Barthes wil suggereren, zelfs dan kunnen we de ruimte die de makers van ChatGPT intentioneel creëren – in het onderscheid tussen menselijke en niet-menselijke teksten – immoreel vinden. Dat is nog afgezien van het feit dat zulke teksten niet geproduceerd zijn door de menselijke geest en daardoor hoogstwaarschijnlijk veel van haar veelzijdigheid verloren zal hebben. Over het algemeen dwingen zulke technologieën ons om rekening te houden met een nieuw onderscheid in deze al bizar drukke en veranderende wereld, en dat punt is op zichzelf al het overwegen waard.
Eindnoten
1Irrelevant aan het grotere geheel, maar is iedereen het ook opgevallen dat planned obsolesence niet alleen hard de norm is geworden, maar dat de levensduur van technologie ook nog eens dramatisch verkort? Ik vraag mij af of er niet een soort Moore’s Law is voor dit fenomeen, al betwijfel ik of die linear verloopt. Ik ben bang dat dit polynomisch is.
2Voor een groot gedeelte van de geschiedenis lag het onderzoek naar neurale netwerken stil omdat de hardware het simpelweg niet toeliet. Als we even teruggaan in de tijd, dan zien we de logische calculus van McCulloch & Pitt al ontwikkeld worden in 1943! – een lange tijd voor AI dat pas in 1956 echt een term werd – Het concept van digitaal neuron vormt zich daar, maar het duurt dan nog decennia voordat de hardware het werkelijk mogelijk maakt.
3Mijn vermoeden is dat zoiets nog zal gebeuren en dat het iets van een GAN (Generative Adversarial Network) is of een nakomeling ervan.
4Cervantes blijkt gezegd te hebben dat hij het boek schreef om kritiek te hebben op die lege en ijdele boeken over hoofsheid.
5Een van de meeste prangende voorbeelden die hier in mijn hoofd op komt, is de relatie tussen Wittgenstein and de Wiener Kreiss. Wittgenstein’s Tractatus had deels het doel om te tonen wat taal kon – en voornamelijk wat het niet kon. Er werd ruimte voor het mystieke gemaakt en het is juist dat deel dat de Wiener Kreiss volledig negeerde. Misschien helderder voor hen die niet in de filosofie zitten, David Foster Wallace geeft een ander voorbeeld in Greatly exaggerated. Daar beschrijft hij hoe Salinger niet naar de rechtbank hoefde toen John Lennon doodgeschoten werd – en dat lijkt mij eveneens heel logisch.
6Als kritiekpunt zouden we het over heilige boeken kunnen hebben. The Collingridge Dilemma is in dat opzicht daar springlevend en een interessant onderzoek op zichzelf. Hier heb ik niet meteen een antwoord op.
7Hier moeten ik natuurlijk vermelden dat niet iedere Uber of AirBnB dit probleem heeft. Het gaat om de grote jongens. Als ik nooit word blootgesteld aan een klein Deense variant van een Uber dan hoef ik daar ook waarschijnlijk geen rekening mee te houden.
8Ik beroep mij voor dit argument op Wittgenstein’s rule-following paradox, wat ver buiten de rijkweidte van dit artikel ligt. Naast het algemene feit dat het totaal niet helder is hoe zulke teksten tot stand komen. Ik hoorde een professor aan de TUDelft – binnen computerwetenschappen – ChatGPT ook beschrijven als licht ondoorgrondelijk.
9Ik heb hier venijnige kritiek op, maar voor het doeleinde van dit essay, zal ik die hier niet poneren. Het is de aanname die in natural language processing gedaan wordt. Waar we het voor nu bij zullen laten.
10GPT-1 een voorganger van ChatGPT maakte al gebruik van meer dan 7000 boeken.
11Een vriendin maakte hierbij de opmerking dat er een soort fenomenologisch onderscheid zit tussen type teksten. Bij een menselijk geschreven tekst zoeken we al gauw toch intentie achter zo’n zin van Chomsky. Terwijl we dat inderdaad bij automatische teksten eerder beschouwen als een fout. De stelling dat de auteur dood is, en onze zoektocht naar betekenis in tekst, lijkt dus ergens wel te vergen dat de auteur ooit geleefd heeft.
12Als je hier wilt stellen dat de menselijke geest niets meer is dan statistiek, dan hebben we een ander gesprek nodig. Of moet ik misschien tegen je gaan schreeuwen en je de kamer uit joelen zoals ik met menig computerwetenschapper wil doen. Ik heb het gevoel dat beide niet zullen werken.
13Deterministen refereert aan technologische determinisme: Het geloof dat technologie zal oprukken of we het nu willen of niet. Een betwijfelbare overtuiging als je het mij vraagt – maar ook ver buiten de reikwijdte van dit artikel.

