Kunstmatige Intelligentie
Il Dotore Cesare Lombroso
Amsterdam, 19 feb. 2021—
Frenologie klinkt echt hopeloos ouderwets. Alsof het thuishoort in een geschiedenisboek, ergens tussen aderlating en velocipedes. Iets van ver achter onze moderne maatschappij, van meer dan honderd jaar geleden. We zouden graag denken dat het beoordelen van de waarde van mensen op basis van de grootte en vorm van hun schedel een praktijk is die ver achter ons ligt. De frenologie steekt echter opnieuw zijn klonterige kop op.
In de afgelopen jaren hebben algoritmen voor machine learning overheden en particuliere bedrijven de mogelijkheid beloofd om allerlei soorten informatie uit het uiterlijk van mensen te halen. Verschillende startups beweren nu kunstmatige intelligentie (AI) te kunnen gebruiken om werkgevers te helpen de persoonlijkheidskenmerken van sollicitanten te detecteren op basis van hun gezichtsuitdrukkingen.
In China heeft de regering een pioniersrol vervuld in het gebruik van bewakingscamera’s die etnische minderheden identificeren en volgen. Ondertussen zijn er rapporten verschenen over scholen die camerasystemen installeren die kinderen automatisch bestraffen omdat ze niet opletten, op basis van gezichtsbewegingen en micro-expressies zoals wenkbrauw samentrekkingen.
Misschien wel het meest berucht, een paar jaar geleden beweerden AI-onderzoekers Xiaolin Wu en Xi Zhang een algoritme te hebben getraind om criminelen te identificeren op basis van de vorm van hun gezicht, met een nauwkeurigheid van 89,5 procent.
Ze gingen niet zo ver dat ze enkele van de ideeën over fysionomie en karakter die in de 19e eeuw de ronde deden, onderschreven, met name uit het werk van de Italiaanse criminoloog Cesare Lombroso: dat criminelen onderontwikkelde, onmenselijke beesten zijn, herkenbaar aan hun schuine voorhoofd en havikachtige neuzen.
Deze schijnbaar high-tech poging van de recente studie om gelaatstrekken die verband houden met criminaliteit te onderscheiden, is echter een rechtstreekse copie van de ‘fotografische composiet methode’ die is ontwikkeld door de Victoriaanse duizendpoot Francis Galton – waarbij de gezichten van meerdere mensen in een bepaalde categorie om de kenmerken te vinden die indicatief zijn voor kwaliteiten als gezondheid, ziekte, schoonheid en criminaliteit.
Technologie commentatoren hebben deze gezichtsherkenningstechnologieën gekenmerkt als ‘letterlijke frenologie’; ze hebben het ook in verband gebracht met eugenetica, de pseudowetenschap van het verbeteren van het menselijk ras door mensen aan te moedigen die het meest geschikt worden geacht om zich voort te planten. (Galton zelf bedacht de term ‘eugenetica’, die hij in 1883 beschreef als ‘alle invloeden die, hoe ver ook, de neiging hebben om de geschiktere rassen of bloedstammen een grotere kans te geven om snel te zegevieren over de minder geschikte dan ze anders zouden doen. heb gehad’.)
In sommige gevallen is het expliciete doel van deze technologieën om mensen die ongeschikt worden geacht, kansen die ze zouden toekomen te ontzeggen; in andere gevallen is het misschien niet het doel, maar het is een voorspelbaar resultaat.
Maar als we algoritmen afwijzen door ze als frenologie te bestempelen, wat is dan precies het probleem dat we proberen aan te geven? Zeggen we dat deze methoden wetenschappelijk gebrekkig zijn en dat ze niet echt werken – of zeggen we dat het moreel verkeerd is om ze toch te gebruiken?
De manier waarop ‘frenologie’ als een vernietigende belediging werd gebruikt, heeft een lange en ingewikkelde geschiedenis. Filosofische en wetenschappelijke kritiek op het streven zijn altijd met elkaar verweven geweest, hoewel hun verstrengeling in de loop van de tijd is veranderd.
In de 19e eeuw maakten de tegenstanders van de frenologie bezwaar tegen het feit dat de frenologie probeerde de locatie van verschillende mentale functies in verschillende delen van de hersenen vast te stellen – een beweging die als ketters werd beschouwd, omdat het christelijke ideeën over de eenheid van de ziel in twijfel trok. Interessant is echter dat het proberen om iemands karakter en intellect te ontdekken op basis van de grootte en vorm van het hoofd, niet werd gezien als een serieuze morele kwestie. Tegenwoordig is het idee van het lokaliseren van mentale functies tamelijk onomstreden. Wetenschappers denken misschien niet langer dat destructiviteit boven het rechteroor zit, maar het idee dat cognitieve functies kunnen worden gelokaliseerd in bepaalde hersencircuits is een standaardaanname in de reguliere neurowetenschappen.
De frenologie kreeg ook in de 19e eeuw empirische kritiek. Er waren debatten over welke functies waar waren en of schedelmetingen een betrouwbare manier waren om te bepalen wat er in de hersenen aan de hand was. De meest invloedrijke empirische kritiek op de oude frenologie kwam echter van de studies van de Franse arts Jean Pierre Flourens op basis van het beschadigen van de hersenen van konijnen en duiven – waaruit hij concludeerde dat mentale functies zijn verdeeld in plaats van gelokaliseerd. (Deze resultaten werden later in diskrediet gebracht.) Het feit dat frenologie werd afgewezen om redenen die de meeste hedendaagse waarnemers niet langer zouden accepteren, maakt het alleen maar moeilijker om erachter te komen waar we ons op richten als we ‘frenologie’ tegenwoordig als een smet gebruiken.
Zowel ‘oude’ als ‘nieuwe’ frenologie wordt bekritiseerd vanwege hun slordige methoden. In de recente AI-studie naar criminaliteit zijn de gegevens afkomstig uit twee zeer verschillende bronnen: foto’s van veroordeelden versus foto’s van werkwebsites voor niet-veroordeelden.
De onderzoekers geven met name geen commentaar op het feit dat de veroordeling zelf afhangt van de indrukken die politie, rechters en jury’s vormen van de verdachte, waardoor het ‘criminele’ uiterlijk van een persoon een verwarrende variabele wordt. Ze vermelden ook niet hoe intensief toezicht op bepaalde gemeenschappen en ongelijkheid in de toegang tot juridische vertegenwoordiging de dataset scheeftrekt. In hun reactie op kritiek gaan de auteurs niet terug in de veronderstelling dat ‘een crimineel zijn een groot aantal abnormale (uitbijter) persoonlijke eigenschappen vereist’. Hun kader suggereert zelfs dat criminaliteit een aangeboren kenmerk is, en niet een reactie op sociale omstandigheden zoals armoede of misbruik. Een deel van wat hun dataset op empirische gronden twijfelachtig maakt, is dat wie als ‘crimineel’ wordt bestempeld, nauwelijks waardeneutraal is.
Een van de grootste morele bezwaren tegen het gebruik van gezichtsherkenning om criminaliteit op te sporen, is dat het mensen stigmatiseert die al te veel worden gepolariseerd. De auteurs zeggen dat hun instrument niet mag worden gebruikt bij wetshandhaving, maar noemen alleen statistische argumenten waarom het niet zou moeten worden ingezet. Ze merken op dat het percentage vals-positieven (50 procent) erg hoog zou zijn, maar letten niet op wat dat in menselijke termen betekent. Die vals-positieven zijn personen wier gezichten lijken op mensen die in het verleden zijn veroordeeld. Gezien de raciale en andere vooroordelen die in het strafrechtsysteem bestaan, zouden dergelijke algoritmen uiteindelijk de criminaliteit onder gemarginaliseerde gemeenschappen overschatten.
De meest omstreden vraag lijkt te zijn of het opnieuw uitvinden van de fysionomie een eerlijk spel is met het oog op ‘pure academische discussie’. Men zou op empirische gronden bezwaar kunnen maken: eugenetici uit het verleden zoals Galton en Lombroso konden uiteindelijk geen gelaatstrekken vinden die iemand vatbaar maakten voor criminaliteit. Dat komt omdat er geen dergelijke verbanden te vinden zijn. Evenzo moesten psychologen die de erfelijkheid van intelligentie bestuderen, zoals Cyril Burt en Philippe Rushton, snel en los spelen met hun gegevens om correlaties te creëren tussen schedelgrootte, ras en IQ. Als er iets te ontdekken was, zouden de vele mensen die het in de loop der jaren hebben geprobeerd, waarschijnlijk niet droog zijn komen te staan.
Het probleem met het opnieuw uitvinden van de fysionomie is niet alleen dat het eerder zonder succes is geprobeerd. Onderzoekers die blijven zoeken naar koude kernfusie nadat de wetenschappelijke consensus verder is gegaan, krijgen ook kritiek omdat ze eenhoorns achtervolgen – maar de afkeuring van koude kernfusie blijft verre van schande. In het ergste geval worden ze gezien als tijdverspilling.
Het verschil is dat de mogelijke nadelen van onderzoek naar koude kernfusie veel beperkter zijn. Sommige commentatoren zijn daarentegen van mening dat gezichtsherkenning net zo streng moet worden gereguleerd als plutonium, omdat het zo weinig niet-schadelijke toepassingen heeft.
Wanneer het doodlopende project dat je wilt laten herrijzen werd uitgevonden met het doel koloniale en klassenstructuren te ondersteunen – en wanneer het enige dat het kan meten het racisme is dat inherent is aan die structuren – is het moeilijk te rechtvaardigen om het nog een keer te proberen, alleen voor de nieuwsgierigheid.
Onderzoek naar gezichtsherkenning ‘frenologie’ noemen zonder uit te leggen wat er op het spel staat, is echter waarschijnlijk niet de meest effectieve strategie om de kracht van de klacht over te brengen.
Als wetenschappers hun morele verantwoordelijkheden serieus willen nemen, moeten ze zich bewust zijn van de schade die het gevolg kan zijn van hun onderzoek.
Duidelijker uitleggen wat er mis is met het werk met het label ‘frenologie’ zal hopelijk meer impact hebben dan simpelweg de naam rond te gooien als een belediging.
Catherine Stinson
is postdoctoraal onderzoeker in de filosofie en ethiek van kunstmatige intelligentie aan het Centrum voor Wetenschap en Denken aan de Universiteit van Bonn in Duitsland, en aan het Leverhulme Centrum voor de toekomst van intelligentie aan de Universiteit van Cambridge.
Redactie Sally Davies