[if gte mso 9]> stefan stefan 2 3 2008-01-03T12:45:00Z 2010-03-20T23:49:00Z 1 2788 15336 zuid 127 36 18088 10.2625 [if gte mso 9]> Clean 21 MicrosoftInternetExplorer4 [if gte mso 9]> [if gte mso 9]>

 

Een schijn van

 

van

 

BAYESIAANSE STATISTIEK ACHT OP ONSCHULD LUCIA DE B. SUBSTANTIEEL

 

De zaak Lucia de B. is ook vanuit statistisch oogpunt hoogst interessant. Terwijl getuige-deskundigen dinsdag in het hoger beroep elkaar in de haren vlogen, rekenen Bayesianen voor dat de kans op onschuld hoger is dan menigeen denkt.

 

Wat is de kans dat Lucia de B. onschuldig is? Vorig jaar veroordeelde de Haagse rechtbank de verpleegkundige tot levenslang. Ze werd schuldig bevonden aan meervoudige moord en poging tot moord, tussen 1997 en 2001 gepleegd op patinten in Haagse ziekenhuizen waar ze toen werkzaam was. Maar niemand heeft Lucia de B. betrapt en ieder direct bewijs ontbreekt. Lucia de B. zelf ontkent dat ze ook maar n patint een haar heeft gekrenkt. Toch achtte de rechtbank, altijd beducht een verdachte ten onrechte te veroordelen, zich voldoende zeker van haar zaak.

 

In haar oordeel baseerde de rechtbank zich mede op een statistisch argument dat door getuige-deskundige Henk Elffers naar voren was gebracht. Elffers, verbonden aan het Nederlands Studiecentrum Criminaliteit en Rechtshandhaving, rekende via de dienstroosters van Lucia de B. en haar collega-verpleegkundigen uit dat, in geval de verdachte onschuldig was, de kans dat de `incidenten' zich toevallig tijdens haar diensten afspeelden gelijk was aan 1 op de 342 miljoen. Dus verwierp Elffers de hypothese dat het om toeval ging. Er was, zo stelde hij, ``een samenhang' tussen het optreden van de incidenten en Lucia de B.'s aanwezigheid tijdens die incidenten. Wat die samenhang inhield, liet Elffers in het midden. Dat was aan de rechtbank om uit te maken.

 

Sinds enkele weken dient het hoger beroep. Dinsdag getuigden voor het hof twee Amsterdamse hoogleraren die de aanpak van Elffers onder vuur namen. De moeizame discussie had veel weg van een Babylonische spraakverwarring (zie kader). Statistici, zo bleek in het Paleis van Justitie, kunnen op fundamentele punten binnen hun vakgebied hemelsbreed van mening verschillen.

 

Degens

 

En dat terwijl de statistici die dinsdag in Den Haag de degens kruisten allen tot de zogeheten `klassieke school' behoren. Die is tussen 1930 en 1960 ontwikkeld, met als grote voorman de Amerikaan Ronald Fisher. Er is echter ng een school: de Bayesiaanse statistiek, genoemd naar de Engelse dominee Thomas Bayes die als eerste langs die lijnen redeneerde - zijn Essays toward solving a Problem in the Doctrine of Chances verscheen postuum in 1763. De Bayesianen begonnen hun opmars in de jaren zestig van de vorige eeuw. Inmiddels trekken hun tweejaarlijkse internationale congressen ruim 600 deelnemers, die na gedane arbeid ketterse liederen zingen als `There's no Theorem like Bayes' Theorem'. Maar de groei verloopt traag. Op dit moment is 30 procent van de publicaties op het gebied van statistiek Bayesiaans.

 

Aart de Vos, econometrist aan de Vrije Universiteit en overtuigd Bayesiaan, wijt de terughoudende reacties van klassieke statistici aan het subjectieve element dat in de Bayesiaanse methode ligt besloten. Daar moet je van te voren schatten welke kansen je aan de mogelijkheden (zoals Lucia de B. is wel/niet schuldig) zou hebben gegeven, zonder kennis van de data. Die prior is dus subjectief, gestuurd door ervaring en gezond verstand, en dat valt verkeerd bij klassieke statistici. Volgens De Vos gaat het om een paradigmastrijd. ``De klassieke statistiek gaat uit van het bestaan van een vaste, zij het onbekende waarheid die zich manifesteert in waarnemingen met een toevalskarakter. De Bayesiaan hangt het kansbegrip op aan het feit dat mogelijke waarheden onzeker zijn en gebruikt waarschijnlijkheidsrekening om over deze kansen te leren. Het is een godsdienstoorlog en de tegenpartij wil gewoon geen ongelijk bekennen. Dat komt omdat statistiek in Nederland in handen is van mathematici. Het grote voordeel van Bayesiaanse statistiek is dat ze, in tegenstelling tot de klassieke aanpak, uit de voeten kan met praktische situaties waarin op basis van statistische informatie, dus onder onzekerheid, een beslissing genomen moet worden.'

 

Klassieke statistici beantwoorden systematisch de verkeerde vragen, aldus De Vos. ``Neem het geval van een gezin met zeven zonen dat graag een dochter wil. Stel dat in een klein aantal gezinnen een genetische factor veroorzaakt dat er alleen zonen komen, en dat het voor de rest fifty-fifty dochters en zonen is. Ons gezin vreest natuurlijk tot de eerste groep te horen. Immers, de op zeven zonen bij een van per keer bedraagt tot de macht 7 ofwel . Maar hoe groot is die op genetische aanleg voor zonen? Dat is de vraag waar het om draait - en die klassieke statistici uit de weg gaan. Vraagt het gezin: `Als we nog een kind nemen, hoe groot is dan de dat het een dochter is?' dan krijgen ze van die club als antwoord: `Als u, vr u aan kinderen begon, besloten zou hebben na zeven zonen te stoppen, dan had u minder dan 1 procent gehad dat die beslissing ten onrechte was geweest, en dat u gewoon een van een half op een dochter had gehad.'

 

``De klassieke statisticus doet zo moeilijk omdat hij niet weet hoe vaak die genetische factor speelt. De Bayesiaan schat die . Hij stelt bijvoorbeeld de verhouding abnormaal op normaal gelijk aan 1:1000. Dat zijn de prior odds. De gevraagde krijg je door die prior odds te vermenigvuldigen met de aannemelijkheidsverhouding, de likelihood ratio. Dat is hier de verhouding van de kansen op zeven zonen in een `louter zonen'-gezin versus een normaal gezin, dus 128:1. De regel van Bayes zegt: posterior odds = prior odds likelihood ratio, ofwel 128:1000. Dus is de dat ons gezin tot de categorie `louter zonen' behoort gelijk aan = 11,3 procent.'

 

Bayesiaanse en klassieke statistiek geven vaak praktische dezelfde antwoorden als er aan data geen gebrek is. Schort het daaraan, dan ontstaan verschillen. De Vos: ``In 1986 explodeerde kort na de start het ruimteveer Challenger door zes lekkende rubberen ringen. De klassieke analyse gaf toen achteraf een ontplofkans van 0,1 procent, Bayesianen kwamen uit op op 16 procent. Bij extreme gebeurtenissen kom je met Bayes hoger uit. Verzekeraars van olietankers willen bijvoorbeeld de weten op vier rampen binnen een zekere tijd, met het oog op failissement. Bayesianen komen dan tien keer zo hoog.'

 

Het klassieke antwoord geeft vaak het verkeerde signaal, vindt De Vos. ``De 1 op de 342 miljoen van Elffers is misleidend. Een gewoon mens denkt: `dat is geen toeval, dus Lucia de B. heeft het gedaan'. Dat is een grove denkfout, die in de zaak Sally Clark rampzalig uitpakte (zie kader). Alleen Bayesiaanse statistiek kan uitrekenen wat de is dat Lucia de B. het gedaan heeft. Daarvoor zijn subjectieve schattingen vooraf nodig, en dat krijg je van de klassieken dan ook op je brood. Maar je kunt die schattingen onderbouwen en preciseren met nader onderzoek. En het is zeer leerzaam tenminste een idee te hebben van de grootteorde van die .'

 

Elffers heeft zijn methode om aan 1 op 342 miljoen bij Lucia de B. te komen in het Nederlands Juristen blad (26 sept. 2003) toegelicht aan de hand van een fictief voorbeeld. In navolging van Elffers voert De Vos de fictieve verpleegkundige Lucy Klomp ten tonele. Ze heeft 11 sterfgevallen meegemaakt in een periode waarin n sterfgeval normaal is, maar iedere aanwijzing voor haar betrokkenheid ontbreekt. De Vos: ``Elffers zou het hof ook in dit geval een extreem kleine op toeval rapporteren, circa 1 op 100 miljoen. Terwijl ik beweer dat een veroordeling van Lucy Klomp 80 procent heeft ten onrechte te zijn.'

 

De berekening gaat als volgt. Vooraf: de dat je met een moordzuchtige verpleegster hebt is a priori (voordat je weet wat er aan de hand is) zeer veel kleiner dan dat het een onschuldige verpleegster is. Dat moet je afwegen tegen het feit dat de op 11 doden vele malen groter is in het geval `moordzuchtig' dan in het geval `onschuldig'. Als de kans op 11 doden 1 op de 100.000.000 is wanneer Lucy Klomp onschuldig is en 1 op 2 - waarover straks meer - wanneer zij wel schuldig is, dan is de likelihood ratio onschuldig tegen schuldig gelijk aan 1:50.000.000. De prior odds komen van de dat een willekeurige verpleegkundige moorden pleegt. Die schat de Vos 1 op 400.000. ``Er zijn veertigduizend ziekenhuisverplegenden in Nederland, dus dan zou eens per tien jaar een verpleger aan het moorden slaan. Ik hoop dat dat een overschatting is.' Bayes zegt nu dat de posterior odds bij elf doden uitkomen op 400.000 : 5.000.000, dus een van = 0,75 procent dat Lucy Klomp schuldig is.

 

Dat is slechts een tussenstand. De Vos: ``Het mooie van Bayes is dat je steeds informatie kunt toevoegen. Via prior odds kom je via data - elf sterfgevallen - op posterior odds, die dan weer prior odds zijn bij een volgende stap. Stel je zoekt verdachte aanwijzingen tegen Lucy maar vindt ze niet. Dat is vreemd bij zoveel moorden. Stel je dacht 20 procent te hebben niets verdachts te vinden als Lucy schuldig was. Bij onschuld is die 100 procent. Dat geeft een aannemelijkheidsverhouding van 5:1. Pas de regel van Bayes toe en de odds gaan van 8 om 1000 naar 40 om 1000, ofwel een kleine 4 procent op onschuld.'

 

Forensisch bewijs

 

Dan die 1 op 100.000.000. Dat cijfer is berekend op basis van een vaste op een sterfgeval die voor iedere verpleegkundige even groot is. Bayesianen, die onzekerheden meenemen, zouden veel hoger uitkomen. De Vos: ``Op basis van ervaring schat ik 1 op 2 miljoen. Verpleegkundigen verschillen: de een heeft meer ervaring dan de ander en ook de werkomstandigheden lopen uiteen. Een Bayesiaanse analyse van Elffers data zou dus wel eens kunnen uitwijzen dat de dat de op 11 doden onder normale omstandigheden 1 op 2.000.000 is, dus vijftig maal zo groot. Dan gaan de odds van 80 om 1000 naar 4000 om 1000. Dus 4:1 wat betekent dat Lucy een goede heeft - 80 procent - om onschuldig te zijn. Zonder forensisch bewijs is van wettig en overtuigend vaststellen van schuld dus geen sprake en rest het hof niets anders dan Lucy Klomp vrij te spreken. Of dat ook voor Lucia de B. geldt hangt af van al het overige bewijsmateriaal. Waarbij de Bayesiaanse methode bij uitstek geschikt is om deze aanwijzingen te wegen.'

 

Richard Gill, hoogleraar mathematische statistiek aan de Universiteit Utrecht, voelt, hoewel behorend tot het klassieke kamp, bij de zaak Lucia de B. meer voor de aanpak van De Vos dan die van Elffers. Gill: ``Beide zijn in hun eigen termen correct, maar de analyse van De Vos zou wel eens relevanter kunnen zijn. Elffers en De Vos beantwoorden verschillende vragen. Beide uitkomsten hebben sterke en zwakke kanten. Bij De Vos zijn veel cijfers uit de duim gezogen, zachte en harde gegevens worden door elkaar gehutst. Elffers test een hypothese op data die die hypothese suggereerden. Het hof zou beide procedures moeten volgen en dan op eigen verantwoordelijkheid, zich niet verstoppend achter formules, tot de juridisch en moreel juiste conclusie komen.'

 

De Vos vindt dat de rechter vooralsnog ``verrassend rationeel' handelt. ``De elf sterfgevallen an sich overtuigen niet, zoveel is duidelijk. De bijdrage van de statistiek is dat ze het hof uitnodigt om aanvullende informatie te vergaren. Precies wat er tijdens het hoger beroep gebeurt.'

 

Kritiek op Elffers In het hoger beroep in de zaak Lucia de B., dat sinds eind januari loopt, oefenden Ronald Meester en Michiel van Lambalgen, hoogleraren kansrekening en kunstmatige intelligentie aan de Vrije Universiteit en de Universiteit van Amsterdam, afgelopen dinsdag stevige kritiek uit op de werkwijze van Henk Elffers, verbonden aan het Nederlands Studiecentrum Criminaliteit en Rechtshandhaving en hoogleraar rechtspsychologie aan de Universiteit van Antwerpen. Omdat de bezwaren technisch van aard waren, en Meester en Van Lambalgen veel minder dan Elffers getraind zijn in de vertaalslag van statistiek naar het juridische domein, ging de uitleg van de twee nogal eens over de hoofden van het hof heen. ``We zitten weer op een verschillend niveau te praten', verzuchtte president mr. Von Brucken Fock na een uur.' De kritiek op de aanpak van Elffers spitste zich toe op twee punten. Omdat de hypothese was opgesteld na het vergaren van data, had Elffers op zijn uitkomst een zogeheten post-hoc correctie toegepast. Meester voerde aan dat onder statistici onenigheid bestaat over de wijze waarop dat moet gebeuren en dat er geen best denkbare post-hoc correctie is. Ook het model zelf werd aangevallen. Dat was erg simpel en trad niet buiten de situatie van Lucia de B. en haar collega's: 27 verpleegkundigen, 1029 diensten en 9 incidenten. In het model was de op een incident voor alle diensten gelijk. Alternatieve situaties die onderscheid maken tussen dag/nacht en ervaren/onervaren kon Elffers niet doorrekenen. Meester en Van Lambalgen riepen de vraag op of je niet andere afdeling van het ziekenhuis, of andere ziekenhuizen ook in het model zou moeten inbouwen. Het hof liet doorschemeren daar geen behoefte aan te hebben. ``Wij houden ons bezig met een reconstructie', zei Von Brucken Fock, ``een aantal gegevens staat vast, waarom zouden we het theoretische zijpad van 100 verpleegkundigen inslaan als het er 27 waren? En hoever wilt u gaan met het incorporeren van andere afdelingen, ziekenhuizen en zorginrichtingen? Komt het Paleis van Justitie ook in aanmerking?' De negatieve benadering van Meester en Van Lambalgen, die de waarde van de methode-Elffers ter discussie stelden zonder een alternatief te bieden, kon het hof niet bekoren. Het aardige van Elffers was juist dat hij het overzichtelijk en simpel had gehouden. Dat zijn model met zo min mogelijk gegevens werkte gaf niet, dan deed het hof de rest. Op complexe alternatieven, deels van epidemiologische aard, zat niemand bij het hof te wachten. Na de lunch kreeg Elffers gelegenheid tot weerwoord. De weergave van zijn werkwijze door de collega's was ``licht karikaturaal', vond hij. Hij had geen andere pretentie dan het beantwoorden van een eenvoudige vraag en hoe simpeler de methode, hoe liever het hem was. ``Waarom zou je je met 100 verpleegkundigen bezighouden? Het gaat om deze situatie, met 27.' Zich vijf dagen laten opsluiten met vijf statistici om eens indringend over de beste aanpak te discussiren, leek hem een gruwel. ``Ik ben in het geheel niet onder de indruk van de kritiek van mijn collega's', besloot Elffers. ``Ik vind dat mijn methode met vlag en wimpel overeind is gebleven.' Lucia de B. zat erbij en keek er naar. De zaak Sally Clark In 1997 sloeg bij het echtpaar Sally en Steve Clark uit Cheshire het noodlot toe. Hun zoontje Christopher, 11 weken oud, stierf in zijn slaap. Er waren lichte verschijnselen van longontsteking, maar aanwijzingen dat er niet goed voor de baby gezorgd was ontbraken totaal. `Natuurlijke dood', stond er op de overlijdensakte. Een jaar later volgde een nieuwe ramp: ook hun zoontje Harry, 8 weken oud, overleed in zijn slaap. Nu geen medeleven: de Clarks werden gearresteerd en in 1999 kreeg Sally levenslang voor tweevoudige moord. Bij gebrek aan direct bewijs gaf de getuigenis van kinderarts Sir Roy Meadow, expert op het gebied van wiegendood, de doorslag. Zelden zal statistiek in de rechtzaal zo te grabbel zijn gegooid. Meadow redeneerde als volgt. De Confidential Enquiry for Stillbirths and Deaths in Infancy (CESDI) had uitgewezen dat een willekeurige baby van welvarende, niet-rokende ouders een van 1 op 8.500 had aan wiegendood te overlijden. Bij twee onafhankelijke gevallen van wiegendood, zoals in het gezin Clark, was de op toeval dus 1 op 8.500 in het kwadraat, ofwel 1 op 73 miljoen. Sally Clark was dus schuldig, aldus een zelfverzekerde Meadow, en de jury ging met hem mee. Maar twee gevallen van wiegendood in n gezin hoeven niet onafhankelijk te zijn. Ray Hill, hoogleraar wiskunde op Salford University, kwam na analyse van CESDI-data tot de conclusie dat in een gezin waar wiegendood had toegeslagen een volgend kind 10 22 keer zoveel heeft hetzelfde lot te treffen dan normaal. Verder maken jongetjes tweemaal zoveel op wiegendood als meisjes. En de dertig kinderen die per jaar in Engeland door hun moeders werden omgebracht, zo bleek uit onderzoek, werden veelal verwaarloosd en waren afkomstig uit arme gezinnen. Sally Clark is een schoolvoorbeeld van prosecuters fallacy: het idee dat als de op twee keer wiegendood heel klein is, de op de onschuld van de verdachte ook heel klein is. De redenering komt er op neer dat 0104066111 niet het telefoonnummer van NRC Handelsblad kan zijn omdat het zo zeldzaam is. Nadat Sally Clark gevangen was gezet meldden zich bij `The Campaign to Free Sally Clark' vijftig gezinnen waarin die `dubbele bliksem' had toegeslagen. Januari 2003, na vier jaar cel, werd Sally Clark alsnog vrijgelaten en de reputatie van Sir Meadow ligt in duigen. Tal van zaken zijn inmiddels heropend (zie het artikel van Hieke Jippes in het Zaterdags Bijvoegsel van 24 januari). Wellicht was Sally Clark een hoop (extra) ellende bespaard gebleven wanneer een getuige-deskundige de jury een Bayesiaanse analyse had gepresenteerd. Uitgaande van 1:100.000 (in plaats van de 1 op 73 miljoen van Meadow) en 30 moorden op een Brits kind per jaar leert een Bayesiaanse berekening (uitgevoerd in +plus magazine, sept. 2002) dat de op Sally Clarks onschuld circa 2/3 bedraagt. Dat getal is alleen fors omlaag te krijgen onder de aanname dat jaarlijks duizenden Britse moeders hun kroost stiekem vermoorden. Toch concludeerde de aanklager bij gebrek aan (forensisch) bewijs dat ``de statistiek overtuigend leek'. Lies, damned lies and statistics.

 

Foto-onderschrift:  

ILLUSTRATIE FRANKA VAN DER LOO

Rectificaties:  

Gerectificeerd Correctie 80 procent In de Bayesiaanse berekening van de 80 procent op onschuld zijn enkele fouten geslopen. De posterior odds zijn 400.000 op 50.000.000 (i.p.v. 5.000.000), ofwel 8 om 1000. Dat geeft een kans op onschuld (i.p.v. schuld) van 4/504 = 0,8 procent.