Aandacht voor de P-waarde voordat het onderzoek start

De P-waarde (Probability value) of verwachtingswaarde speelt een sleutelrol in onderzoek naar de waarschijnlijkheid van een mogelijke gebeurtenis of eigenschap binnen een populatie. Dit is in ieder geval belangrijk als niet de gehele populatie onderzocht kan worden. Bijvoorbeeld, verkiezingen voor de landelijke of de lokale politiek bestaan uit onderzoek onder de hele populatie naar de politieke voorkeur van stemgerechtigden in absolute aantallen: de telling en geldige stemmen. Exitpolls zijn feitelijk een steekproef uit de hele populatie. Deze voorspellingen van de verkiezingsuitslag zijn gebaseerd op de berekening van de waarschijnlijke uitkomsten van de verkiezingen nadat een beperkt aantal, een steekproef van stemmen, is doorgerekend.

Een onderzoek waarbij de P-waarde een sleutelrol speelt, kan bijvoorbeeld een studie zijn naar het effect van een geneesmiddel, of de uitkomst van een nieuw productieproces. Uit een experiment of een steekproef volgen observaties. De uitkomsten kunnen volledige toevalstreffers zijn. Of we vinden iets waarmee we met een aan zekerheid grenzende waarschijnlijkheid een uitspraak over de populatie, over de doelgroep van het geneesmiddel of over het ontworpen productieproces kunnen doen. Als iets in een experiment uit een steekproef met meer dan puur toeval (‘boven kans’) opgaat, kan het zijn dat de onderzoeksuitkomsten betekenisvol (significant) verwijzen naar een eigenschap van de populatie.

Voordat we een experiment inrichten of een steekproef benaderen, is het van belang een idee te hebben van de rol die het pure toeval kan spelen.  Ofwel, wat is de kansverdeling voor het te onderzoeken onderwerp? We willen vooraf een waarde aan het toeval toekennen, de P-waarde of verwachtingswaarde bepalen. Of toleranties aan het proces toeschrijven: omschrijven welke foutjes we verwaarloosbaar vinden, maar ook welke fouten we te serieus vinden.

Als de uitkomsten niet sterk afwijken van de verwachtingswaarde, als de waarschijnlijkheid of toevalsfactor laag is, kan zuiver toeval ook een kleine rol spelen.

In andere artikelen bespreken we meer gedetailleerd de rol van de P-waarde in de statistische analyse van resultaten uit steekproefonderzoek. Aan de onderzochte gebeurtenis wordt in feite een kansberekening toegerekend. Elders bespreken we kansverdelingen zoals Normale (of standaard-normale) verdeling, Negatief-exponentiële verdeling, Poissonverdeling of Binomiale verdeling. Daaruit volgt een P-waarde die ons verder de weg wijst tussen toeval, moedwil en misverstand.

We zien dat de P-waarde of de verwachtingswaarde centraal staat bij – onder andere – het formuleren van een nulhypothese, hypothesetoetsen, de t-toets van verschil, de Chi-kwadraatcompositie of regressieanalyse.

Oftewel: als de kans op louter toevallig voorkomen erg klein blijkt te zijn, is het geobserveerde verschijnsel misschien méér dan een toevalsgebeurtenis. Dan is er echt iets aan de hand. Immers, als een dobbelsteen steeds op de 6 valt, dan zal er wel meer aan de hand zijn dan zuiver toeval. Misschien is de dobbelsteen wel verzwaard.

Een verschijnsel is dus of louter toeval, of er is een onderliggend verschijnsel dat ervoor zorgt dat een bepaald kenmerk of eigenschap op de voorgrond dringt. In onderzoek willen we graag weten wát dat kenmerk is, hoe die eigenschap nu steeds opspringt. En vooral of dat kenmerk of die eigenschap alleen hypothetisch bestaat of een basis in de werkelijkheid heeft. Is het de intelligentie van een kind waardoor het kind steeds een 10 voor rekenen haalt? Is het de armoede waardoor moeders in supermarkten voedsel stelen? Is het de komst van de ooievaars waardoor de kraamkliniek volloopt?

Eerlijke loterijen gaan failliet door een eerlijke P-waarde

Voor een goed begrip van P-waarde staan we stil bij de magie achter het ‘toevals’-spel, het gokspel. Het verschil tussen een behendigheidsspel en een gokspel is dat in het eerste geval, de ‘kans’ op winnen groter wordt, naarmate je meer bedreven raakt in de handelingen die verricht moeten worden. Na veel oefenen lukt het om op de bowlingbaan een strike te gooien. Na veel oefenen lukt het soms om een bulls eye te gooien. Hoewel ‘de bal rond is’, winnen meestal de betere voetballers de wedstrijd van de minder goede voetballers.

In een gokspel lijkt het de afspraak tussen de gokkers, dat alleen ‘toeval’ de uitkomst van het spel bepaalt. Daarom nemen we alleen een zuivere dobbelsteen of schone kaarten.  We nemen aan dat een ‘eerlijke’ loterij evenveel kans geeft op winnen als op verliezen. Eigenlijk willen we altijd in ieder geval onze inzet kunnen terugwinnen. Dan is de uitkomst louter bepaald door toeval.

Is dat altijd wel zo?

Om winst uit een loterij over te houden, verlaagt de eigenaar van de loterij bewust de rekenkundige verwachtingswaarde van het lot. Op elke euro moet, na uitkering van de prijs, een voldoende aantal eurocenten overblijven om winst te maken en weer een volgende loterij te houden.

De loterijeigenaar wil dus systematisch meer kans op winst dan op verlies hebben. Hij formuleert bewust een P-waarde waarboven de loterij lucratief is: wanneer hij dus quitte speelt of erop toelegt. Andersom zou je als deelnemer aan de loterij willen weten of je een redelijke of een belachelijk kleine kans op winst maakt. Hoe gaat dat?

Benaderen van de P-waarde of verwachtingswaarde

We kijken naar de fruitautomaat in het café op de hoek. Je wilt een idee hebben van de P-waarde voordat je 25 euro neertelt voor een lot of een euro in de gokautomaat gooit.

In de gleuf van de gokautomaat gaat een hele euro. Voor één van de twee vensters verschijnt na een druk op de knop een afbeelding van een ‘kers’, ‘druif’ of ‘banaan’. Achter het tweede venster verschijnt of eenzelfde, of een andere afbeelding. Bij twee dezelfde plaatjes, keert de machine verschillende prijzen uit:

  • 1 euro, twee kersen;

  • 2 euro, twee druiven;

  • 5 euro, twee bananen.

Terwijl je op je biertje wacht, denk je dat je met de euro die je in de gleuf gooit, straks je biertje betaalt. De café-eigenaar heeft de machine echter zó ingesteld dat de kans op opeenvolgende plaatjes zijn:

  • 1/2 kans op twee kersen;

  • 1/3 kans op twee druiven;

  • 1/6 kans op twee bananen.

Dat zijn dus de kansen per stukje fruit.

Wat is nu de verwachte uitkering per spel, per keer dat er weer een euro door de gleuf is gevallen?

De verwachte uitkering per spel
De kans op twee kersen:
1/2 * 1/2 = 1/4
De kans op twee druiven:
1/3 * 1/3 = 1/9
De kans op twee bananen:
1/6 * 1/6 = 1/36

De uitkering is dan: 1/4 * 1 euro + 1/9 * 2 euro + 1/36 * 5 euro = € 0,61

Op elke euro die de gleuf in gaat, verdien je dus € 0,61 – € 1,00 = minus € 0,39.

De verwachtingswaarde of P-waarde voor dit kansspel is dus ruim minder dan de inleg. Op de lange duur is dus niet eens de inzet terug te winnen. Er is met de gokkast dus méér aan de hand dan alleen toeval. Misschien wil de café-eigenaar gewoon wat verdienen aan je biertje en aan je gokspel.

P-waarde in de praktijk

Bovenstaand is een vrij eenvoudig voorbeeld gegeven van het werken met en het bepalen van de P-waarde. Veel statistische programma’s (SPSS) geven gevraagd of ongevraagd de P-value bij de analyses of toetsen. De verleiding is groot alleen maar naar P= te kijken en bij algemeen opgegeven waarden te besluiten dat het geobserveerde verschijnsel ‘significant’ is. Je kan bij wijze van voorbeeld verschillende rekenboeken voor een basisschool hebben onderzocht. Uit je onderzoek volgt dat een nieuw rekenboek significant hoger scoort en dus  ‘boven kans’ beter is dan het oude rekenboek dat de school al lang gebruikt. Zo’n significante uitkomst lijkt een goede onderzoekprestatie, maar is het de absolute waarheid?

De P-waarde zegt alleen hoe waarschijnlijk het is dat de geobserveerde data onder de nulhypothese voorkomen. Als de p-waarde of toevalsfactor typisch onder het 5% waarschijnlijkheidsniveau valt, kan de nulhypothese worden verworpen.

Maar dat is een keuze. Als het om een medisch preparaat gaat, zul je wellicht eerst bij 1% of zelfs minder een gedurfde uitspraak doen. Gaat het om de ene of de andere rode wijn bij het eten, dan kun je zelfs een waarde van 10 al doorslaggevend vinden. Als negen van de tien klanten die wijn lekker vinden, heb je een leuke huiswijn. Als 1 op de 100 patiënten overlijdt door/ondanks het medicijn, dan staan de kranten vol.

Voor de juiste lezing van ‘de’ P-waarde is dus nog niet gezegd dat er een vast getal is voor de P-waarde. Die is niet in marmer gebeiteld. De onderzoeker zal deze zelf moeten aangeven en verantwoorden. Evenmin is gezegd dat de alternatieve hypothese dus per se waar is.  

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?