Wanneer gebruik je Fisher's z?

Je kunt twee datasets met afwijkende meeteenheden vertalen naar één gemeenschappelijke meeteenheid. Dat doe je door de afzonderlijke scores om te zetten in gestandaardiseerde scores. Deze worden ook z-scores genoemd. De individuele, ruwe score wordt vertaald naar een z-score. Dat heet transformeren.

Voorbeelden transformeren: van ruwe score naar z-score

Het principe achter Fisher's z

Een dataset over een steekproef of populatie met numerieke scores (getallen) kent een frequentieverdeling. De frequentieverdeling van scores loopt van uiterst laag via een middelpunt naar uiterst hoog. Als deze frequentieverdeling normaal verdeeld is, gelden voor beide datasets dezelfde wiskundige eigenschappen. Als ‘plaatje’ herken je de normaalverdeling als een klokvormige curve van doorlopende waarden van x en y als de volgende grafiek:

Verwerpingsgebied grafiek 1

Je herkent de normaalverdeling aan:

  • De klokvorm van de curve voor de frequentieverdeling.

  • De symmetrische vorm in de frequentieverdeling: de waarden lager dan het centrum en de waarden hoger dan het centrum vormen een identieke figuur.

Het derde kenmerk van een normaalverdeling is dat de drie centrummaten geheel identiek aan elkaar zijn:

  • De waarde voor het gemiddelde (mean) is gelijk aan de waarde voor de modus (mode) en is gelijk aan de waarde voor de mediaan (median).

  • Voor een normale verdeling geldt: µ (of M) = Mod = md.

In de kansverdeling volgens een normaalverdeling valt 95% van alle observaties binnen twee standaarddeviaties links en rechts van het gemiddelde. Deze worden genoteerd als σ voor de populatie en als S voor een steekproef. 68% van alle observaties valt binnen één standaarddeviatie links en rechts van het gemiddelde.

Voor een standaard normaalverdeling gelden de waarden:

  • Het gemiddelde (µ) is gelijk aan 0.

  • Een standaarddeviatie (σ) is gelijk aan 1.

Wat is een standaardscore?

Een standaardscore is een maat waarin de ruwe score in eenheden van de standaarddeviatie afwijkt van het middelpunt van de normatieve groep. Hoe verder je afwijkt, hoe meer standaarddeviaties je passeert. Zo kun je nagaan hoe iemand met een ruwe score van 35 voetbaldoelpunten over een heel speelseizoen zich verhoudt tot iemand die 72 punten persoonlijk scoort in een volleybalseizoen. Dat doe je door per ruwe score te bezien waar deze binnen de referentiegroep (voetbal of volleybal) in eenheden van de standaarddeviatie afwijkt.

Je hebt dan niets aan het gemiddelde uitgedrukt in de eenheid van de ruwe punten, zoals het gemiddeld aantal voetbaldoelpunten en het gemiddeld aantal volleybalpunten. Deze zijn door andere scoresystemen en andere aantallen punten per wedstrijd niet vergelijkbaar. Je wilt juist weten hoe hoog iemand binnen de eigen vergelijkingsgroep uitkomt.

De standaardafwijking is een rekenkundige meeteenheid voor de gemiddelde afwijking van een score boven of onder het gemiddelde van een steekproef-dataset of populatiegemiddelde. Daarmee kun je ruwe scores omrekenen naar eenheden standaardafwijking. Daarmee zie je hoe hoog iemand vergelijkenderwijs in het klassement van een bepaalde populatie uitkomt.

Zo kun je voor alle voetballers en alle volleyballers de persoonlijke score omrekenen naar hun standaardscore. Daarmee kun je bepalen wie relatief de sterkste is, oftewel de hoogste score heeft. Je kunt ook hele groepen onderling vergelijken. In beide gevallen bepaal je de plaats per score tussen extreem hoog en extreem laag op de rekenkundig zelfde as van de standaard-normaalcurve.

Voorbeeld: transformatie van ruwe score naar z-score

De formule voor de transformatie naar een standaardscore is:

In deze formule is:

  • Z de waarde die we willen hebben.

  • X de individuele score van de sporter of de examenkandidaat.

  • M het groepsgemiddelde waartoe de sporter of de examenkandidaat behoort.

De noemer σ is de standaardafwijking voor de referentiepopulatie. Deze populatieparameter is of vooraf bekend, of wordt afzonderlijk geschat. Immers, als je informatie hebt over veel grote steekproeven, kun je uit de steekproefvarianties S ook de populatieparameter σ schatten.

Voor de omrekening van ruwe scores naar z-waarden kun je denken aan de volgende voorbeelden:

Van ruwe score naar vergelijkbare z-score

Een school houdt een toelatingsexamen. De scores voor het toelatingsexamen hebben een groepsgemiddelde van M = 500 punten en een standaarddeviatie van σ = 100. Een student heeft een ruwe score van 625 punten. De z-score voor deze ruwe score is dan:

z = (625-500)/100 = 1.25.

Daarmee staat de getransformeerde score dus verder op de basis-as van de curve dan de eerste standaarddeviatie, maar nog ruim binnen de tweede standaarddeviatie.

Van ruwe score naar toetsbare testuitslag

Hieronder zie je een voorbeeld waaruit het belang van z-scores voor statistisch onderzoek blijkt.

Een volleyballer scoort in een toernooi een bepaald aantal punten. Om te testen of dit een statistisch opmerkelijke waarde is, kun je het totale aantal punten omrekenen tot een z-waarde. Deze z-waarde zegt dan iets over de plaats – in standaarddeviaties – van de volleyballer in de normaalverdeling voor alle volleyballers die meedoen aan dat toernooi. Voor het omrekenen van de z-waarde naar een concreet getal van waarschijnlijkheid, gebruik je F(z)-tabellen. Dat zijn tabellen waarin voor z-waarden van 0 tot 4 de waarschijnlijkheidsverdeling is uitgerekend. Dat zijn z-kansverdelingstabellen of Fisher’s z-tabellen.

Deze tabellen vind je in elk gedegen statistiekboek of op internet. De waarden in de tabel geven de waarschijnlijkheid waarmee je een bepaalde waarde voor z in de praktijk kunt aantreffen. De plaats onder de curve van de normaalverdeling beschrijft de kansdichtheid voor een bepaalde z-waarde. Wiskundig kun je een dichtheid onder de curve berekenen, maar dat is al voor jou gedaan in die tabellen.

In een kolom van z-waarden zie je waarden van 0.00 tot 4.00. In de tabel staan dan de corresponderende P-waarden, oftewel de waarschijnlijkheid voor zo’n standaardafwijking. Daarmee kun je beoordelen of de oorspronkelijke ruwe score getransformeerd naar een z-score niets bijzonders is en dus redelijkerwijs is te verwachten. Of juist dat de ruwe score, vertaald naar een z-score, significant afwijkt en dus een topprestatie genoemd mag worden. Zo kun je, via een statistische berekening, aantreffen dat 194 punten in de Volleybal Nations League 2023 een extreem hoge score is. Dit terwijl 194 runs in een professionele cricketwedstrijd weinig voorstelt.

Noot: de beoordeling of een z-score significant is, is een opstap naar hypotheses toetsen. Dat valt buiten het kader van dit artikel.

Twee reeksen scores van verschillende meeteenheden naar één gemeenschappelijke score

In de volgende tabel zie je uitslagen van studenten op twee verschillende deelexamens die op eigen wijze zijn gescoord. Het is de vraag hoe twee reeksen ruwe scores kunnen worden verenigd tot één gemeenschappelijke waarde. Daarbij is het ook de vraag hoe je studenten op een gestandaardiseerde wijze onderling kunt vergelijken.

Fisher's z tabel 1
Tabel 1: uitslagen deelexamens.

In de tabel staan de uitslagen per student op examen 1 en examen 2. Per student zijn de individuele scores opgenomen als X1 en X2.  Met kennis van de som, het gemiddelde en de standaarddeviatie zijn de ruwe scores voor X1 en X2 omgerekend naar de z-scores z1 en z2. In de laatste kolom zijn de z-scores z1 en z2 opgeteld en gedeeld door 2 (het aantal z-kolommen). Dat geeft dan één gemeenschappelijk cijfer. Dit cijfer geeft aan waar die student met alle deeltesten uitkomt in het examen. Daarmee is de plaats per student weergegeven in de groep van alle studenten.

Nu zijn ook uitspraken te doen over hoe de examenuitkomst van de ene student zich verhoudt tot de anderen. Zo komt student 3 met een z-score van 1,49 als hoogste in het klassement uit: 1.49 standaarddeviatie. Student 6 met een z-score van -1.345 standaarddeviatie heeft een plaats als laagste in het klassement. Op deze manier zijn de ruwe scores voor de ene deeltest en de ruwe scores voor de tweede deeltest eerst omgerekend naar standaardscores. Dan is er geen omrekentabel meer nodig om de waarde van de ene test tegenover de andere om te rekenen.

Voorwaarden voor het vergelijken van datasets met verschillende scores

Uit dit voorbeeld volgt dat je verschillende datasets met verschillende ruwe scores kunt vergelijken. Er dient wel aan deze voorwaarden te worden voldaan:

  • De data zijn gebaseerd op continue waarden of doorlopende getallen.

  • Ruwe data komen voort uit een steekproef of populatie met scoreverdeling volgens een normaalverdeling.

De X1 en X2 en dus ook de z1 en z2 hadden ook sportuitslagen voor verschillende sporten van één kandidaat kunnen zijn.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?