Wanneer gebruik je Spearman's rank?

In onderzoek wil je soms weten of er wel of geen samenhang bestaat tussen scores van deelpopulatie A en scores van deelpopulatie B. De scores verwijzen dan naar een voorkeur, een plaats in het klassement of een rangorde. Het meetniveau is dan ordinaal. Technisch gesproken: is er wel of geen getalsmatig verband tussen onafhankelijke variabele X en afhankelijke variabele Y?

Het vraagstuk kan zijn: is er een statistische samenhang tussen het oordeel of de voorkeur van één deelpopulatie (de eerste klasse-indeling) met het oordeel of de voorkeur van een andere deelpopulatie (de tweede klasse-indeling)? Ofwel, geven twee spelregels voor het bepalen van een rangorde voor hetzelfde onderwerp ook ongeveer eenzelfde volgorde?

Het principe van Spearman's rank correlatie

Bij een Pearsons productmoment-correlatie heb je twee reeksen data met allebei reële getallen.

In het geval van Spearman’s rank correlatie heb je twee reeksen data op het meetniveau van ordinale schalen (meer/minder; hoger/lager) en scores op rationeel meetniveau (rationele, reëel getallen). Alleen met de reële getallen kunnen alle rekenbewerkingen gedaan worden.

De ongelijkheid in meetniveau maakt dat je géén Pearsons product-momentcorrelatie kunt gebruiken. Met een belangrijke tussenstap in de analyse kan dat wel met Spearman’s rank correlatie. Dat is dan geen product-momentcorrelatie, maar een rangcorrelatie. Een rangcorrelatie berekent het statistische verband tussen twee rangordes. Daarvoor worden of twee rangordes vergeleken of de getallen van één van de te onderzoeken variabelen worden eerst in een rangorde omgezet. Je wilt dan de hypothese toetsen of er géén verband is tussen variabele x en variabele y. In statistische notatie geschreven is de vraag dus of rs = 0 dan wel behoorlijk dichtbij 0 komt.

Voorbeeld van berekening rangcorrelatiecoëfficiënt

Algemeen wordt Spearman’s rank correlatiecoëfficiënt genoteerd als rs. De formule is:

Spearman's rank formule 1

Dit is dezelfde formule als voor Pearsons productmoment-correlatie. Voordat je deze formule kunt gebruiken, moet je eerst de twee onderzochte rangvolgordes of de rangen en waarden omzetten naar gepaarde metingen op de twee variabelen x en y.

In ons voorbeeld wordt onderzocht of er een verband bestaat tussen voorkeuren van een wijnkenner voor bepaalde wijnen en de uiteindelijke waardering van wijnen volgens een puntensysteem. Het gaat om dezelfde wijnen.

Stappenplan voor het berekenen van Spearman's rank

Stap 1: rangorde bepalen volgens beide rangordesystemen

Na een wijncursus hebben aankomende wijnkelners een oordeel mogen geven over de wijnen in de kelder van een restaurant. Zij hebben de wijnen eerst mogen indelen op volgorde van ‘afwaswater’ tot ‘godendrank’. Dat noemt men dus ranking: op basis van een eigen oordeel een volgorde maken. De wijnen worden ingedeeld van 1e voorkeur tot en met 8e keuze.

Daarnaast hebben de kelners op basis van een lijst met criteria hun scores in getallen gegeven aan de wijn, zoals punten voor de kleur, de geur, complexiteit, duur van de nasmaak, prijs per fles, enzovoort.

De onderzoeker wil weten of een voorkeur (ranking) voor een bepaalde wijn verband houdt met het totale aantal punten dat een wijn krijgt nadat deze geproefd is. Dus: of de voorkeur van de wijnkenner een verband heeft met de toegekende punten.

De volgende tabel geeft de uitslag van de wijnproef en de ranking van de voorkeur voor 8 wijnen:

Spearman's rank tabel 1
Tabel 1: de eerste volgordes en scores.

Stap 2: passende getallenparen maken

Hiermee zijn nog geen getallenparen (x, y) te maken. De punten in de tweede kolom worden nu verdeeld over een achttal plaatsen, waarbij de laagste score = 44 omgerekend is naar rangcijfer = 1 en de hoogste score = 93 omgerekend is naar 8.

De omgerekende rangen van y staan in de derde kolom:

Spearman tabel 2
Tabel 2: omrekening reële getallen naar rangordewaarden.

Nu kun je gepaarde metingen van xi en yi berekenen en dus de correlatie vinden.

Stap 3: verschillen tussen x en y bepalen

Bij deze stap worden eerst de verschillen tussen x en y en dus di = xi-yi berekend. Daarna wordt het verschil gekwadrateerd. Het verschil tussen de twee rangorden en hun kwadraat ziet eruit als in de volgende tabel:

Spearman tabel 3
Tabel 3

Stap 4: invullen in de formule

Nu hebben we de basisgegevens voor onze formule om correlatiecoëfficiënt rs te vinden, en kunnen we de formule voor correlatie gebruiken:

Spearman's rank formule 2

Stap 5: de interpretatie

In een goed tabellenboek voor de kritische waarden van Spearmans rangcorrelatiecoëfficiënt vind je of dit een verwaarloosbaar klein getal is, of dat er duidelijk sprake is van een samenhang. Volgens een tabellenboek is het dan:

Bij n = 8 valt de waarde + of – 0,6369 nog onder 0.643 en binnen α = 0,05.

Omdat de gevonden waarde voor n = 8 die valt bij α = 0,05 groter is dan de kritische waarde, moet de onderzoeker de hypothese “er is geen samenhang” verwerpen. Er is dus een bewijs dat er een sterk verband bestaat tussen de ranking door de wijnkelners en de gedetailleerde puntentoekenning aan de afzonderlijke wijn.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?