Waarvoor heb ik een correlatiecoëfficiënt nodig?

Een correlatiecoëfficiënt is een statistische eenheid voor de samenhang tussen twee of meer variabelen. De correlatiecoëfficiënt is een uitkomst van een correlatieonderzoek. In zo’n onderzoek wordt onderzocht of er een verband is tussen de scores van twee variabelen, gescoord als Xi en Yi.

Een correlatiecoëfficiënt wordt uitgedrukt in een decimale breuk met een cijfer tussen min 1 en plus 1, met 0 als middelpunt. Hoe verder naar plus één of min één, hoe sterker dat verband is. Hoe dichter bij nul, hoe minder samenhang er is tussen de scores op de onderzochte variabelen.

Uit de berekening en het plus- of minteken van het correlatiecoëfficiënt volgen de aard en sterkte van de samenhang tussen variabelen:

Samenhang
Min 1
negatief of tegengesteld verband
een r van -.50 tot - .99
neutraal of geen verband
een r van nul tot plus of min .50
Plus 1
positief of gelijkstellend verband
een r van +.50 tot .99

Wat is het nut van een correlatiecoëfficiënt?

Je doet een correlatieonderzoek als je wilt weten of er een verband is tussen twee onderzoeksvariabelen en hoe sterk dat verband is. Als je uit een regressieanalyse een lineair verband hebt gevonden, wil je weten hoe sterk dat lineaire verband is. Die sterkte wordt dan uitgedrukt in een correlatiecoëfficiënt.

Correlatie zegt niet of de ene factor een oorzaak is van de andere. Er is met een correlatie dus nog géén causale relatie tussen onafhankelijke en afhankelijke variabelen bewezen. Met correlatie tussen Geslacht en Haarkleur is niet aangetoond dat haarkleur wordt veroorzaakt door geslacht of andersom.

Soms is het verband tussen twee variabelen of populatiekenmerken niet duidelijk. Veroorzaken bijvoorbeeld de pinda’s op de cafébar niet alleen dorst? Prikkelen ze ook de trek? Het correlatieonderzoek is dan handig om te ontdekken of er wel een relatie is tussen pinda’s en drankjes. Als er géén correlatie is, zal er ook geen causale relatie zijn. Als er wel correlatie is, is nog niet duidelijk of er een causale relatie is.

Toepassingen van correlatieonderzoek

Overeenkomst of juist verschil tussen twee variabelen

Met correlatie kun je berekenen of één populatie een overeenkomst heeft met een andere populatie, of dat ze juist elkaars spiegelbeeld zijn. Het kan gaan om één kenmerk van die populatie. Voorbeeld: hangt de muzikaliteit van Schotten samen met de muzikaliteit van Engelsen, of zijn zij juist elkaars tegengestelde?

Met correlatieonderzoek kan ook worden bekeken of examinatoren op één lijn zitten. De correlatie tussen hun oordeel over de werkstukken van studenten is (als het goed is) redelijk positief. Dat wil zeggen: als de ene beoordelaar een werkstuk afkeurt, is de andere beoordelaar vast ook niet blij met dat werkstuk. Dat is een voorwaarde voor interbeoordelaar-betrouwbaarheid.

Test-hertest betrouwbaarheid

Correlatie kan gebruikt worden om het verband tussen variabelen op twee verschillende tijdstippen te meten, om te zien of er een lineair verband is tussen het eerste en het tweede moment. Maakt iemand op maandag met evenveel moeite een tentamen als op vrijdag? Rent iemand in maart net zo snel de 5 kilometer als in september?

Halveringstest in dezelfde tijd

Van een groot tentamen met 90 vragen kun je onderzoeken of de vragen allemaal wel goed zijn geformuleerd. Je geeft dan tijdens hetzelfde tentamen de helft van de vragen aan één helft van de studenten en de andere helft aan een andere helft. Daarna bereken je de correlatie tussen de tentamenuitslagen. Als het goed is, zie je een duidelijke samenhang in de beantwoording van overeenkomende vragen.

Correlatie als samenvattende beschrijving van je data

Vaak is een correlatieonderzoek het sluitstuk van of het voorwerk voor andere statistische analyses.

Als je een regressieanalyse hebt gemaakt, wil je weten hoe sterk het verband is tussen de onafhankelijke en de afhankelijke variabelen. Naast de statistische centrum- en spreidingsmaten geef je in je onderzoeksverslag ook de associatiematen, ofwel de onderzochte samenhang tussen variabelen.

Zo geeft een correlatiecoëfficiënt in één cijfer weer of er een verband is gevonden tussen de onderzochte variabelen en hoe sterk dat verband is. Als voorbeeld kun je denken aan het gebruik van een wiskundetoets. Studenten doen een toets vóór een opleiding. De onderzoeker kijkt naar de  studiepunten die elke student in de propedeuse en bachelorfase haalt. Er wordt na een regressieanalyse gezegd dat de cijfers van de wiskundetoets een voorspelling geven van het aantal studiepunten dat studenten zullen halen in die periode. Hoe sterk is nu eigenlijk de samenhang tussen de wiskundetoets en studieresultaten? Hoe sterk is die predictor of voorspellende score? Als dat verband helemaal niet zo sterk is, waarom gebruiken ze dan die toets?

Correlatie als voorbereiding op verdere analyse van je data

Als je van een reeks variabelen wilt weten welke variabelen het meeste zeggen over de afhankelijke variabelen, dan ben je op weg naar een factoranalyse. De correlaties van verschillende onafhankelijke variabelen met één afhankelijke variabele zijn een aanwijzing voor die factoren die meer of minder de variantie in de afhankelijke variabele verklaren. Als voorbeeld nemen we een pedagoog die wil weten welke factoren belangrijk zijn voor schoolsucces. Hij onderzoekt uitslagen van de Cito-toets van kinderen en het verband daarvan met een aantal onafhankelijke variabelen. Hoe sterk hangen variabelen als taalbeheersing, inkomen van de ouders en intelligentiequotiënt samen met de Citoscore? Welke variabelen wegen dan het meest? 

Belangrijkste typen correlatieanalyse

Voor al deze vraagstukken ben je op zoek naar de correlatiecoëfficiënt tussen een bepaald paar variabelen. De belangrijkste typen correlatieanalyse zijn:

  • Spearman's rangcorrelatiecoëfficiënt (uitgedrukt in Griekse letter Rho=).

  • Kendal’s Tau coëfficiënt(uitgedrukt in Griekse letter Tau: T =).

  • Pearsons productmoment-correlatiecoëfficiënt (uitgedrukt in r=).

Welke data gebruik je voor welk type correlatieanalyse?

Als je waarnemingen in reële getallen zijn uit te drukken, kun je productmoment-correlatie gebruiken. Als je waarnemingen gaan over een rangorde, dan is een rangcorrelatie aangewezen.

Rangcorrelatiecoëfficiënt

Met een rangcorrelatiecoëfficiënt beschrijf je in welke mate er een doorlopend verband is tussen twee factoren. De scores komen uit observaties van een rangorde in de scores. Het meetniveau is nominaal of ordinaal. Dus: namen en labels of volgorden zoals eerste, tweede of derde plaats.  Daarbij zijn nominale scores omgezet in een cijfercode, zodat daarmee kan worden gerekend zoals met getallen op interval- of rationiveau. Zowel Spearman’s als Kendal’s berekeningswijzen zijn rangcorrelatiecoëfficiënten.

Productmoment-correlatiecoëfficiënt

Met een productmoment-correlatiecoëfficiënt (Pearsons correlatiecoëfficiënt) beschrijf je in welke mate er een lineair verband is tussen twee factoren. De scores voor de berekening van deze correlatiecoëfficiënt zijn reële getallen. Daarmee kan gewoon gerekend worden. Het meetniveau is dus interval- of rationiveau.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?