Wat is een correlatie?

Correlatie is een statistische maat voor de samenhang tussen de scores op twee variabelen. Correlatie is een zogenaamde associatiemaat: de mate waarin twee verschijnselen met elkaar zijn verbonden. Andere bekende associatiematen zijn percentages of kruistellingen.

De samenhang tussen paren van scores van beide variabelen wordt gevonden door een correlatieanalyse uit te voeren. Het gaat altijd om de scores van twee kenmerken van een en dezelfde proefpersoon of van een en hetzelfde geval in het onderzoek. Een eis voor een correlatieonderzoek is dus paarsgewijze observatie. Dat noteer je als (xi; yi).

Als voorbeeld kan gedacht worden aan een onderzoek naar de maten van herenkleding. Het onderzoek gaat om de samenhang tussen de schoenmaat en de boordmaat van elke afzonderlijke proefpersoon. De onderzoeker wil dus weten of er een paarsgewijs verband, een correlatie is tussen de schoenmaat en de boordmaat. Dan zeggen percentages niet genoeg over het verband tussen omvang van de nek en grootte van de voeten.

Als voorbeeld zie je de tabel en de grafiek van dit onderzoek:

Correlatie tabel 1
Tabel 1: Schoen- en boordmaten.
Correlatie grafiek 1
Grafiek 1: Samenhang tussen schoen- en boordmaten.

Op het eerste gezicht zie je dat de lijnen voor schoen- en boordmaat wel een samenhang hebben, maar niet altijd hetzelfde zijn.

Aan de correlatie tussen twee kenmerken van één case zie je of de scores:

  • Gelijk met elkaar opgaan.

  • Los van elkaar staan.

  • Tegenovergesteld aan elkaar zijn.

Drie mogelijke vormen van correlatie

Positieve correlatie

Bij een positieve correlatie gaan de scores paarsgewijs in dezelfde mate van laag naar hoog. Als je een lijn door alle punten trekt, gaat deze in de grafiek van linksonder naar rechtsboven.

Negatieve correlatie

In het geval van een negatieve correlatie gaan de scores op de ene variabele net zo hard omhoog als de scores op de andere variabele omlaag gaan. Als je een lijn door alle punten trekt, gaat deze in de grafiek van rechtsboven naar linksonder.

Neutrale of géén correlatie

De scores op de twee variabelen kunnen net zo hard tegengestelde waarden hebben als gelijke waarden. De scores vliegen alle kanten op. Als je een lijn door alle punten trekt, gaat deze in de grafiek van links naar rechts, maar niet duidelijk naar boven of naar onder.

Voorbeelden van correlatie

In de volgende grafieken (grafiek 2 tot en met 4) zie je voorbeelden van correlatie.

Voordat je verdere analyses doet, maak je een puntendiagram (scatterplot). Dan heb je al een plaatje van je data. Daar is vaak al veel aan te zien.

Voorbeeld positieve correlatie

In een onderzoek naar de samenhang tussen overhemd- en schoenmaten zie je in de grafiek al dat overhemd- en schoenmaten redelijk gelijk met elkaar oplopen. Een hogere schoenmaat lijkt aardig overeen te komen met een hogere overhemdenmaat. Punten gaan met elkaar in redelijk gelijke pas langs een trendlijn omhoog.

Correlatie grafiek 2
Grafiek 2: Positieve correlatie.

Voorbeeld negatieve correlatie

In een onderzoek naar leesgedrag van dagelijkse treinreizigers is gevraagd naar het aantal boeken dat zij per jaar in de trein lezen op hun dagelijkse reis.

Correlatie grafiek 3
Grafiek 3: Negatieve correlatie.

De horizontale as toont de kilometers van de dagelijkse treinreis. De verticale as toont het aantal boeken dat per jaar in de trein wordt gelezen. Dit lijkt (zonder berekeningen) een negatieve correlatie te hebben: hoe langer de treinreis, hoe minder boeken er worden gelezen. Punten gaan met elkaar in redelijk gelijke pas langs een trendlijn omlaag.

Voorbeeld neutrale of geen correlatie

In een onderzoek naar tv-kijkgedrag in uren per dag en aantal kilometers fietsen per dag werd de volgende grafiek gemaakt:

Grafiek 4: Neutrale of geen correlatie.

In het plaatje zie je dat er geen samenhang te zien is tussen het aantal kilometers dat iemand op een dag fietst (y-as) en het aantal uren dat er TV wordt gekeken (x-as). Er zal uit de correlatieanalyse waarschijnlijk weinig positieve of negatieve correlatie blijken. Punten gaan alle kanten op en dwarrelen langs een trendlijn naar rechts.

Wat is het nut van correlatie?

Als je meer weet van de correlatie tussen je variabelen, heb je een belangrijk beschrijvend element voor je rapportage. Zo kan de lezer zien wat voor samenhang er tussen de variabelen is, en hoe sterk die samenhang is.

Als je een regressieanalyse hebt gemaakt, weet je van een onafhankelijke variabele of dit een voorspeller (predictor) is voor een afhankelijke variabele. Dan kun je met correlatie beschrijven hoe sterk dat verband is. Voorspellen zoute pinda’s op de bar het aantal verkochte biertjes? Als dat uit je regressieanalyse blijkt, is de vraag: en hoe sterk is dan het verband tussen de variabelen ‘barpinda’s’ en ‘verkochte biertjes’?

Toepassingen van correlatie in onderzoek

Overeenkomst of juist verschil binnen één populatie?

Met correlatie kun je berekenen of één populatie een overeenkomst heeft met een andere populatie, of dat zij juist elkaars spiegelbeeld zijn. Het kan gaan om één kenmerk van die populatie. Voorbeeld: hangt de muzikaliteit van Schotten samen met de muzikaliteit van Engelsen? Of zijn zij juist elkaars tegengestelde?

Met correlatie-onderzoek kan ook worden bekeken of examinatoren wel samen op een lijn zitten. De correlatie tussen hun oordeel over de werkstukken van studenten is – als het goed is – redelijk positief. Wanneer de ene beoordelaar een werkstuk afkeurt, is de ander er ook niet blij mee. Dat is een voorwaarde voor interbeoordelaar-betrouwbaarheid.

Test-hertest betrouwbaarheid

Correlatie kan ook gebruikt worden om het verband tussen variabelen op twee verschillende tijdstippen te meten. Dan kun je zien of er een lineair verband is tussen het eerste en het tweede moment. Bijvoorbeeld of een test op maandag net zo goed of slecht wordt gedaan als op vrijdag.

Halveringstest in dezelfde tijd

Van een groot tentamen met 90 vragen kun je bezien of de vragen allemaal wel goed zijn geformuleerd. Je geeft dan de helft van de vragen aan één helft van de studenten en de andere helft aan een andere helft tijdens hetzelfde tentamen. Daarna bereken je de correlatie tussen de tentamenuitslagen. Als het goed is, maakt het niet uit welke helft van de vragen iemand heeft beantwoord. Er is dan een goede samenhang tussen de beantwoording van paren vragen.

Voorbereiding verder onderzoek

Bij een sterke samenhang van veel verschillende variabelen met een afhankelijke variabele, wil je weten of er een causale relatie is. Je wilt dan eerst weten welke afzonderlijke variabele of welk populatiekenmerk de meeste invloed lijkt te hebben op de afhankelijke variabelen. Als voorbeeld kun je denken aan de invloed van variabelen als voeding, inkomen ouders, intelligentie of uren gamen per dag op de leerprestaties van een kind. Je hebt voor elke variabele een correlatie met de variabele ‘leerprestaties’ uitgerekend. Dan bereid je je voor op een factoranalyse. Je gaat dan uit correlaties afwegen welke variabelen de belangrijkste factoren zijn.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?