- Scriptium
- Posted on
- Geen reacties
Alles wat je moet weten over Cramer's V
Je gaat in dit artikel kennismaken met Cramer’s V. Daarvoor lees je eerst wat algemeen wordt begrepen onder Cramer’s V. Vervolgens nemen we je mee door de stappen van het berekenen van Cramer’s V. Tot slot volgt een praktijkvoorbeeld van het gebruik en de berekening van Cramer’s V.
-
1: Wat is Cramer's V?
-
2: Hoe bereken je de waarde van Cramer's V?
-
3: Praktijkvoorbeeld van het gebruik van Cramer's V
Het berekenen van Cramer’s V kan worden vergemakkelijkt met behulp van software zoals SPSS, R of andere statistische pakketten, omdat deze de chi-kwadraatwaarde en de relevante gegevens automatisch kunnen berekenen. In dit artikel gaat het meer om het begrip van de inhoud dan de handigheid met de tools.
Wat is Cramer's V?
Het gebruik van Cramer’s V kan nuttig zijn in verschillende onderzoeksdomeinen, zoals sociale wetenschappen, geneeskunde, marketing en andere gebieden. Vaak wordt een getalsmatige samenhang gezocht tussen variabelen zoals omzetcijfer en reclamebudget, of overgewicht en bloeddruk. In bepaalde onderzoeken is de onderzoeker juist benieuwd naar de relatie tussen categorische variabelen.
Cramer’s V is een statistische maatstaf die wordt gebruikt om de sterkte van de samenhang (associatie) tussen twee categorische variabelen te meten. Cramer’s V wordt met name gebruikt bij het analyseren van de associatie tussen twee nominale variabelen. Er bestaan verschillende soorten variabelen:
-
Categorische variabelen
Dit zijn variabelen die waarden aannemen die in categorieën vallen, in plaats van numerieke waarden. Bij numerieke waarden wordt er een getal toegekend aan de waarden van de variabele. Categorische variabelen worden ook wel kwalitatieve variabelen genoemd. Categorische variabelen kunnen worden onderverdeeld in nominale en ordinale variabelen. -
Nominale variabelen
Dit zijn variabelen waarbij de categorieën geen inherente volgorde hebben. Bijvoorbeeld geslacht (man, vrouw), oogkleur (blauw, bruin, groen), land van herkomst (Duitsland, Finland, Ierland). -
Ordinale variabelen
Dit zijn variabelen waarbij de categorieën een specifieke volgorde hebben. Bijvoorbeeld opleidingsniveau (lagere school, middelbare school, universiteit), tevredenheidsscore (zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden), pijnintensiteit (geen pijn, lichte pijn, matige pijn, ernstige pijn).
Welke waarden kan Cramer's V hebben?
De waarde van Cramer’s V varieert tussen 0 en 1. Daarbij geeft 0 aan dat er geen samenhang of associatie is tussen de variabelen. Bij een waarde van 0,5 is er wel samenhang, maar geen volledige associatie. De waarde 1 geeft aan dat er een perfecte associatie is. Hoe dichter de waarde van Cramer’s V bij 1 komt, hoe sterker de associatie tussen de variabelen.
Hoe bereken je de waarde van Cramer's V?
Het berekenen van Cramer’s V vraagt nogal wat voorbereidende stappen voor je één waarde kunt rapporteren. Als voorbeeld kun je denken aan een onderzoek naar politieke voorkeuren. Bij verkiezingen is aan een steekproef van stemgerechtigde mannen en vrouwen gevraagd wat de politieke voorkeur is. Je wilt weten wat de samenhang is tussen Man/Vrouw en Politieke Voorkeur (Progressief, Conservatief, Onbeslist).
Om Cramer’s V te berekenen, volg je de volgende stappen:
Stap 1: maak een kruistabel
Stel een kruistabel (contingency table) samen voor die twee variabelen waarvoor je de associatie wilt berekenen. Deze tabel toont het aantal waarnemingen in elke combinatie van categorieën van de twee variabelen. Je maakt een tabel met rijen en kolommen voor elke variabele. Plaats de categorieën van de ene variabele in de rijen en de categorieën van de andere variabele in de kolommen. Dan heb je een kruistabel zoals onderstaand voorbeeld:
Bij verkiezingen is aan een steekproef van stemgerechtigde mannen en vrouwen gevraagd wat de politieke voorkeur is:
In dit voorbeeld zie je dat van de 100 mensen in de steekproef, 20 mannen een progressieve politieke voorkeur hebben, 15 mannen conservatief zijn, enzovoort. Je kunt de cijfers vergelijken om inzicht te krijgen in de verdeling van politieke voorkeur tussen mannen en vrouwen.
Stap 2: bereken de chi-kwadraatwaarde
Bereken de chi-kwadraatwaarde (chi-square value) voor de kruistabel. Dit kan worden gedaan met behulp van een chi-kwadraattest voor onafhankelijkheid.
Om de chi-kwadraatwaarde te berekenen, moet je eerst de verwachte frequenties bepalen voor elke cel in de kruistabel. Dit wordt gedaan door de marges van de tabel te gebruiken. Vervolgens kun je de chi-kwadraatwaarde berekenen met behulp van de formule:
χ² = Σ ((O – E)² / E)
waarbij:
-
χ² = chi-kwadraatwaarde
-
Σ = sommatie over alle cellen
-
O = geobserveerde frequentie in elke cel
-
E = verwachte frequentie in elke cel
Laten we doorgaan met het voorbeeld van de kruistabel die je bij stap 1 hebt gezien.
Stap 2a: bepaal de marges
Bereken de marges door de rij- en kolomtotalen te berekenen:
Stap 2b: bereken de verwachte frequenties
De verwachte frequentie voor elke cel wordt berekend door de rij- en kolomtotalen te gebruiken. Bijvoorbeeld, de verwachte frequentie voor de cel “Man” en “Progressief” is (45 * 45) / 100 = 20.25.
Stap 2c: bereken de chi-kwadraatwaarde
Nu kunnen we de chi-kwadraatwaarde berekenen met behulp van de formule:
χ² = ((20-20.25)² / 20.25) + ((15-15.75)² / 15.75) + ((10-9)² / 9) + ((25-24.75)² / 24.75) + ((20-19.25)² / 19.25) + ((10-11)² / 11)
Berekenen van de som: χ² = 0.00062 + 0.0317 + 0.2222 + 0.00202 + 0.1857 + 0.0909 = 0.5322. Dus de chi-kwadraatwaarde voor deze kruistabel is: 0.5322.
Stap 3: bereken Cramer's V
Om Cramer’s V te berekenen, gebruiken we de formule: V = √(χ² / (n * (k – 1))).
Hier is:
-
χ² = chi-kwadraatwaarde
-
N = het totale aantal waarnemingen
-
K = het minimum van het aantal rijen en het aantal kolommen in de kruistabel
In ons voorbeeld is de chi-kwadraatwaarde χ² = 0.5322 en het totale aantal waarnemingen n = 100. Aangezien de kruistabel 2 rijen en 3 kolommen heeft, is k = 2 (minimum van rijen en kolommen).
V = √(0.5322 / (100 * (2 – 1))) = √(0.5322 / 100) ≈ √0.005322 ≈ 0.0729.
De waarde van Cramer’s V is ongeveer 0.0729.
Interpretatie
Cramer’s V varieert tussen 0 en 1. Daarbij staat 0 voor geen associatie tussen de variabelen en 1 staat voor een volledige associatie. Over het algemeen wordt een hogere waarde van Cramer’s V geïnterpreteerd als een sterkere associatie tussen de variabelen, terwijl een lagere waarde wijst op een zwakkere associatie.
In dit geval is de waarde van Cramer’s V relatief laag (ongeveer 0.0729). Dat wijst erop dat er een zwakke associatie is tussen geslacht en politieke voorkeur in de gegeven steekproef. Dit betekent dat het geslacht van een persoon geen sterke voorspeller lijkt te zijn voor zijn of haar politieke voorkeur.
Praktijkvoorbeeld van het gebruik van Cramer's V
Een praktijkvoorbeeld van het gebruik van Cramer’s V is het onderzoeken van de associatie tussen geslacht en studievoorkeur bij een steekproef van schoolverlaters. Stel dat je een enquête hebt afgenomen bij 500 mensen en je hebt de gegevens over hun geslacht (man, vrouw) en studie- voorkeur (Talenstudie: A, Exact: B, Maatschappij: C). Je wilt weten of er een significante associatie is tussen geslacht en studievoorkeur.
Hier is een rekenvoorbeeld om Cramer’s V te berekenen:
Stap 1: maak een kruistabel van de gegevens
Stap 2: bereken de chi-kwadraatwaarde
Om de chi-kwadraatwaarde te berekenen, gebruiken we de formule:
χ² = Σ ((O – E)² / E)
Hier is O de geobserveerde frequentie in elke cel en E de verwachte frequentie in elke cel. Laten we de berekening doen voor de gegeven kruistabel:
Stap 2a: bereken de verwachte frequenties
De verwachte frequentie voor elke cel wordt berekend door de rij- en kolomtotalen te gebruiken. Bijvoorbeeld, de verwachte frequentie voor de cel “Man” en “Studie A” is (180 * 130) / 400 = 58.5.
Stap 2b: bereken de chi-kwadraatwaarde
Nu kunnen we de chi-kwadraatwaarde berekenen met behulp van de formule:
χ² = ((80-58.5)² / 58.5) + ((60-58.5)² / 58.5) + ((40-63)² / 63) + ((50-71.5)² / 71.5) + ((70-71.5)² / 71.5) + ((100-76)² / 76)
Berekenen van de som: χ² = 2.99 + 0.52 + 4.93 + 4.89 + 0.29 + 2.11 = 15.73
De chi-kwadraatwaarde voor deze kruistabel is 15.73.
Stap 3: bereken Cramer's V
Nu we de chi-kwadraatwaarde hebben, kunnen we Cramer’s V berekenen met behulp van de formule: V = √(χ² / (n * (k – 1))).
Hier is χ² de chi-kwadraatwaarde, n het totale aantal waarnemingen en k het minimum van het aantal rijen en het aantal kolommen in de kruistabel. In dit geval is n = 400 (het totale aantal waarnemingen) en k = 2 (minimum van rijen en kolommen).
V = √(15.73 / (400 * (2 – 1))) = √(15.73 / 400) ≈ √0.039325 ≈ 0.1983.
De waarde van Cramer’s V is ongeveer 0.1983.
Interpretatie
Cramer’s V varieert tussen 0 en 1, waarbij 0 staat voor geen associatie tussen de variabelen en 1 staat voor een volledige associatie. In dit geval is de waarde van Cramer’s V ongeveer 0.1983. Dat is relatief laag. Dit suggereert dat er een zwakke associatie is tussen de studievoorkeur en het geslacht in de gegeven steekproef.
Dit is slechts een denkbeeldig voorbeeld. De cijfers zijn puur ter illustratie.
Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in
Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.
De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt.