Wanneer gebruik je de Kruskall-Wallis test?

De Kruskall-Wallis test is één van de non-parametrische tests. Deze gebruik je om te testen of er een betekenisvol verschil is in de verdeling van scores voor een bepaald kenmerk tussen verschillende groepen. De elementen in de groepen verschillen wat betreft het kenmerk dat belangrijk is voor je onderzoek. Verder zijn ze identiek, en mogelijke verschilpunten doen er helemaal niet toe. Immers, als je bijvoorbeeld onderzoek doet naar een verband tussen opleiding en gokverslaving, dan is het niet belangrijk of iemand rood of blond haar heeft, of dat iemand op het platteland woont of in de stad. Hierbij telt alleen het kenmerk ‘gokverslaving’ en de categorie ‘opleiding’.

Je hebt niet altijd informatie over het gemiddelde of de standaarddeviatie van de populatie of steekproef. Het is ook niet altijd zo dat je onderzoeksgroep een normale verdeling van scores op je onderzoekkenmerk heeft. Dat kan aan een eigenschap van het kenmerk liggen. Maar het kan ook zo zijn dat je onderzoeksgroep te klein is. Dan is er een scheve verdeling van scores op je onderzoekkenmerk, wat tot invalide uitkomsten leidt.

In zo’n situatie zoek je een andere statistische test om je hypothese over verschillen of overeenkomsten in de samenstelling van verschillende populaties te testen. De non-parametrische test biedt dan een oplossing. Voor de non-parametrische test maak je geen gebruik van het gemiddelde of de standaarddeviatie van de populatie of steekproef.

Bekende non-parametrische tests zijn:

  • De teken-test of sign test voor het vergelijken van twee populatiedistributies.

  • De Mann-Whitney U test voor het vergelijken van twee populatiedistributies.

  • De Wilcoxon Rang-som (rank-sum) test voor gepaarde experimenten.

  • De Kruskal-Wallis H test voor de vergelijking van twee populaties.

De Kruskal-Wallis H test gebruik je wanneer je een verschil in samenstelling wil toetsen bij meer dan twee categorieën of deelpopulaties. De Kruskal-Wallis H test wordt ook wel een uitbreiding genoemd van de Mann-Whitney U test. De Mann-Whitney U test gebruik je voor het vergelijken van twee populatiedistributies op één kenmerk. Je wilt dan testen of twee groepen dezelfde scoreverdeling of distributie hebben en dus eigenlijk wat betreft dat ene kenmerk eenzelfde groep vormen. Zo wil je bijvoorbeeld weten of Brabanders en Limburgers evenveel tijd steken in carnaval (Vastenavond) en dus als één volk van carnaval-liefhebbers beschouwd kunnen worden, of dat deze groepen feitelijk twee verschillende populaties vormen.

De Mann-Whitney U test en de Kruskall-Wallis test

Het principe achter een Mann-Whitney U test is het gebruiken van de rangordescores van twee groepen voor observaties. Deze observaties gaan over een bepaald kenmerk en de verkregen informatie is de grondstof voor het testen van een hypothese over overeenkomsten of verschillen tussen twee populatiedistributies. Vervolgens wordt gekeken of een onderzoeksuitkomst overeenkomt met de p-waarde of significantie afwijkt.

De gewone kansberekening van een p-waarde geeft de waarschijnlijkheid aan voor het bestaan van een bepaalde rangorde in scores. Als aan die p-waarde wordt voldaan, dan zou deze voor beide groepen even sterk moeten zijn. Als voorbeeld kun je denken aan de kans dat Brabanders dan wel Limburgers meer of minder tijd steken in carnaval. Als dat zo is, dan is er eenzelfde verdeling van tijdsbesteding door de leden van die twee groepen van laag naar hoog. Er zijn bij een gelijke verdeling van rangorde in tijdsbesteding dus evenredig veel Brabanders (of Limburgers) die maar één avondje meehossen. Tegelijkertijd zijn er evenredig veel Brabanders (of Limburgers) die pas dinsdagnacht (woensdagochtend) klaar zijn met carnaval. In deze situatie neem je niet de Zeeuwen of Utrechters in je vergelijking mee, terwijl die wel relevant kunnen zijn.

Het vraagstuk in dit artikel is wat te doen als je meer dan 2 onafhankelijke groepen (aangeduid met het getal J =…) op één kenmerk wilt vergelijken en géén gebruik kan maken van het gemiddelde of de standaarddeviatie.

Kruskall-Wallis test: uitbreiding van Mann-Whitney U test

De Kruskall-Wallis test is een belangrijke uitbreiding van de Mann-Whitney U test. Technisch wordt dit een J-sample rank test genoemd. Je kijkt naar rangordes binnen J aantal groepen. Het principe is hier dat de scores van alle cases over alle groepen gecombineerd worden en hier dan een rangorde-getal aan toegekend wordt. Daarna worden voor elke onderscheiden groep afzonderlijk de rangorde-getallen opgeteld. Uit deze optellingen wordt de Kruskall-Wallis statistiek berekend. Deze waarde geef je aan met de letter H. De waarde voor H wordt onderworpen aan de hypothesetest. Vervolgens wordt nagegaan of de teststatistiek H0 bij een gegeven waarde voor α (alfa) en een bekende omvang van de steekproef n gelijk is aan de gevonden uitkomst van de waarde voor H. De waarde n is dan de optelling van de aantallen elementen per deelnemende deelpopulatie. Je schrijft dit als: n = n1 + n2 +… + nj

De hypothese is of de gevonden H-waarde H0 meer dan toevallig verschilt van de kritische waarde H, of dat de waarde zo ver buiten het verwerpingsgebied blijft dat er kennelijk geen significant verschil is tussen de onderzochte groepen.

Stappenplan Kruskall-Wallis test

In het volgende voorbeeld van een fictief onderzoek zie je in stappen hoe de Kruskall-Wallis test werkt.

Stap 1 - De onderzoeksvraag

Het vraagstuk in dit voorbeeld betreft een fictief onderzoek. De vraag is of in drie verschillende dorpen in dezelfde provincie ongeveer evenveel vogelsoorten rondvliegen. Ofwel dat het ene dorp beduidend vogelrijker is dan andere dorpen. Technisch gezien is dus de vraag of de verdeling van vogels per dorp gelijk is of dat er een verschil is in de verdeling van vogels. Gezien dit onderzoek maar 12 deelnemers kent (omdat er niet evenveel spotters per dorp meedoen) en omdat er eigenlijk niets bekend is over de populatiedistributie, wordt niet uitgegaan van het verschil per even grote subgroep in gemiddelde of standaarddeviatie. De gegevens zijn wel ’continu’: de aantallen van de vogelsoorten kunnen gewoon doorgeteld en als reële getallen verrekend worden.

Stap 2 - Registratie van aantal gespotte vogels per dorp

Binnen dit voorbeeldonderzoek vraag je 12 vogelspotters om op dezelfde dag voor dezelfde periode waarnemingen van vogels te doen. De waarnemingsscores registreer je eerst per spotter en dan per dorp. In de volgende tabel zie je de eerste resultaten:

Kruskall-Wallis test tabel 1
Tabel 1: gespotte vogelsoorten per dorp.

Stap 3 - Toekennen van de rangorde in aantallen

In deze stap sorteer je de aantallen waarnemingen per spotter in rangorde van klein aantal naar groot. Aan die uitkomst ken je een rangordegetal toe. Hoe hoger in de sortering, des te groter is het rangordegetal. Dat kan samengevat worden in de volgende tabel:

Kruskall-Wallis test tabel 2
Tabel 2: Ranggetallen bij aantallen gespotte vogelsoorten per dorp.

Stap 4 - Berekenen van de rangsom per dorp (categorie)

In de volgende stap bereken je over drie categorieën de som van de ranggetallen per aantal en per categorie. De categorie is hier steeds één dorp: er zijn dus drie categorieën. Deze berekening is in de volgende tabel uitgewerkt:

Kruskall-Wallis test tabel 3
Tabel 3: Rangsommen per categorie.

Stap 5 - Vaststellen van de T-waarden

Je wilt nu een feitelijk gevonden getal toetsen aan een waarschijnlijkheidsgetal. Dat is dan de P-waarde die bepaalt of je uitkomst toeval is of boven kans afwijkt. Ofwel, dat de hypothese kan blijven staan of dat deze verworpen mag worden.

Voor de verdere verwerking in de formule voor deze statistische test heb je T-waarden nodig. De T-waarden zijn de rangsommen per ‘steekproef’. Dat zijn in dit voorbeeld de sommen van ranggetallen per dorp. In dit voorbeeld heb je dan: T1=21; T2=45 en T3=12.

De grote variatie in waarden voor T betekent al dat er opvallende verschillen zijn tussen de verdeling van vogelsoorten per dorp. Of dit toeval of statistisch significant is, ga je in de volgende stappen uitzoeken.

Nu zijn er moeilijke en korte wegen naar een statistisch gefundeerd oordeel. Je kan (volgens de fundamentele manier) de kansberekening uitwerken voor het wel/niet toevallig voorkomen van de verzamelingen vogelsoorten per dorp. Dus, welke kans is er (statistisch gezien) op een waarde van T1=21; T2=45 en T3=12? Dat kan onderzocht worden, maar dit is een enorme klus. We laten die uitleg dus weg. Je kunt jezelf deze klus besparen met de volgende statistiek:

Formule voor de Kruskal-Wallis H test:

H = 12/n(n+1) * [∑pi=1(Ti2/ni)] – 3(n+1)

Dat wil zeggen dat H is gelijk aan:

  • 12 gedeeld door het product van n met n+1, maal...

  • De gemeenschappelijke optelling van...

  • Het kwadraat van de rang-som gedeeld door het aantal elementen in de deelpopulatie, minus...

  • Het product van het aantal deelpopulaties, maal...

  • Het aantal cases in dit onderzoek plus 1. Dat is hier het aantal vogelspotters plus 1.

Stap 6 - Berekenen van de H-waarde uit dit onderzoek

In een statistisch tabellenboek vind je kansberekeningen voor H. Dan vind je dus de kritische waarden voor H’ (ofwel, Ha accent) in die kansverdelingen voor H. Daar lees je de kans dat je uitkomst H minstens even groot is als de verwachte waarde: ofwel, de P-waarde: P(H>H’).

Voor dit voorbeeld met steekproefgroottes van 3, 5 en 4 resultaten van vogelspotters bestaat het verwerpingsgebied uit waarden voor H’>5,6564 omdat de P-waarde is: P(H>5,6564) =0,049. Als H dus groter is, is er een meer dan een toevallig verschil.

Je vult nu alle gevonden waarden in de beschreven formule in. Dan vind je:

H = [12/(12*13)] * [(212/3+452/5+122/4] – 3*13 = 6,2308.

Stap 7 - Testen van hypothese en vaststellen van uitkomst van de test

Je ziet dat de waarde H = 6,2308 groter is dan de waarde H’>5,6564. Hier zie je dat deze waarde in het verwerpingsgebied voor α = 0,05 valt. Je kan dus vaststellen dat de drie dorpen significant verschillen in de verscheidenheid aan vogels. Ofwel, dat de drie dorpen in hun verdeling van vogelsoorten niet identiek zijn.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?