Belang van de interkwartielafstand

De interkwartielafstand (interquartile range) geeft een maat voor de spreiding of variatie in de verdeling van scores in een bepaalde dataset. Dit geeft een beeld van de afwijking van de scores van het centrum van de verzameling (de mediaan). De interkwartielafstand drukt in één getal het onderscheid uit voor de scores van laag naar hoog voor: – het laagste kwart; – de helft; – de hoogste driekwart van alle gegevens.

Wanneer wordt een interkwartielafstand berekend?

Na de meetfase in een onderzoek wil de onderzoeker voor de nadere analyses een eerste indruk hebben van de samenstelling van de scores. Hoe verschillend zijn de uitkomsten? Waar liggen de zwaartepunten? Hoe samengebald of verspreid zijn de uitkomsten?

Als eerste idee van de spreiding wordt het bereik (range) van de uitkomsten berekend. Daarmee worden de extreme waarden, de hoogste en de laagste score, in verband gebracht.

Daarbij is R een getal, uitgedrukt in de meeteenheden van de scores. Zo slaat R=69 (bijvoorbeeld in een onderzoek naar biergebruik onder studenten) op het bereik tussen maximaal 70 glazen bier per week tot minimaal 1 glas bier per week. Zo kan R=40 ook slaan op het bereik van graden Celsius tussen nachttemperatuur van 0 graden Celsius (vriespunt) en middagtemperatuur van 40 graden Celsius. Dat is wel handig om te weten tijdens een tocht door de Sahara.

Hoe nu temperaturen ‘schommelen’ over de dag, hoe gestaag de hele onderzochte populatie bierdrinkers nu het glas heft, is meteen na de eerste meetfase nog onbekend. Om een eerste idee te krijgen van de spreiding of variatie in de data, wordt de hele dataset opgedeeld in kwartielen:

  • 1e kwartiel: Q1 - Het eerste kwartiel is de waarde Q1 die het eerste kwart van de scores, de eerste 25% tussen hoogste en laagste score afdekt.

  • 2e kwartiel: Q2 - Het tweede kwartiel is de waarde Q2 die de helft, de 50%, van de scores tussen hoogste en laagste score afdekt.

  • 3e kwartiel: Q3 - Het derde kwartiel is de waarde Q4 die driekwart, geheel van 75%, van de scores tussen hoogste en laagste score afdekt.

  • 4e kwartiel: Q4 - Het vierde kwartiel is de waarde Q4 die 100% van de scores tussen hoogste en laagste score afdekt.

NB: Het vierde kwartiel heeft dezelfde nieuwswaarde als de hoogste waarde in het bereik (range) van de verzameling gegevens.

Het tweede kwartiel wordt ook de mediaan genoemd. Deze centrummaat verdeelt de hele dataset precies tussen eerste helft en tweede helft van alle gevonden scores. Het is dus eigenlijk de meridiaan tussen de noordpool en de zuidpool van de gevonden data.

Het 2e en het 3e kwartiel geven enig idee van de spreiding. Daar zien we hoeveel glazen bier per week het eerste kwart van de totale onderzoeksgroep gebruikt, dat het laagste scoort. De mediaan verdeelt de onderzoeksgroep in de eerste 50% klein- en de volgende 50% grootverbruikers. Op het 3e kwartiel vernemen we wat het aantal glazen bier per week is dat 75% of driekwart van de onderzoeksgroep gebruikt. Met de interkwartielafstand zien we in welke stappen de spreiding oploopt van vrijwel géén biergebruik naar maximaal biergebruik.

Benaderen van de kwartielen

In de volgende stappen worden kwartielen berekend:

  • 1. Sorteer de scores van laag naar hoog.

  • 2. Neem de som van het aantal observaties of respondenten (Bijvoorbeeld: N=40).

  • 3. Deel N op in kwarten: eerste 25% = 10; volgende 25% is 20, derde 25% is 30 en vierde en laatste 25% is 40.

  • 4. Volg langs deze volgorde het aantal respondenten of observaties van de eerste tot de laatste waarneming en verdeel de tabel in porties van 25%.

  • 5. Neem waar tot welk aantal de scores zijn opgelopen bij opeenvolgend het 1e, 2e, 3e, en laatste ofwel 4e kwartiel.

De volgende tabel is een weergave van scores en de kwartielen voor deze verzameling gegevens:

Interkwartielafstand tabel 1

Resultaten uit tabel 1:

  • De mediaan betreft 50% van de onderzoeksgroep. Daar is het gebruik 12 glazen bier per week.

  • Het eerste kwartiel geeft een aantal van 6 glazen bier per week.

  • Het derde kwartiel geeft 22 glazen bier per week.

  • De interkwartielafstand is dan kwartiel 3 minus kwartiel 1 is: Q3 – Q1 = 22 glazen bier per week minus 6 glazen bier per week is: 16 glazen bier per week.

Een eerste indruk van de spreiding van scores

Er is met de interkwartielafstand dus al een eerste idee van de spreiding binnen de verzameling gegevens. Het drankgebruik loopt dus in deze onderzoeksgroep op van het eerste naar het derde kwartiel met een stap van 16 glazen.

Een nauwkeuriger maat voor het zwaartepunt of de spreiding van het biergebruik wordt gevonden door berekening van de centrummaten (naast de mediaan (Md), het gemiddelde (M) en de modus (Mod)) en de spreidingsmaten: variantie (aangegeven met: S2) en standaardafwijking (aangegeven met: std. of S). Voor een eerste idee van de veranderlijkheid in de scores van het drankgebruik in dit onderzoek, wordt nu samengevat:

Samenvattend:
Bereik (range):
verschil van 70 minus 1 glas bier per week
R=69
Mediaan:
het getalsmatige midden van de onderzoeksgroep of 50% grens
12 glazen bier per week
1e kwartiel
de eerste 25% van de onderzoeksgroep
6
3e kwartiel
de volgende 75% van de onderzoeksgroep
22
Interkwartielafstand
Q3 minus Q1
16

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?