Hoe bepaal je de grenzen van het verwerpingsgebied?

Voor je onderzoek wil je weten bij welke ruwe score de uitkomst significant is. Bijvoorbeeld bij welke schoenmaat je geen klanten hoeft te verwachten omdat niemand in de klantengroep zulke grote of kleine voeten heeft. Met andere woorden: voor welke schoenmaten je het verwerpingsgebied bepaalt. Voordat je zo ver bent, is eerst een steekproefonderzoek nodig.

Bij het voorbereiden van je onderzoek formuleer je een hypothese. De dataverzameling in je onderzoek gaat over ruwe scores. Op basis van je hypothese wil je weten of een bepaald resultaat significant is of aan toeval kan worden toegeschreven. Je kijkt dus of de uitkomst sterk afwijkt van de verwachte waarde (expected value), oftewel de P-waarde.

Voor je hypothese stel je een grens waarop de hypothese blijft staan of wordt verworpen. Als de waarschijnlijkheid voor een bepaalde uitkomst te laag is, verwerp je de hypothese dat het voorval puur toeval is. Zoals een onverwacht grote voet en dus een bepaalde schoenmaat die puur toeval is.

Je beschrijft vooraf of achteraf het betrouwbaarheidsinterval, oftewel het significatieniveau. Je wilt doorgaans dat het betrouwbaarheidsniveau 70%, 80%, 90% of 95% is. De grens waarvoor een verschijnsel toeval is, is dan 30%, 20%, 10% of 5%. Oftewel een alfawaarde α van 30%, 20%, 10% of 5% en dus 1 – α= 70, 80, 90 of 95. Als iets met een waarschijnlijkheid van 5% optreedt, zal het misschien geen toeval zijn. Er kunnen dus echt mensen zijn die schoenmaat 50 nodig hebben.

Er komt nog meer kijken bij het toetsen van een hypothese, maar dat valt buiten dit artikel. We zoeken hier de grenswaarden in ruwe scores.

Verwerpingsgebied: statistische voorwaarden

Je onderzoekt dus of de uitkomst in het verwerpingsgebied valt voor de kansverdeling van je scores. De vraag is nu welke waarde de grens aangeeft voor toeval of significante uitkomst. Welke waarde moet de ruwe score hebben om tot een significante uitkomst te komen, of toch de nulhypothese te laten staan? Voor de benadering van de grenswaarde in termen van de ruwe scores (X = schoenmaten, boordmaten, glazen bier per week, et cetera) moet je onderzoek wel aan bepaalde statistische voorwaarden voldoen.

Als de frequentieverdeling van je dataset een normaalverdeling heeft, kun je op de volgende wijze de grenzen voor het betrouwbaarheidsinterval benaderen. De verdeling wordt erdoor gekenmerkt dat er evenveel waarden onder het gemiddelde als boven het gemiddelde vallen. De modus en de mediaan zijn dus even groot als het (steekproef)gemiddelde. De verdeling behoort tot de normaalverdelingen. Deze hebben een klokvormige curve, oftewel een kromme van Gauss. Voor deze waarschijnlijkheidsverdeling zijn de x- en y-waarden uitgewerkt als afwijkingen van het gemiddelde en de kans dat die afwijking wordt aangetroffen.

De volgende figuur illustreert het verband tussen standaardafwijking en betrouwbaarheidsniveau: de waarschijnlijkheid voor scores binnen het betrouwbaarheidsinterval of het verwerpingsgebied.

Verwerpingsgebied grafiek 1

Waarschijnlijkheid en standaardafwijking

Hoe verder je op de x-as van het gemiddelde (mean) gaat, hoe meer standaardafwijkingen je tussen de waarde van een bepaalde score en de waarde van het gemiddelde hebt.

Hoe dichter een waarde van het linker- of rechteruiterste van de curve naar het gemiddelde toekomt, des te meer oppervlak zit er onder de curve. Je kunt dat lezen als een Y-waarde die bij een waarde voor X helemaal links op de x-as, erg laag is (kleine kans) en dan steeds meer toeneemt (grote kans) naarmate deze op de x-as opschuift naar het gemiddelde. Voorbij het gemiddelde neemt deze weer sterk af.

Binnen de eerste standaardafwijking vind je volgens de normaalverdeling 68% van de gevallen links en rechts van het gemiddelde. Alleen links of alleen rechts gaat het dan om 68/2, dat is 34%. Binnen de tweede standaardafwijking vind je 95%. Binnen de derde afwijking van het gemiddelde vind je 99,7%. Daarmee zie je het verband tussen waarschijnlijkheid en standaardafwijking.

Het omrekenen van ruwe score naar grenswaarden

Voor het berekenen van die ruwe score die ook de grenswaarde aangeeft, ga je op zoek naar de gestandaardiseerde score die beantwoordt aan die standaarddeviatie waarbij een bepaalde waarschijnlijkheid of betrouwbaarheidsinterval past.

In de kern gaat het om het invullen van de gestandaardiseerde score z (Fisher ’s z), waarbij die waarde overeenkomt met die waarde voor standaarddeviatie waarvoor het percentage van 95, 80 of 70% betrouwbaarheid geldt. Of, elk ander percentage waar jouw onderzoek naar wijst. Op die grens behoud of verwerp je de hypothese.

Je kunt andersom ook bedenken dat er één waarde voor een ruwe score is, waarboven of waaronder je tot actie over gaat. Bijvoorbeeld, een fles die niet genoeg gevuld is of juist te vol is of een band die te veel of te weinig is opgepompt. Dan wordt een norm overtreden waarvoor corrigerende actie nodig is.

De formule die de omrekening mogelijk maakt is:

Uit je dataset bereken je het gemiddelde, de waarde M. Als bekend is wat de populatievariantie is, neem je de populatieparameter σ als noemer voor deze breuk. Het verschil tussen X en M geeft dan een waarde die – ook na deling door σ – positief of negatief is. Dus, een waarde die verwijst naar de standaarddeviatie die je kunt aantreffen op de x-as rechts of links van het gemiddelde.

De z-waarde correspondeert op de volgende wijze met een betrouwbaarheidsniveau. Voor een betrouwbaarheidsniveau van 90% komt de z-waarde op 1,64. Voor 95% op 1,96 en voor 99% op 2,57. Andersom corresponderen opeenvolgende betrouwbaarheidsniveaus met opeenvolgende z-waarden.

Voorbeeld berekening verwerpingsgebied

Normbepaling

Een docent Scandinavische talen zoekt een norm voor de grens geslaagd/gezakt voor proefvertalingen. In de proefvertalingen wordt een Nederlandse tekst omgezet in een tekst in het Noors. Elke fout in grammatica, spelling, zinsbouw of betekenis wordt opgeteld. Maar wanneer is een student nu geslaagd of gezakt? Er is vraag naar een normwaarde.

Bij de proefvertalingen worden gemiddeld 10 vergissingen begaan. Bij ‘één fout één punt’ zou dus vaak een halve studiegroep steeds het semester over moeten doen. Het blijkt dat de standaardafwijking op dit gemiddelde S = 4 is. De gemiddelde afwijking van het gemiddelde is dus 4 fouten meer of minder dan het gemiddelde. De studiegroepen zijn relatief groot (ruim dertig studenten), dus volgens de centrale limiettheorie kan voor het ontwikkelen van een norm worden uitgegaan van een normaalverdeling.

De z-waarde wordt berekend voor (X – 10) / 4. De X-waarde is dan het aantal fouten in de proefvertaling. Bij een grenswaarde van X = 17 is de z-waarde (17 – 10) / 4 = 1,75. Dat wil dus zeggen dat bij 1.5 standaarddeviaties ruimschoots 90% van de jaargroep moet kunnen slagen. Met één op de tien ‘zakkers’ blijft het ook nog uitdagend om je best te doen op de voorbereiding.

Als de normbepaling nu zou gaan om het slaan van een gouden herdenkingsmunt met een gegarandeerd gewicht en gehalte, dan zou een norm op 4 standaarddeviatie juist heel goed passen. Immers, elke tiende gram goud afwijking te veel of te weinig is al snel een belangrijke kostenpost of een belangrijke aantasting van de betrouwbaarheid.

Van X-waarde naar kritieke waarde

In een onderzoek van 50 cases is een gemiddelde gevonden van M = 143. De populatie-standaarddeviatie is 35. De alfawaarde is vastgesteld op 5 en het betrouwbaarheidsinterval is dan 1 – α = 0,95 oftewel 95% links en rechts van het gemiddelde (M). Dit komt overeen met een waarde van 1,96 standaarddeviaties onder of boven het gemiddelde.

Nu wordt gezocht naar een schatter voor de steekproefstandaarddeviatie. Daarvoor gebruik je de formule: S = σ / √N. Hierin is…:

  • S de steekproefstandaardafwijking.

  • σ de bekende populatiestandaardafwijking.

  • N de steekproefomvang.

De geschatte S is in dit geval: 35 / √50 = 4,9.

Voor het interval links en rechts van het gemiddelde wordt het interval:

143 – (1,96)(4,9) < M < 143 + (1,96)(4,9) = 133,39  <  M < 152.60.

Bij een waarde van X = 133,39 of kleiner óf een waarde van X = 152,60 of groter is er dus een afwijking van meer dan 1,96 standaarddeviatie. Bij die waarde is er een extreem grote afstand tot het gemiddelde. Dat zijn dan op het vastgestelde niveau van 95% de grenswaarden in de meeteenheid van de ruwe scores voor een significante uitkomst.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?