Wat is significantie?

Significantie wil zeggen dat iets van betekenis is. Statistische significantie betekent dat het onderwerp of het onderzochte verschijnsel meer dan toevallig lijkt te zijn aangetroffen. Daarbij baseert de onderzoeker zich op de regels van de statistiek. Vanuit de theorie voor kansberekening is iets ‘boven kans’ waargenomen.

Statistische onderzoeksmethoden worden ingezet om vast te stellen of iets sterk afwijkt van een pure kansberekening. Immers, een verschijnsel onder een populatie kan zich louter toevallig voordoen. Een bepaalde score of een variabele in een steekproef kan een eenzame toevalstreffer zijn. We willen weten of iets juist niet alleen maar toevallig is gebeurd.

Wanneer doe je een significantietoets?

In sociale wetenschappen wordt aan de hand van een hypothese significantie onderzocht. De hypothese omschrijft een vermoeden over een bepaald verschijnsel binnen de onderzoekspopulatie. Dat verschijnsel heeft heel vaak een bepaald waarschijnlijkheidskarakter. NB: in de natuurwetenschappen beschrijft een hypothese vaak een natuurverschijnsel dat of wel plaatsvindt of niet. Immers, een appel kan niet een beetje vallen. 

In een verkennend onderzoek is men vooral geïnteresseerd in beschrijvende statistieken. Zo vindt een verkeersbureau het heel interessant hoeveel toeristen een toeristische attractie bezoeken en wat de gemiddelde uitgaven per dag zijn. Bij een onderzoek naar rookgedrag onder middelbare scholieren wil men eerst weten om welke aantallen rokers het gaat en hoeveel sigaretten per dag gemiddeld worden gerookt.

In een toetsend onderzoek gaat het om het trekken van conclusies over een kenmerk van een populatie of een verschijnsel binnen een bepaalde doelgroep. Dan is men vooral geïnteresseerd in bijvoorbeeld:

  • De waarschijnlijkheid dat dit verschijnsel zich weer of altijd voordoet.

  • Welke verschijnselen leiden tot een ander verschijnsel.

  • In hoeverre het verschijnsel zowel onder de ene deelpopulatie als onder de andere deelpopulatie plaatsvindt.

Men is op zoek naar een niet-toevallig optreden van een verschijnsel, een mogelijke vaste samenhang tussen variabelen, of een causale relatie van de ene op de andere variabele. Dan is men op zoek naar de inferentiële statistieken. In al deze gevallen wil men weten of de gevonden data van doorslaggevende betekenis zijn; of deze significant zijn. Of dat ze als louter toeval afgewezen kunnen worden.

Voor het bepalen van de significantie van deze vragen is het belangrijk een eenduidige hypothese te formuleren. Daarbij is het ook van belang zich af te vragen welke vorm van kansverdeling ten grondslag ligt aan het optreden van dat verschijnsel. Er bestaan veel verschillende typen kansverdelingen. Er bestaan ook veel verschillende statistische toetsen die juist zijn ontwikkeld voor een bepaald type hypothese. Daarom spreekt men ook wel van het toetsen van een hypothese met een bepaalde toets.

Zo wordt voor een specifieke hypothese met een bepaald soort statistische toets bekeken of een onderzocht verschijnsel significant is. De significantietoets moet uitwijzen of de hypothese dat er niets aan de hand is moet worden gevold. Of dat er juist wel iets aan de hand is en de hypothese kan vervallen. NB: het gaat hier om het begrip ‘significantie’. Details, verschillen en overeenkomsten van de statistische toetsen en voor welk type hypothese deze worden gebruikt, vallen vanwege de enorme omvang buiten dit artikel.

Stappen naar een significantietoets

1. Hypothese bepalen

Voor het toetsen van significantie worden vaak een paar hypothesen geformuleerd:

  • De nulhypothese, genoteerd als H0 = beschrijft een situatie waarin er niets aan de hand is.

  • De alternatieve hypothese, genoteerd als H1 of HA= waarin wordt omschreven dat er wel iets aan de hand is.

2. Verwachte waarden omschrijven

Aan de hand van de hypothese wordt bedacht met welke waarschijnlijkheid het verschijnsel bij toeval optreedt of tot welke waarschijnlijkheidsverdeling dit verschijnsel is te rekenen. Daarbij denkt men voor discrete random variabelen aan bijvoorbeeld de volgende bekende kansverdelingen: Binomiale verdeling, Pascal verdeling, Poissonverdeling, Normaal verdeling.

De onderzoeker bekijkt welke waarden redelijkerwijs volgens de geldende kansberekening zijn te verwachten. Dat zijn dan de Expected Values of de P-waarde.

3. Dataverzameling

Voor de significantietoets worden data verzameld: metingen onder de populatie of registraties in een experiment, dan wel waarnemingen in een relevante steekproef. Dat kunnen metingen onder een populatie zijn of experimenten aan de hand van steekproeven. Het onderzoeksontwerp (experimental design) wordt grotendeels bepaald door de hypothese die men wil toetsen. Gaat het om een verschijnsel dat vanzelf optreedt? Gaat het om een effect van de ene variabele op de andere? Of gaat het om het gelijktijdig optreden van deze en die variabele?

4. Data-analyse

Uit de data worden de gebruikelijke beschrijvende statistieken opgemaakt. Daaruit volgt of de gevonden data deze of gene kansverdeling lijken te volgen. Vervolgens worden de data onderworpen aan de gekozen statistische toets. Zo kan men bijvoorbeeld aan de hand van een T-toets van verschil bepalen of de mannelijke deelnemers aan de balletacademie even stug roken als de vrouwelijke deelneemsters. Dus of er een significant verschil op gender is op te merken. Of bij een variantieanalyse bekijken of de variabele ervaren stress significant samenhangt met de variabele neiging tot roken.

5. Interpretatie en conclusie

Uit analyse van de gevonden data volgt dan hoe deze zich verhouden tot de verwachte waarden: of er data worden gevonden met een waarde die sterk afwijkt van de verwachte waarden. En dus of het verschijnsel ruimschoots boven de toevalsfactor waarden optreedt. Met andere woorden, of het verschijnsel inderdaad niet louter aan toeval is toe te schrijven, en het verschijnsel dus daadwerkelijk significant is.

Als zich dus iets voordoet dat een verschijnsel een heel erg kleine waarschijnlijkheid blijkt te hebben, dan is er meestal niets aan de hand. Daarom wordt wel gezegd: “If P is low, hypothesis must go”.

Het bepalen van een significantieniveau

Significantie kan worden bepaald in opeenvolgende maten. Iets is nooit wel of niet significant. Iets is altijd significant op een bepaald niveau. Dan zegt men dat dit volgens het vastgestelde significantieniveau, significant is.

Voor het significantieniveau bestaat geen ijzeren wet. Het ligt aan het doel van het onderzoek en de onderzochte materie welk significantieniveau passend wordt gevonden. Daarbij wordt afgewogen wat erger is: of straks de nulhypothese ten onrechte wordt verworpen of dat straks ten onrechte de alternatieve hypothese wordt verworpen. Bij een medische test noemt men dat ook: vals positief of vals negatief. De test wijst ten onrechte uit dat iemand zwanger is of de test wijst ten onrechte uit dat iemand niet zwanger is. De teleurstelling kan even groot zijn als de waarheid uitkomt.

Als voorbeeld voor een afweging van het significantieniveau noemen we a) onderzoek naar Nederlandse romans en b) ingebruikname van een vaccin.

a) Onder Nederlandstalige inwoners van de vier grote steden wordt een enquête gehouden naar de populariteit van Nederlandse literatuur. De onderzoeker wil weten of er nog een significante behoefte bestaat aan meer literatuur.

b) Daarnaast worden laboratoriumonderzoeken gedaan naar de werkzaamheid van een nieuw vaccin. Men wil weten of dit vaccin afdoende beschermt tegen een nieuw ontdekt virus.

Voor een onderzoek naar de waardering van het werk van Nederlandse romanschrijvers zal een significantieniveau van 20% aardig zijn. Als ten onrechte de nulhypothese ‘geen belangstelling’ of de alternatieve hypothese ‘belangrijke belangstelling’ wordt verworpen, breekt er nog geen brand uit.

Voor de ingebruikname van een vaccin kijkt men liever naar het 0,01% niveau. Als er – ten onrechte – een fout vaccin wordt ingevoerd, óf men ten onrechte verzuimt een passend vaccin in te voeren, zijn de gevolgen soms niet te overzien.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?