Wanneer en waarom doe je een t-toets?

De t-toets van verschil meet de significantie waarmee twee onderzoeksgroepen op één eigenschap van elkaar verschillen. Deze toets wordt vooral gebruikt als sprake is van kleine onderzoeksgroepen: 5 tot hooguit 30 elementen per steekproef of geobserveerde groep. Daarbij kijk je meestal naar het verschil in de gemiddelden op één bepaalde variabele binnen twee groepen. Of naar het verschil tussen het gemiddelde van de steekproef en het eventueel bekende populatiegemiddelde. Zo worden een beschrijvende statistiek van een steekproef en een parameter van een populatie met elkaar vergeleken.

De te toetsen groep of groepen zijn gevormd door observatie in de populatie of een steekproef van dezelfde populatie. Er wordt bij het gebruik van de t-toets vanuit gegaan dat de populatie waaruit de steekproef is getrokken, een normaalverdeling kent. Als je heel veel steekproeven doet, zullen ook het gemiddelde en de variantie van een groot aantal steekproeven een normaalverdeling kennen. 

Nut van de t-toets en varianten

Bij voorkeur wordt in onderzoek gewerkt met zulke grote steekproeven, dat de verkregen metingen een verdeling tonen die de normaalverdeling goed benaderen. Daar hangt dan ook het valide gebruik van bepaalde statistische tests van af. Deze trek naar normaliteit is een gevolg van de centrale limiettheorie.

In alle gevallen gaan we voor de t-toets uit van variabelen waarvoor registraties zijn gemeten op interval- of rationiveau. Dus concrete cijfers waarmee in reële getallen berekeningen gemaakt kunnen worden. Voor de gebruikelijke t-toets gaan we bij verschillende onderzoeksgroepen uit van groepen met een gelijk aantal deelnemers.

Je hebt niet altijd de mogelijkheid of middelen om aan een onderzoeksgroep van n= 30 of meer deelnemers per groep te komen. Of de aard van het onderzoek maakt het heel moeilijk om groepen van meer dan 30 deelnemers in een steekproef te observeren.

Als voorbeelden:

1. Schaarste van proefmateriaal

Bij forensisch onderzoek zijn soms maar een paar spettertjes DNA-materiaal beschikbaar. Een gerechtelijk laboratorium moet soms onderzoek doen met niet meer dan een spatje spuug of één druppel bloed.

2. Kosten van steekproeven

Een steekproef kan forse kosten met zich meebrengen. Voorbeeld: een transportbedrijf dat een onderzoeksopdracht doet, beschikt bijvoorbeeld niet over meer dan 30 vrachtwagens. Daarvan moeten er ook nog eens 10 wagens blijven rijden om niet het hele bedrijf lam te leggen. Voor een onderzoek naar de gemiddelde transportkosten per wagen voor en na een kostbaar en grootschalig onderhoud, lijkt de t-toets heel nuttig. Dan zijn niet alle 30 wagens nodig.

3. Noodzakelijk kleine enquêtegroep

In de onderzoeksgroep kan soms maar een beperkt aantal leden zijn. Voor een enquête over werkdruk en arbeidsverzuim bij een bepaalde basisschool bijvoorbeeld, lukt het niet om meer dan 8 groepsleerkrachten te vinden. Er zijn er gewoon niet meer. En toch wil je een significantietoets doen over verschil in arbeidsbeleving tussen 6 voltijdse werkers en 6 deeltijdwerkers.

Hoe doe je een t-toets?

Eerst formuleer je een gedegen onderzoeksvraag en een onderzoeksplan. Daarbij let je op de hypotheseformulering voor een t-toets. De t-toets voor verschil voor kleine groepen is nuttig voor het toetsen van de volgende hypotheses:

Deelpopulatie-gemiddelde 0 is gelijk aan deelpopulatie-gemiddelde 1:

H0: µ:  µ0= µ1

HA: µ:  µ0 ≠ µ1

Of: 

Verschil tussen deelpopulatiegemiddelde 0 met deelpopulatiegemiddelde 1 is nul:

H0: µ:  µ0 –  µ1 = 0

HA: µ:  µ– µ1 ≠ 0

Dus, de nulhypothese stelt dat er voor een bepaald gemiddelde geen verschil is met het populatiegemiddelde. De alternatieve hypothese stelt dat er wel verschil is.

Onderzoeksvragen en gebruik van de t-toets

Het onderzoek kan gaan om de volgende toetsvragen:

Gemiddelden van maximaal twee groepen uit dezelfde populatie met elkaar vergelijken: twee deelpopulaties of gepaarde elementen uit dezelfde populatie. Bijvoorbeeld:

Niet-gepaarde elementen

Koopgedrag op Black Friday van mannelijke winkelaars tegenover vrouwelijke winkelaars, waarbij de deelpopulatie MANNEN in het algemeen wordt vergeleken met de deelpopulatie VROUWEN.

Gepaarde elementen

Koopgedrag op Black Friday van echtgenoten uit één huishouden, waarbij bij deze paren [partner 1 en partner 2] het verschil in koopgedrag tussen partners 1 en partners 2 wordt getoetst. Wie heeft de creditcard laten smelten?

Gemiddelde van een en dezelfde groep vóór en na interventie vergelijken.

Bijvoorbeeld: gemiddeld ziekteverzuim van medewerkers vóór het volgen van een leefstijlcursus tegenover ziekteverzuim van medewerkers na dit programma. NB: dit zegt iets over het verschil maar nog niet over het statistische effect van de interventie.

Principiële onderbouwing van de t-toets

De waarde voor de teststatistiek t gedraagt zich als zoveel andere toetsen, namelijk als een kansverdeling volgens een bepaalde mathematische onderbouwing.

Volgens de centrale limiettheorie zal de volgende formule ongeveer voldoen aan een normale verdeling als de steekproefomvang n =? groot genoeg is. We gaan uit van n > 30.

t-toets formule 1

Daarbij is:

  • z: gestandaardiseerde score

  • M: het steekproefgemiddelde

  • µ: populatiegemiddelde

  • σ: populatie-standaarddeviatie

  • √n: vierkantswortel uit de steekproefomvang

Om te zien of een gevonden steekproefwaarde binnen of buiten het statistisch verwerpingsgebied valt, kan de gestandaardiseerde score worden berekend. Daarvoor raadpleeg je een standaard-normaaltabel. Met deze score z kan de kansdichtheid voor de gevonden z-waarde in de tabellen voor F(z) worden opgezocht.

NB: zonder nu op de wiskundige onderbouwing in te gaan, bedenk je dat de standaardfout (standard error) van het gemiddelde wordt berekend met σ/ n: de populatiestandaarddeviatie (wortel uit de variantie) gedeeld door de vierkantswortel uit de onderzoeksteekproefomvang.

Bij een eenzijdige statistische test wordt de nulhypothese voor α = 0,05 verworpen als z groter is dan 1.645. Dat gaat op als de waarde voor de populatievariantie σ bekend is, en als de gevonden waarde is gebaseerd op een voldoende grote steekproef. In de praktijk gaat men uit van n > 30.  

De t-toets gebruiken als een soort z-waarde

Als we ons voorstellen dat een steekproef wordt getrokken uit een normaal verdeelde populatie, en we gaan uit van een steekproef met een bepaald aantal n= (reëel getal), en er wordt een groot aantal experimenten uitgevoerd, dan wordt (theoretisch) een groot aantal waarnemingen bereikt. Van deze waarnemingen is een frequentieverdeling op te stellen voor de verschillende waarden van deze test-statistiek.

De verdeling voor streekproeven die zijn getrokken uit een normaal verdeelde populatie, benadert in vorm dan de normaalverdeling. Naarmate de n= groter wordt, wordt de verdeling ook meer gelijkvormig aan een normaalverdeling. De grafiek of curve voor deze verdeling kruipt naar dezelfde ideale klokvorm van de Gausskromme. Daarmee gaat een waarde ‘t’ overeenkomst vertonen met de gestandaardiseerde waarde ‘z’. Ook de standaarddeviatie van de populatie en het gemiddelde van de populatie gedraagt zich ‘normaal’. Algemeen omschreven als:

t-toets formule 2

Het populatiegemiddelde is de beste verwachting voor het gemiddelde van ‘normale’ steekproeven. De standaarddeviatie van de gemiddelden in steekproeven [est. σM ] wordt geschat door de populatie-standaarddeviatie te delen door de wortel uit de steekproefomvang, ofwel door de standaardfout.

Dit principe werd ontdekt door de Ierse wetenschapper Gosset en onder zijn pseudoniem ‘Student” gepubliceerd in 1908. Daarom wordt vaak verwezen naar ‘Students’ t’ of naar een studentized score.

Berekeningen

Voorbeeld bij:

H0: µ:  µ0= µ1

HA: µ:  µ0 ≠ µ1

Ga uit van:

t-toets formule 3

In deze vergelijking wordt onderzocht of het gemiddelde van de steekproef significant afwijkt of overeenkomt met het gemiddelde van de populatie waaruit de steekproef is getrokken. Daarbij wordt bekeken of het verschil tussen steekproefgemiddelde en populatiegemiddelde al dan niet nul is. De t-waarde wordt gevonden door de verhouding van dit verschil tot de standaardfout van het gemiddelde: σ/ √n.

Voorbeeld bij:

H0: µ1 – µ2 < 0

HA: µ1 – µ2 > 0

Ga uit van:

t-toets formule 4

In deze vergelijking wordt onderzocht of zich een significant verschil voordoet bij het feitelijk verschil tussen steekproef 1 en steekproef 2 met de populatiegemiddelden óf verwachte waarden (E(M) voor het gemiddelde van deze twee deelgroepen.

Nu kan worden berekend of de technische vernieuwing voor een deel van de wagens heeft geleid tot een significante verbetering. Concreet wordt bekeken of het verschil tussen de oude en vernieuwde vrachtwagens zich gunstig verhoudt tot de theoretisch verwachte kostenontwikkeling. Dan leest de eigenaar aan de gevonden t-waarde af of de beoogde kostenreductie voor transporten de verwachtingen overtreft. Dus of revisie voor alle wagens voordeliger is dan één voor één wagens vervangen. 

Gebruik van tabellen voor de t-toets

Voor de kansverdelingen voor t-waarden, de zogenaamde t-distributie, zijn kansverdelingen berekend. Als je statistische software gebruikt, geeft deze gewoon de kanswaarde die je zocht voor t. Als je geen gebruikmaakt van bijvoorbeeld SPSS, moet je speciaal voor t-waarden ontwikkelde tabellen aflezen. Je kan niet gewoon de tabel voor z-waarden gebruiken (ofwel F(z) =), omdat deze tabellen zijn gemaakt voor gestandaardiseerde z-waarden. Een voorbeeld van de tabel voor t-waarden is: Tabel 12 Biometrika Tables for Statisticians, Vol. 1; E.S. Pearson and H.O. Hartley.

Voor de juiste interpretatie van de tabellen letten we op:

1. Waarde voor α

Welke waarde voor α wordt er getoetst met t? Dit wordt bijvoorbeeld voor α = 0,05 genoteerd als t.0,05. Dat betekent dat het verwerpingsgebied begint vanaf rechts van 5% óf links en rechts, elk 0,025%.

2. Eenzijdig of tweezijdig getoetst

Is er dus één α =0,05 en heeft één staart van de curve een verwerpingsgebied en een kritieke waarde die overeenkomt met 0,05? Of wordt er links én rechts getoetst en wordt dus uitgegaan van een kritieke waarde van 0,025?

3. De omvang van de steekproef of steekproeven

Kies de ingang voor de kritische waarde van t voor n =.

Als er één steekproef is, kan in de n= … kolom worden gezocht naar het corresponderende getal onder de waarde voor: n= of voor n1 = en n2=.

Als er twee steekproeven zijn, of twee deelpopulaties zijn geobserveerd, moet worden berekend waar de zogenaamde degrees of freedom zijn. Hoe meer deelnemers in het onderzoek, hoe betrouwbaarder de uitkomst en dus hoe meer ‘vrijheidsgraden’. Daarom wordt berekend: steekproefomvang minus aantal verschillende steekproeven of deelpopulaties = aantal vrijheidsgraden.

Als dus n1= 10 en n2= 12, dan is de waarde die je zoekt in de tabel d.f. = (n1+n2 – 2) = 22-2 = 20

T-toets en wat er zoal meer over te weten is

Met het bovenstaande zijn de meest gebruikelijke onderzoeksopdrachten met een relatief kleine steekproef of steekproeven uit te voeren.

Over de t-toets van verschil is met het bovenstaande slechts een eerste indruk gegeven van het nut en de principes waar deze statistische toets op is gebaseerd. Dit is echter maar een voorproefje. Daar is buiten dit artikel nog veel meer over te melden.

Zo is niet ingegaan op: doelgroepen met verschillende aantallen elementen en dus een aangepaste t-toets, nut of noodzaak voor het gebruik van t-toetsen bij steekproeven n > 30, of de mathematische onderbouwing voor het werken met een t-toets, dan wel de benadering van de statistische power van de t-toets.

Voor vergelijkend onderzoek naar de gemiddelden van meer dan twee groepen van groter dan n=30, gebruik je beter een variantieanalyse (analysis of variance; ANOVA), meervoudige variantieanalyse (MANOVA) of een meervoudige regressieanalyse. Daarbij toets je meteen het verband tussen onafhankelijke en afhankelijke variabelen.

De t-toets geeft een bepaalde verhouding tussen twee deelpopulaties of steekproeven aan, maar geeft nog geen causale relatie of een statistisch effect. Daarvoor kijken we eerder naar schattende of verklarende statistieken, zoals enkelvoudige of meervoudige regressieanalyse of factoranalyse.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?