- Scriptium
- Posted on
- Geen reacties
Wat is een nulhypothese?
Een nulhypothese is een veronderstelling of bewering die aan de hand van onderzoeksgegevens over bepaalde variabelen wordt getest. Daarvoor gebruik je in veel gevallen, statistische analyses. Je zoekt dan, of een verschijnsel statistisch significant is of aan toeval kan worden toegeschreven. De nulhypothese omschrijft meestal de afwezigheid van een effect, verschil of relatie tussen variabelen. Daar staat dan een alternatieve hypothese tegenover die net het tegendeel beweert: de meer dan toevallige (boven kans) aanwezigheid van een effect, verschil of relatie tussen variabelen. Dan pas spreek je van een significante onderzoeksuitkomst.
Hoe werkt de nulhypothese in praktijk?
Hier zijn enkele voorbeelden van nulhypothesen die de afwezigheid van een effect, verschil of relatie tussen variabelen beschrijven in verschillende domeinen:
-
Voorbeeld uit de psychologie
Nulhypothese: "Er is geen verschil in gemiddelde scores voor zelfvertrouwen tussen mannen en vrouwen." -
Voorbeeld uit de sociologie
Nulhypothese: "Er is geen verschil in werkloosheidspercentages tussen mensen met een universitair diploma en mensen zonder een universitair diploma." -
Voorbeeld uit de biologie
Nulhypothese: "Er is geen effect van het nieuwe medicijn op de groeisnelheid van planten." -
Voorbeeld uit de marketing
Nulhypothese: "Er is geen verschil in verkoopcijfers tussen klanten die een kortingsbon ontvangen en klanten die geen kortingsbon ontvangen." -
Voorbeeld uit de onderwijskunde
Nulhypothese: "Er is geen verschil in wiskundeprestaties tussen studenten die online les volgen en studenten die traditioneel les volgen." -
Voorbeeld uit de economie
Nulhypothese: "Er is geen verband tussen het bruto binnenlands product (BBP) en de werkloosheidsgraad."
Het formuleren en testen van een nulhypothese helpt jou als onderzoeker om door middel van statistische analyse een specifieke bewering te weerleggen of te bevestigen. Dat betekent, het op basis van de nulhypothese vergelijken van waargenomen gegevens met verwachte resultaten.
De nulhypothese wordt genoteerd als H0 met een bepaalde, vooronderstelde waarde of een vooronderstelde overeenkomst.
De alternatieve hypothese wordt genoteerd als H1 met een afwijkende of aan H0 tegengestelde, vooronderstelde waarde of een vooronderstelde overeenkomst.
Stappen in het testen van een nulhypothese
In de volgende stappen test je de nulhypothese
Formuleer de nulhypothese: Definieer de nulhypothese op een duidelijke en specifieke manier, waarbij je aangeeft welk effect, verschil of relatie je verwacht dat afwezig is.
Verzamel gegevens: Verzamel de benodigde gegevens die relevant zijn voor je onderzoeksvraag en hypothesen.
Stap 1: Keuze van de test
Kies een geschikte statistische test: Bepaal welke statistische test geschikt is voor je onderzoeksvraag en de aard van je gegevens. De statistiek biedt een breed scala aan statistische analyses. Als voorbeelden kan je kijken naar t-toetsen, variantieanalyse (ANOVA) en meervoudige variantieanalyse (MANOVA), regressieanalyse en chi-kwadraattoetsen.
Het toetsen van de nulhypothese met deze analyses betekent per toets kort gezegd het volgende:
-
T-toetsen. T-toetsen worden gebruikt om te bepalen of er een significant verschil is tussen de gemiddelde scores van twee groepen. Ze meten de betekenis van het verschil tussen de gemiddelden van de steekproeven in verhouding tot de variabiliteit binnen elke groep. Dit type toets wordt vaak gebruikt bij het vergelijken van de gemiddelde scores van een interventiegroep en een controlegroep.
-
Variantieanalyse of Analysis Of Variance (ANOVA). ANOVA is een statistische techniek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelde scores van drie of meer groepen. In plaats van het vergelijken van slechts twee groepen, zoals bij de t-toets, vergelijkt ANOVA meerdere groepen tegelijkertijd. Het verdeelt de totale variantie in de gegevens in verschillende componenten om te bepalen of er een significant verschil is tussen de groepsgemiddelden.
-
Meervoudige variantieanalyse of Multiple Analysis Of Variance (MANOVA). MANOVA is een uitbreiding van ANOVA die wordt gebruikt wanneer er meerdere afhankelijke variabelen zijn. Het meet of er een significant verschil is tussen de gemiddelden van twee of meer groepen op een combinatie van afhankelijke variabelen. Het wordt vaak gebruikt wanneer er behoefte is aan een gelijktijdige beoordeling van meerdere uitkomstmaten.
-
Regressieanalyse. Regressieanalyse wordt gebruikt om de relatie tussen een afhankelijke variabele en één of meer onafhankelijke variabelen te onderzoeken. Het meet de mate waarin veranderingen in de onafhankelijke variabelen samenhangen met veranderingen in de afhankelijke variabele. Regressieanalyse kan worden gebruikt om voorspellingen te doen, trends te identificeren en de sterkte en richting van relaties te bepalen.
-
Chi-kwadraattoetsen. Chi-kwadraattoetsen, waaronder de Chi-kwadraattoets voor onafhankelijkheid en de Chi-kwadraattoets voor goedheid van fit, worden gebruikt om te bepalen of er een significant verband bestaat tussen twee categorische variabelen. Deze tests vergelijken de waargenomen frequenties van gegevens met de verwachte frequenties onder de veronderstelling van geen verband. Chi-kwadraattoetsen kunnen worden toegepast op gegevens die zijn samengevat in kruistabellen om te bepalen of er een statistisch significant verband bestaat tussen de variabelen.
Voor de validiteit van je onderzoek is het belangrijk om vooraf een weloverwogen keuze te maken, welke analyse het beste past bij de eigenschappen van jouw data en jouw onderzoeksdoel.
Stap 2: De analyse
Voer de analyse uit. Dat kan met pen, papier en rekenliniaal maar liever gebruik je een statistisch pakket zoals SPSS. Als je kiest voor geautomatiseerde ondersteuning van je analyse, laad je gegevens in een statistisch pakket zoals SPSS en voer je de gekozen statistische test uit. Gebruik de juiste invoervelden en opties in SPSS om de analyse correct uit te voeren. Dit vraagt van jou zowel een goed begrip van wat je inhoudelijk aan het doen bent als handigheid met het werken met een pakket als SPSS.
Stap 3: Significantieniveau
Stel het significantieniveau vast. Bepaal het niveau van significantie (alfa) dat je wilt gebruiken om te beslissen of je de nulhypothese verwerpt. Vaak wordt een significantieniveau van 0,05 (5%) gebruikt. Wees je bewust van de aard van de aard van het onderzoek en de consequenties van de uitkosten. Het maakt bij deze stap veel uit of jij je afvraagt, hoeveel lood en cadmium als zware metalen in kinderspeelgoed zijn verwerkt of zijn verwerkt in de pigmenten van schilderijen in het Rijksmuseum. De wetenschappelijke maar ook de maatschappelijke context is vaak bepalend voor een getalsmatig hoog of een laag significantieniveau als relevant niveau.
Stap 4: Interpretatie
Interpretatie van de resultaten: Analyseer de uitvoer van de statistische analyse en bepaal of de p-waarde (probability value) kleiner is dan het vooraf bepaalde significantieniveau. Als de p-waarde kleiner is dan het significantieniveau, verwerp je de nulhypothese ten gunste van de alternatieve hypothese. Als de p-waarde groter is dan het significantieniveau, accepteer je de nulhypothese omdat er onvoldoende bewijs is om deze te verwerpen. In de output van SPSS zie je wel een uitkomst maar wat deze betekent moet je zelf inhoudelijk verantwoorden. Dit vraagt wel een goed begrip van kansberekening. Wat de p waarde inhoudelijk e
Bij een klein onderzoek kom je voor het toetsen van een hypothese al heel ver met een schrift & balpen, een rekenmachine en gezond nadenken. Als je echter werkt met veel data en veel complexe bewerkingen dan is de kans op reken en denkfouten als nel groot. Dan is elke hulp welkom.
SPSS kan helpen bij het toetsen van je hypothese. Dat kan door het geautomatiseerd uitvoeren van statistische analyses. SPSS biedt een gebruiksvriendelijke interface voor het invoeren, bewerken en analyseren van gegevens. De tijd is voorbij dat je eerst een deck ponskaarten moet maken en maar hopen dat er niet een fout in zit waardoor je hele job waardeloos wordt geannuleerd.
Het pakket biedt ook geavanceerde statistische functies en opties om relevante resultaten te genereren, zoals p-waarden, betrouwbaarheidsintervallen en effectgroottes. Daar moet je wel zelf bij bedenken wat voor jouw tak van wetenschap passend en relevant is. Zo kan een ondernemer blij zijn als maar 20% van zijn beslissingen een blunder blijkt te zijn maar als interventiecardioloog mag je aan een lager percentage foutjes denken. SPSS automatiseert veel berekeningen en helpt bij het visualiseren en interpreteren van de resultaten, waardoor het testen van de nulhypothese gemakkelijker wordt voor onderzoekers.
1. Praktijkvoorbeeld uit de economie
Stel dat een onderzoeker geïnteresseerd is in het effect van reclame op de verkoopcijfers van een product. De nulhypothese in dit geval zou kunnen zijn:
H0: "Er is geen verschil in verkoopcijfers tussen de groep consumenten die blootgesteld is aan reclame en de groep consumenten die niet blootgesteld is aan reclame."
Door gegevens te verzamelen over de verkoopcijfers van beide groepen en statistische analyses uit te voeren, kan de onderzoeker proberen de nulhypothese te weerleggen of te bevestigen.
Welke statistische toets is het meest relevant?
In het gegeven praktijkvoorbeeld, waarbij de onderzoeker geïnteresseerd is in het effect van reclame op de verkoopcijfers van een product, zou regressieanalyse de meest relevante statistische toets zijn.
Regressieanalyse kan helpen om de relatie tussen reclame (onafhankelijke variabele) en verkoopcijfers (afhankelijke variabele) te onderzoeken. Door de gegevens van zowel de blootgestelde groep consumenten als de niet-blootgestelde groep te verzamelen, kan de onderzoeker een regressiemodel opstellen om te bepalen of er een significant verband bestaat tussen de reclameblootstelling en de verkoopcijfers.
De onderzoeker kan verschillende statistische methoden toepassen, zoals lineaire regressie, om de sterkte en richting van de relatie te bepalen. Bovendien kan het regressiemodel gebruikt worden om voorspellingen te doen over de verkoopcijfers op basis van de reclame-uitgaven.
Het is ook belangrijk om rekening te houden met eventuele andere variabelen die van invloed kunnen zijn op de verkoopcijfers, zoals prijs, concurrentie of seizoensinvloeden. Een meervoudige regressieanalyse kan worden toegepast om de impact van meerdere variabelen tegelijkertijd te onderzoeken en het specifieke effect van reclame te isoleren.
Kortom, regressieanalyse is de meest relevante statistische toets in dit praktijkvoorbeeld om het effect van reclame op de verkoopcijfers van het product te onderzoeken.
2. Praktijkvoorbeeld uit de biologie
Stel dat een onderzoeker wil onderzoeken of een bepaald geneesmiddel effectief is bij het verminderen van de bloeddruk bij patiënten met hypertensie. De nulhypothese zou kunnen luiden:
"H0: Er is geen verschil in bloeddrukniveaus tussen de groep patiënten die het geneesmiddel ontvangt en de groep patiënten die een placebo ontvangt."
Door patiënten willekeurig toe te wijzen aan een van de twee groepen en vervolgens de bloeddrukniveaus te meten en te vergelijken, kan de onderzoeker de nulhypothese onderzoeken en proberen te weerleggen of te bevestigen.
Het testen van de nulhypothese in deze voorbeelden omvat het verzamelen van gegevens, het uitvoeren van statistische analyses en het interpreteren van de resultaten om te bepalen of er voldoende bewijs is om de nulhypothese te verwerpen ten gunste van een alternatieve hypothese.
Welke statistische toets is het meest relevant?
In het gegeven praktijkvoorbeeld, waarbij de onderzoeker wil onderzoeken of een bepaald geneesmiddel effectief is bij het verminderen van de bloeddruk bij patiënten met een te hoge bloeddruk (hypertensie), zou de meest relevante statistische toets een t-toets voor onafhankelijke steekproeven zijn.
De onderzoeker kan patiënten willekeurig toewijzen aan twee groepen: de groep die het geneesmiddel ontvangt en de groep die een placebo ontvangt. Vervolgens worden de bloeddrukniveaus van beide groepen gemeten. Door een t-toets voor onafhankelijke steekproeven uit te voeren, kan de onderzoeker bepalen of er een significant verschil is tussen de gemiddelde bloeddrukniveaus van de twee groepen.
De t-toets voor onafhankelijke steekproeven vergelijkt de gemiddelden van twee onafhankelijke groepen en meet of het waargenomen verschil tussen de groepsgemiddelden statistisch significant is. In dit geval vergelijkt de t-toets de bloeddrukniveaus van de groep die het geneesmiddel ontvangt met die van de placebogroep om te bepalen of het geneesmiddel een significant effect heeft op het verminderen van de bloeddruk.
Het is belangrijk om ervoor te zorgen dat de steekproeven willekeurig en representatief worden toegewezen, en dat andere relevante factoren die van invloed kunnen zijn op de bloeddruk worden gecontroleerd. De t-toets kan helpen bij het beoordelen van het specifieke effect van het geneesmiddel op de bloeddruk, terwijl andere mogelijke verstorende variabelen worden gecontroleerd.
Kortom, in dit praktijkvoorbeeld is de t-toets voor onafhankelijke steekproeven de meest relevante statistische toets om te bepalen of het geneesmiddel effectief is bij het verminderen van de bloeddruk bij patiënten met hypertensie.
Uit deze praktijkvoorbeelden volgt, dat jij als onderzoeker veel gemak kan hebben van een pakket als SPSS. Het blijft belangrijk om goed na te denken voor je deze of die analyse aantikt. De automatische piloot vliegt strak volgens opdracht maar jij blijft de gezagvoerder. Het blijft jouw hypothese.
Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in
Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.
De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt.