- Marleen Scriptium
- Posted on
- Geen reacties
Bias in statistiek
Bias in statistiek verwijst naar systematische fouten of afwijkingen in de meting, steekproefselectie of analysemethode die de resultaten van een statistische analyse kunnen vertekenen. Deze vertekening kan leiden tot onnauwkeurige conclusies. Je wilt juist dat je betrouwbare en valide onderzoeksresultaten rapporteert. Daarom is bias een belangrijk probleem bij het uitvoeren van onderzoek en data-analyse.
Er zijn verschillende vormen van bias in statistiek:
-
te beoordelen of een dataset overeenkomt met een bepaalde kansverdeling of,
-
te vergelijken of twee datasets uit dezelfde verdeling komen.
De test meet de gelijkenis tussen de empirische cumulatieve verdelingsfunctie (ECDF) van de dataset en de theoretische cumulatieve verdelingsfunctie (CDF) die wordt aangenomen voor de vergelijking. Dat wil zeggen, de gelijkenis tussen:
-
de uitkomsten uit een verzameling feitelijk observaties of metingen in de praktijk en
-
wat volgens de theorie aan uitkomsten meer of minder waarschijnlijk is.
De test vergelijkt de grootste verticale afstand tussen de ECDF van de steekproef en de CDF van de theoretische verdeling. De Kolmogorov-Smirnov-statistiek die je dan hebt gevonden, wordt vervolgens vergeleken met kritieke waarden uit de Kolmogorov-Smirnov-tabel om te bepalen of de dataset afkomstig is uit de aangenomen verdeling.
Noot: De Kolmogorov-Smirnov-tabel, ook wel bekend als de KS-tabel, wordt gebruikt om kritieke waarden te vinden voor de Kolmogorov-Smirnov-test. Deze tabel wordt gebruikt om de kritieke waarde te bepalen op basis van de steekproefgrootte en het gekozen significantieniveau. Er is niet één specifieke formule om de waarden in de Kolmogorov-Smirnov-tabel te berekenen. Deze waarden zijn eerder empirisch bepaald en verwerkt in statistische tabellen die je in een goed statistiekboek kan vinden. De waarden in de tabel zijn afhankelijk van:
-
Steekproefbias: Dit treedt op wanneer de steekproef die wordt gebruikt om gegevens te verzamelen niet representatief is voor de populatie of de onderzoeksgroep waarop de resultaten van toepassing moeten zijn. Als je bijvoorbeeld alleen mannen in een studie opneemt om conclusies te trekken over de hele bevolking, zou er een geslachtsbias zijn.
-
Selectiebias: Dit ontstaat wanneer bepaalde groepen binnen een steekproef meer kans hebben om te worden opgenomen dan andere. Dit kan optreden als gevolg van een onjuiste aanpak van de steekproefselectie. Als je bijvoorbeeld alleen in een studentencafé de opinie peilt over studiefinanciering dan zullen daar weinig gepensioneerden of personen in fulltime loondienst zijn.
-
Meetbias: Dit is het gevolg van onnauwkeurige of vooringenomen meetinstrumenten of meetmethoden. Als een meetinstrument bijvoorbeeld systematisch hogere waarden registreert dan de werkelijke waarden, ontstaat er meetbias.
-
Responsebias: Dit doet zich voor wanneer deelnemers aan een enquête of studie onjuiste antwoorden geven als gevolg van sociale wenselijkheid of andere factoren. Zo zullen weinig deelnemers aan een enquête in een voetbalkantine zich snel hard uitspreken over de grote talenten van de tegenstander.
Manieren om bias te verminderen
Het verminderen van bias is heel belangrijk om betrouwbare en valide (geldige) conclusies te kunnen trekken uit statistische analyses. Hier zijn enkele manieren om bias te verminderen:
-
Willekeurige steekproefselectie: Zorg ervoor dat de steekproef willekeurig wordt geselecteerd uit de populatie die je wilt bestuderen om steekproefbias te verminderen.
-
Dubbelblinde experimenten: In experimenteel onderzoek kan het gebruik van dubbelblinde procedures waarbij zowel deelnemers als onderzoekers niet op de hoogte zijn van de groepsindeling, responsebias verminderen.
-
Verbetering van meetinstrumenten: Zorg ervoor dat meetinstrumenten betrouwbaar en valide zijn om meetbias te minimaliseren.
-
Zorgvuldige gegevensverzameling: Zorg voor duidelijke instructies en minimaliseer mogelijke bronnen van meetfouten tijdens gegevensverzameling.
-
Post-stratificatie en weging: Als er bepaalde subgroepen in je steekproef zijn die ondervertegenwoordigd zijn, kun je post-stratificatie of weging gebruiken om de steekproef te corrigeren.
a) Steekproefbias: Als de enquête alleen wordt verspreid via sociale media, kan dit een bias introduceren omdat studenten die sociale media gebruiken mogelijk een andere muzieksmaak hebben dan de algemene bevolking die weinig of geen sociale media gebruiken. Je kunt overwegen om de steekproef uit te breiden naar andere wervingsbronnen om de representativiteit te vergroten.
b) Responsebias: Mensen kunnen sociale wenselijkheid tonen door populairdere muziekgenres te noemen. Zo kunnen ze hardop de keuze van muziekgenres noemen die ook in het studentencafé wordt gespeeld maar in hun hart meer houden van ‘foute’ muziek. Om responsebias te verminderen, kan de enquête anoniem worden gemaakt, zodat deelnemers eerlijker kunnen antwoorden.
c) Selectiebias: Als alleen mensen met sterke muzikale voorkeuren deelnemen aan de enquête, kan dit een selectiebias veroorzaken. Om selectiebias te verminderen, kan de enquête worden ontworpen om een breder scala aan muzieksmaken op te nemen en deelname te openen voor mensen met zowel sterke als zwakke muzikale voorkeuren.
Door deze maatregelen te nemen, kun je bias in je onderzoek verminderen. Zo kan je meer nauwkeurige inzichten verkrijgen in de populariteit van verschillende muziekgenres.
Hoe meet je bias in termen van validiteit en betrouwbaarheid?
Toch kan er altijd iets van vertekening optreden in je onderzoek. Afhankelijk van de omvang en het doel van je onderzoek kan het nodig zijn om te meten hoeveel bias toch is opgetreden. Het gebruik van meerdere methoden en statistische technieken kan helpen bij het identificeren en verminderen van bias in je metingen.
Bias in termen van validiteit en betrouwbaarheid kan op verschillende manieren worden gemeten. Dat is afhankelijk van het type bias dat je voor jouw onderzoek belangrijk vindt. Voor het meten van bias in validiteit en betrouwbaarheid kan je denken aan:
1. Validiteit
Er bestaan verschillende vormen van validiteit:
A. Constructvaliditeit
Dit meet of je meetinstrument daadwerkelijk meet wat het zou moeten meten. Om constructvaliditeit te beoordelen, kun je convergente en divergente validiteit onderzoeken:
-
Convergente validiteit: Hierbij onderzoek je of je meetinstrument correleert met andere meetinstrumenten die dezelfde eigenschap zouden moeten meten. Als er sterke positieve correlaties zijn, wijst dit op convergente validiteit.
-
Divergente validiteit: Dit betekent dat je kijkt of je meetinstrument niet of nauwelijks correleert met meetinstrumenten die verschillende eigenschappen zouden moeten meten. Dit suggereert dat je meetinstrument niet 'verwarring' zaait tussen verschillende eigenschappen.
B. Criterium Validiteit
Hierbij onderzoek je of je meetinstrument correleert met een bekende en algemeen aanvaarde gouden standaard of criteriummaatstaf. Als je meetinstrument het criterium nauwkeurig voorspelt, wijst dit op criteriumvaliditeit.
C. Contentvaliditeit
Dit houdt in dat je evalueert of de items in je meetinstrument de relevante aspecten van het te meten construct goed dekken. Dit kan beoordeeld worden door experts op het gebied te raadplegen. Zo kan je bijvoorbeeld bij je onderzoek naar de populariteit van bepaalde muziekgenres een expert raadplegen over harmonieleer, ritme, dynamiek, frasering, orkestratie en contrapunt.
D. Face Validiteit
Dit is een subjectieve beoordeling waarbij je kijkt of het meetinstrument op het eerste gezicht lijkt te meten wat het zou moeten meten.
2. Betrouwbaarheid
-
Interne consistentie: Dit meet de mate waarin de items in een meetinstrument met elkaar samenhangen. Een veelgebruikte statistische maat voor interne consistentie is de Cronbach's alpha-coëfficiënt. Hoe hoger de alpha-waarde, hoe beter de interne consistentie.
-
Test-hertest betrouwbaarheid: Hierbij meet je de consistentie van metingen over de tijd door hetzelfde meetinstrument op twee verschillende momenten te gebruiken. De mate van overeenkomst tussen de metingen wordt beoordeeld, bijvoorbeeld met de intraklassecorrelatiecoëfficiënt (ICC). Dit is één toepassing van wat je met correlatie kan doen.
-
Interbeoordelaars betrouwbaarheid: Dit is relevant als meerdere beoordelaars of onderzoekers betrokken zijn bij het verzamelen van gegevens. De mate van overeenstemming tussen beoordelaars wordt beoordeeld, bijvoorbeeld met de al genoemde intraklassecorrelatiecoëfficiënt.
-
Parallelle vormen betrouwbaarheid: Hierbij gebruik je twee verschillende vormen van het meetinstrument (bijvoorbeeld twee verschillende versies van een test) om te zien of ze vergelijkbare resultaten opleveren.
-
Meetfout: Je kunt ook de meetfout berekenen door de variantie van de metingen te analyseren. Een grote meetfout kan duiden op lage betrouwbaarheid.
Het meten van bias in termen van validiteit en betrouwbaarheid vereist zorgvuldige analyse en evaluatie van je meetinstrument en gegevens. Het doel is om ervoor te zorgen dat je meetinstrument nauwkeurig en consistent is in het meten van het beoogde construct zonder systematische vertekeningen.
Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in
Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.
De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt.