- Scriptium
- Posted on
- Geen reacties
Wat is multicollineariteit?
Multicollineariteit is een statistisch concept dat verwijst naar een hoge correlatie tussen twee of meer onafhankelijke variabelen in een regressiemodel.
Het betekent dat de onafhankelijke variabelen sterk met elkaar samenhangen. Daardoor wordt het moeilijk om het effect van elke variabele afzonderlijk te beoordelen. Multicollineariteit kan problematisch zijn omdat het de nauwkeurigheid en interpretatie van de regressieanalyse kan beïnvloeden.
Sociale wetenschappen
Stel dat je een onderzoek uitvoert naar de factoren die van invloed zijn op de tevredenheid van werknemers in een organisatie. Je wilt een regressiemodel maken om te bepalen hoe variabelen zoals salaris, leeftijd en werkervaring de tevredenheid beïnvloeden.
Bedenk je dat er een sterke correlatie kan zijn tussen leeftijd en werkervaring. Dat betekent dat oudere werknemers vaak meer werkervaring hebben. Dit kan leiden tot multicollineariteit tussen de variabelen leeftijd en werkervaring. Immers, hoe hoger de leeftijd en dus hoe hoger de werkervaring en dus hoe minder uitdaging en dus hoe hoger saaiheid van het werk kan worden ervaren. Saaiheid en leeftijd en werkervaring hangen dan vanwege multicollineariteit van leeftijd en werkervaring te veel met elkaar samen. Het wordt dan moeilijk om het individuele effect van elke variabele op de tevredenheid van werknemers te beoordelen, omdat de variabelen sterk met elkaar samenhangen.
Economie
Stel dat je een regressiemodel wilt opstellen om het effect van de prijs en de reclame-uitgaven op de verkoop van een product te onderzoeken. Je hebt gegevens verzameld over de prijs van het product, de reclame-uitgaven en de verkoop in verschillende perioden.
Stel je voor dat er een sterke negatieve correlatie bestaat tussen de prijs van het product en de reclame-uitgaven. Dat betekent dat wanneer de prijs stijgt, de reclame-uitgaven vaak dalen en andersom. Dit kan leiden tot multicollineariteit tussen de prijs en de reclame-uitgaven in het regressiemodel. Het wordt dan moeilijk om het individuele effect van elke variabele op de verkoop te beoordelen, omdat de variabelen sterk met elkaar samenhangen.
Op welke manier kan je in je dataset multicollineariteit vaststellen?
In beide gevallen kan het vaststellen van multicollineariteit door middel van correlatiematrix, Variance Inflation Factor (VIF) of tolerantie helpen om te begrijpen of er sprake is van een hoge correlatie tussen de variabelen. Indien multicollineariteit wordt vastgesteld, kunnen passende maatregelen worden genomen, zoals het verwijderen van een van de sterk gecorreleerde variabelen of het combineren van variabelen om een nieuwe variabele te creëren, om de multicollineariteit aan te pakken en de betrouwbaarheid van het regressiemodel te verbeteren.
Er zijn verschillende methoden om multicollineariteit te berekenen of te bewijzen. Hier zijn een paar veelgebruikte technieken:
1. Correlatiematrix
Bereken de correlatiecoëfficiënten tussen alle paar onafhankelijke variabelen. Als er hoge correlaties zijn (bijvoorbeeld boven 0,7 of -0,7), kan dit wijzen op multicollineariteit.
2. Variance Inflation Factor (VIF)
VIF meet de mate van multicollineariteit tussen een specifieke onafhankelijke variabele en de overige variabelen in het model. Een VIF-waarde van 1 geeft aan dat er geen multicollineariteit is, terwijl waarden boven 1 wijzen op multicollineariteit. Over het algemeen wordt aangenomen dat een VIF-waarde van 5 of hoger duidt op significante multicollineariteit.
3. Tolerantie
Tolerantie is het omgekeerde van de VIF. Het geeft aan hoeveel variabiliteit van een onafhankelijke variabele niet kan worden verklaard door andere variabelen in het model. Een lage tolerantiewaarde (bijvoorbeeld onder 0,1) kan wijzen op multicollineariteit.
4. Eigenvectoren
Het berekenen van de eigenvectoren van de correlatiematrix kan helpen bij het identificeren van lineaire combinaties van variabelen die multicollineariteit aanduiden
Noot: multicollineariteit is geen direct bewijs maar eerder een aanwijzing dat er mogelijk multicollineariteit aanwezig is in het regressiemodel. Je wilt voorzichtig zijn bij het interpreteren van de resultaten en bij het nemen van gepaste maatregelen om de multicollineariteit aan te pakken, zoals het verwijderen van een van de sterk gecorreleerde variabelen of het combineren van variabelen om een nieuwe variabele te creëren.
Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in
Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.
De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt.