Wat is multicollineariteit?

 Multicollineariteit is een statistisch concept dat verwijst naar een hoge correlatie tussen twee of meer onafhankelijke variabelen in een regressiemodel.

Het betekent dat de onafhankelijke variabelen sterk met elkaar samenhangen. Daardoor wordt het moeilijk om het effect van elke variabele afzonderlijk te beoordelen. Multicollineariteit kan problematisch zijn omdat het de nauwkeurigheid en interpretatie van de regressieanalyse kan beïnvloeden.

Op welke manier kan je in je dataset multicollineariteit vaststellen?

In beide gevallen kan het vaststellen van multicollineariteit door middel van correlatiematrix, Variance Inflation Factor (VIF) of tolerantie helpen om te begrijpen of er sprake is van een hoge correlatie tussen de variabelen. Indien multicollineariteit wordt vastgesteld, kunnen passende maatregelen worden genomen, zoals het verwijderen van een van de sterk gecorreleerde variabelen of het combineren van variabelen om een nieuwe variabele te creëren, om de multicollineariteit aan te pakken en de betrouwbaarheid van het regressiemodel te verbeteren.

Er zijn verschillende methoden om multicollineariteit te berekenen of te bewijzen. Hier zijn een paar veelgebruikte technieken:

1. Correlatiematrix

Bereken de correlatiecoëfficiënten tussen alle paar onafhankelijke variabelen. Als er hoge correlaties zijn (bijvoorbeeld boven 0,7 of -0,7), kan dit wijzen op multicollineariteit.

2. Variance Inflation Factor (VIF)

VIF meet de mate van multicollineariteit tussen een specifieke onafhankelijke variabele en de overige variabelen in het model. Een VIF-waarde van 1 geeft aan dat er geen multicollineariteit is, terwijl waarden boven 1 wijzen op multicollineariteit. Over het algemeen wordt aangenomen dat een VIF-waarde van 5 of hoger duidt op significante multicollineariteit.

3. Tolerantie

Tolerantie is het omgekeerde van de VIF. Het geeft aan hoeveel variabiliteit van een onafhankelijke variabele niet kan worden verklaard door andere variabelen in het model. Een lage tolerantiewaarde (bijvoorbeeld onder 0,1) kan wijzen op multicollineariteit.

4. Eigenvectoren

Het berekenen van de eigenvectoren van de correlatiematrix kan helpen bij het identificeren van lineaire combinaties van variabelen die multicollineariteit aanduiden

Noot: multicollineariteit is geen direct bewijs maar eerder een aanwijzing dat er mogelijk multicollineariteit aanwezig is in het regressiemodel. Je wilt voorzichtig zijn bij het interpreteren van de resultaten en bij het nemen van gepaste maatregelen om de multicollineariteit aan te pakken, zoals het verwijderen van een van de sterk gecorreleerde variabelen of het combineren van variabelen om een nieuwe variabele te creëren.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?