- Marleen Scriptium
- Posted on
- Geen reacties
Wat is een spreidingsdiagram?
Een spreidingsdiagram, ook wel bekend als scatterplot, is een grafische weergave van je gegevens in je dataset. Deze worden vertaald naar punten in een cartesiaans coördinatensysteem. Een cartesiaans coördinatensysteem is als een plattegrond met een x- en y-as waarop je punten kunt plaatsen.
Het spreidingsdiagram wordt gebruikt om de relatie tussen twee numerieke variabelen te visualiseren. In een spreidingsdiagram worden de waarden van de ene variabele langs de x-as geplaatst en de waarden van de andere variabele langs de y-as.
Hoe gebruik je een spreidingsdiagram?
Stel je een groot vel papier voor met een horizontale lijn (de x-as) die van links naar rechts loopt en een verticale lijn (de y-as) die van onder naar boven loopt. Op het papier kun je puntjes zetten om locaties aan te geven.
-
De x-as is als een denkbeeldige horizontale lijn waar we punten langs kunnen plaatsen van links naar rechts. Bijvoorbeeld, als we het hebben over de afstand van een huis tot een park, dan kunnen we de x-as gebruiken om verschillende afstanden te markeren, waarbij de kleinere getallen dichter bij het huis liggen en de grotere getallen verder weg.
-
De y-as is als een denkbeeldige verticale lijn waar we punten langs kunnen plaatsen van onder naar boven. Bijvoorbeeld, als we het hebben over de hoogte van een boom, kunnen we verschillende hoogtes markeren op de y-as, waarbij kleinere getallen dicht bij de grond liggen en grotere getallen verder omhoog.
Door punten te plaatsen op het snijpunt van de x- en y-as, kun je een specifieke locatie aangeven. Bijvoorbeeld, als we een punt op (3, 5) plaatsen, betekent dit dat we 3 eenheden naar rechts gaan op de x-as en 5 eenheden omhooggaan op de y-as, en zo komen we bij dat specifieke punt. Op deze manier kun je met behulp van een cartesiaans coördinatensysteem punten op een plat vlak plaatsen en hun locatie bepalen door hun positie langs de x- en y-as.
Wat is het doel van een spreidingsdiagram?
Het doel van een spreidingsdiagram is om patronen, trends, correlaties of afwijkingen in de gegevens te identificeren. Het kan helpen bij het bepalen van de aard van de relatie tussen de variabelen, of het nu lineair, niet-lineair, positief, negatief of ongecorreleerd is.
De punten in een spreidingsdiagram vertegenwoordigen individuele waarnemingen (observaties) of gegevenspunten. De positie van elk punt op het diagram geeft de specifieke waarden weer van de overeenkomstige observaties voor beide variabelen.
Door het patroon van de punten in het spreidingsdiagram te bestuderen, kun je verschillende conclusies trekken, zoals:
-
Lineaire relatie
Als de punten min of meer een rechte lijn volgen, suggereert dit een lineaire relatie tussen de variabelen. Als de lijn stijgt van links naar rechts, is er een positieve lineaire relatie. Als de lijn daalt van links naar rechts, is er een negatieve lineaire relatie. -
Niet-lineaire relatie
Als de punten geen duidelijk lineair patroon volgen, kan er sprake zijn van een niet-lineaire relatie. Dit kan bijvoorbeeld een kwadratische, exponentiële of logaritmische relatie zijn. -
Geen relatie
Als de punten willekeurig verspreid zijn zonder een duidelijk patroon, suggereert dit dat er geen significante relatie is tussen de variabelen. -
Uitschieters
Spreidingsdiagrammen kunnen ook helpen bij het identificeren van uitschieters of afwijkende observaties die ver van het algemene patroon liggen.
Spreidingsdiagrammen zijn een krachtig hulpmiddel om inzicht te krijgen in de relatie tussen twee variabelen. Ze kunnen worden gebruikt in verschillende disciplines, zoals statistiek, natuurwetenschappen, economie, sociale wetenschappen en vele andere gebieden waar het onderzoeken van de samenhang tussen variabelen van belang is.
Hoe teken ik een spreidingsdiagram?
Om een spreidingsdiagram te tekenen, volg je de volgende stappen:
Stap 1: Verzamel je gegevens
Verzamel gegevens van twee numerieke variabelen die je wilt vergelijken. Bijvoorbeeld, de relatie tussen de studietijd en de behaalde cijfers van studenten.
Stap 2: Kies de juiste schaal
Bepaal de schaal van de x-as en y-as, afhankelijk van de bereikwaarden van je gegevens. Zorg ervoor dat de schaal voldoende ruimte biedt om alle punten op het diagram weer te geven.
Stap 3: Markeer de punten
Plaats een punt op het diagram voor elke observatie. Neem de waarde van de eerste variabele op de x-as en de waarde van de tweede variabele op de y-as. Herhaal dit voor alle observaties.
Stap 4: Voeg assen, labels en een titel toe
Voeg een x-as, y-as en assenlabels toe aan het diagram. Geef ook het diagram een duidelijke titel die de variabelen en het doel van het diagram weergeeft.
Stap 5: Optioneel - Markeer uitschieters
Als er uitschieters zijn, punten die aanzienlijk afwijken van het algemene patroon, markeer ze dan met een andere kleur of symbool, zodat ze gemakkelijk te onderscheiden zijn. Het kan dan gaan om een onderzoek naar het inkomen van Amsterdamse studenten. Als er dan één, 1 miljoen euro per jaar verdient, is dat een duidelijke uitschieter.
Praktisch voorbeeld van een spreidingsdiagram
Stel je voor dat je de relatie wilt onderzoeken tussen het aantal uren dat studenten besteden aan blokken voor een tentamen en de door die studenten behaalde cijfers.
Je hebt gegevens van 20 studenten. Hier zijn enkele resultaten:
Je kunt nu een spreidingsdiagram maken om deze gegevens te visualiseren. Stel dat je ervoor kiest om de studietijd op de x-as en het behaalde cijfer op de y-as weer te geven.
-
Op de x-as kun je de waarden van 1 tot 10 nemen (aangezien de studietijd in dit voorbeeld tussen 1 en 10 uur ligt), en op de y-as kun je de waarden van 0 tot 10 nemen (omdat cijfers meestal tussen 0 en 10 liggen).
-
Daarna kun je voor elke student een punt plaatsen op het diagram, waarbij de x-coördinaat overeenkomt met de studietijd en de y-coördinaat overeenkomt met het behaalde cijfer.
-
Na het markeren van alle punten, voeg je assen, labels en een titel toe aan het diagram om het compleet te maken.
Het resulterende spreidingsdiagram geeft je een visuele weergave van de relatie tussen studietijd en behaalde cijfers. Deze weergave kan je helpen eventuele patronen of trends te identificeren. In een plaatje:
Het lijkt er op het eerste gezicht op, dat de tijd die je steekt in de voorbereiding van een tentamen ook iets positiefs te maken heeft met het cijfer dat volgt. Dit suggereert een positieve lineaire relatie.
Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in
Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.
De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt.