Wat is een standaardafwijking en hoe noteer je die?

De standaardafwijking of standaarddeviatie beschrijft de gemiddelde afwijking van alle scores van een variabele die is gemeten onder een steekproef of als waarde van een kenmerk van een populatie.

Voor een steekproef wordt de standaardafwijking een statistiek genoemd. Voor een hele populatie wordt de standaardafwijking een parameter genoemd. De standaardafwijking wordt in de wetenschappelijke literatuur (dus ook in jouw onderzoeksverslag) geschreven als hoofdletter S voor een steekproef en een Griekse letter s (sigma) voor een populatie.

Notatie voor standaarddeviatie
Beschrijvende statistiek
Steekproef-standaardafwijking:
S= …
Populatie-parameter
Populatie-standaardafwijking:
σ=…

In beide gevallen geeft S of σ een maat van de spreiding van data rond het gemiddelde. Voor het gemiddelde van een steekproef wordt de letter M gebruikt. Voor het gemiddelde van een populatie de Griekse letter mu (µ).

Het belang van inzicht in de standaardafwijking

De standaardafwijking geeft een idee van de variabiliteit in de antwoorden op enquêtes of de verscheidenheid in een kenmerk van een bevolking. Of, van willekeurig welke andere verzameling of ‘steekproefruimte’. Immers, de onderzoeker wil die variabiliteit juist kunnen duiden; de ondernemer wil flexibel kunnen inspelen op de veranderlijkheid van zijn doelgroep. De standaardafwijking wordt uitgedrukt in een getal dat in dezelfde meeteenheid staat genoteerd als de meeteenheid die is gehanteerd voor de oorspronkelijke variabele X.

Voorbeeld 1: standaardafwijking in een steekproef

In een werkdrukonderzoek naar overuren onder medewerkers van een bepaald ziekenhuis blijken de gescoorde overuren van de medewerkers een standaardafwijking te kennen van 3 uren t.o.v. het contract van 24 uren. Zij horen dus gemiddeld 24 uur per week te werken, maar draaien gemiddeld 3 uren extra per week. In andere onderzochte sectoren is dat overwerk 1 uur of hooguit 2 uren extra per week. Hieruit is af te lezen dat het beheersen van de werkweek tot 24 uur met een standaardafwijking van 1 uur overwerk in de gezondheidszorg nog een uitdaging is. De S= 3 (overuren) is dus een belangrijke beschrijvende statistiek bij de verkregen cijfers uit deze steekproef. NB: dat wil nog niets zegen over alle ziekenhuizen of over de gehele gezondheidszorg.

Voorbeeld 2: standaardafwijking in de populatie

Een couturier ontwikkelt een kek zomerjurkje voor de Nederlandse markt. Voor de productie is het nu belangrijk om het gemiddelde van de lichaamsmaten te weten voor de dames in de doelgroep. De Nederlandse vrouw heeft gemiddeld maat 40. Voor een grote kledinghandel is niet alleen het gemiddelde maar ook juist de spreiding van de maten van belang. Iedereen kan dromen van maatje 36, maar er zijn genoeg dames die juist flink onder maat 40 vallen én dames die met moeite in maatje 42 passen.

Daarom zijn standaardafwijkingen én de aantallen dames die redelijkerwijs binnen die standaardafwijking vallen, belangrijk voor de inkoop. Jurkje maat 40 mag dan in flinke aantallen worden ingekocht (grootste inkoop voor de gemiddelde Nederlandse vrouw) maar voor maatje-meer én de kleinere of slankere dames moet er ook genoeg aan het rek hangen.

Berekening van de standaardafwijking

Veelal geeft de S-knop op je wetenschappelijke rekenmachine met één druk op de knop de S-waarde. Als je statistische software gebruikt, zoals SPSS, dan krijg je desgevraagd volautomatisch de S-waarde over je datasheet uitgerekend.

Voor een beter begrip van wat er achter het scherm gedaan wordt of voor het geval je alleen pen en papier en een zakrekenmachientje hebt, volgt nu stapsgewijs de berekening van de standaardafwijking. In dit voorbeeld wordt een fictieve dataset van een fictieve onderneming gehanteerd.

Voorbeeld 3: berekening van gemiddelde (M), variantie (S2), en standaardafwijking S

Een ambachtelijke bakker laat een medewerker 30 pistolets maken voor de verkoop. De bakkerswinkel streeft naar broodjes van elk 75 gram. Voor een modelbroodje van 75 gram zijn de productiekosten en de verkoopprijs per broodje berekend. Als het broodje zwaarder is, dan wordt er feitelijk brood ‘weggegeven’. Als het broodje lichter is, dan wordt de klant feitelijk benadeeld.

Op het eiland waar de bakkerij is gevestigd, heeft de bakker een goede naam, maar wil deze vanwege de supermarkt aan de overkant graag houden. Daarom neemt hij de moeite om de hele bak broodjes van zijn medewerker eens te wegen. Hij noteert van elk broodje het gewicht en vat deze cijfers in een figuur samen:

Standaardafwijking figuur 1
Figuur 1: overzicht van gewichten per broodje

De resultaten uit de meetfase zijn:

  • Er zijn N = 30 broodjes.

  • Het totale gewicht van alle broodjes = 2235 gram.

  • Het gemiddelde gewicht van het broodje is M= 2235 / 30 = 74,5 gram.

Er zijn echter broodjes aangetroffen van maar 68 gram en broodjes van wel 80 gram. Deze range van de verzamelde gegevens, ofwel deze extreme waarden, kunnen leiden tot klagende klanten óf verlies op de verkoop van deze voorraad.

Wat is nu de gemiddelde afwijking van het gewicht?

De bakker gebruikt de ruwe-datamethode als een van de twee meest gangbare methoden voor de berekening van de variantie. Deze berekening is nodig om daaruit de standaardafwijking te vinden.

In formule ziet de ruwe-datamethode er als volgt uit:

Standaardafwijking formule 1
Deel 1
Standaardafwijking formule 2
Deel 2

Stappen ruwe-datamethode:

  • Om S2 te vinden wordt elke score (gewicht van een broodje) gekwadrateerd: X(1….i)2

  • Alle gevonden kwadraten worden opgesteld: ∑i X i2 = 166875

  • Dit aantal wordt gedeeld door N=30. Dus: 166875 / 30= 5562,5

  • Het kwadraat van het gemiddelde, M2, is: 5550,25

  • De variantie is dan: S2 = 5562,5 - 5550,25 =12,5

  • Voor de gemiddelde afwijking van de broodjes in grammen wordt de vierkantswortel uit 12,5 berekend: √S2 = S = 3,54

De standaardafwijking blijkt 3,54 te zijn. Daarmee wijkt dus elk broodje gemiddeld 3,54 gram af.

Interpretatie: actie of vervolgonderzoek?

De bakker kan deze standaardafwijking laten voor wat het is. Of hij kan vinden dat een gemiddelde afwijking van 3,5 gram op elk broodje van – bedoeld – 75 gram = 5% te veel is. Op elke 20 broodjes gaat er dus of een broodje gratis de winkel uit of wordt de klant van één broodje bestolen. Het is nu aan de bakker en zijn vakmanschap om een meer nauwkeurige afweging van te bakken broodjes te vinden. Dan kan de standaardafwijking en dus verlies van materiaal of goodwill worden teruggebracht.

Hulp bij statistiek nodig? Schakel een professionele begeleider van Scriptium in

Heb je moeite met statistiek? Wens je hulp te krijgen bij SPSS, STATA of R? Scriptium heeft 7 dagen per week professionele statistiekbegeleiders beschikbaar. Of je nu hulp bij statistiek in je scriptie wilt hebben, of bijles statistiek nodig hebt, we staan direct voor je klaar. Neem vandaag nog contact met ons op, en we komen snel bij je terug.

Auteur: Ryu Jamanota 
Motto: Beter weten door zuiver meten
 

De auteur gebruikt statistiek voor het analyseren van productie- en dienstverleningsprocessen. Aan de hand van statistische analyses onderzoekt hij of een bedrijfsproces langs de kortste weg levert wat er bedoeld is en of het proces ook beheersbaar en betrouwbaar verloopt. 

Laat een reactie achter

Je hebt al gestemd op dit artikel. Bedankt :-)
Wat vind jij van dit artikel?