Varians og standardavvik
For å få oversikt over statistiske data er det nyttig å ha informasjon om blant annet spredningen i materialet. Spredningsmålene viser hvor spredt tallene ligger rundt de sentrale verdiene. Et mye brukt spredningsmål er varians.
definisjon
Variansen er definert som (trekk pusten!) summen av kvadratet av hver observasjons avstand fra gjennomsnittet dividert med det totale antallet observasjoner.
Hvordan finne varians?
Steg for steg finner vi den ved å:
- Regne ut gjennomsnittet.
- Regne ut forskjellene mellom gjennomsnittet og hvert av tallene.
- Kvadrere forskjellene.
- Summere kvadratene av forskjellene.
- Dividere summen med det totale antallet observasjoner.
Legg merke til at uansett om differansen mellom et tall og gjennomsnittet er positivt eller negativt er kvadratet av differansen alltid positivt. Variansen direkte er ikke så lett å tolke, så etter å ha regnet den ut tar vi kvadratroten av variansen, og tallet vi får da kalles for standardavviket. Dette er et "forventet" avvik fra gjennomsnittet.
Som du ser av forklaringen over er dette litt komplisert, så vi prøver å vise det fram ved å beregne varians og standardavvik for samme eksempel som vi allerede har regnet ut variasjonsbredden for.
Fritidsaktiviteter
To elevgrupper ble spurt hvor mange ganger de har fritidsaktiviteter i løpet av en uke. Svarene ble:
Gruppe A: |
Gruppe B: |
Datamaterialene for begge elevgruppene har gjennomsnitt, median og typetall lik . Vi så på forrige side at vi kan fange noe av forskjellen på datasettene ved å bruke variasjonsbredde, men nå skal vi heller bruke varians og standardavvik.
For dataene i gruppe A har vi:
- Gjennomsnittet er lik
- Differansene er lik og
- Kvadratene av differansene er lik og
- Summen av kvadrater av differanser er lik
- Variansen er lik denne summen dividert med det totale antallet data, som er lik
For å finne standardavviket, tar vi kvadratroten og får
.
Test deg selv og regn ut varians og standardavvik for gruppe B – fasitsvarene er varians lik og standardavvik lik .
Siden både varians og standardavvik for data i gruppe A er større enn i gruppe B, kan vi si at dataene i gruppe A varierer mer enn dataene i gruppe B.
Del på Facebook
Begrep
-
Gjennomsnitt
Gjennomsnitt er en middelverdi av alle dataene.
Gjennomsnittet finner du ved å:
1) summere alle data
2) dele summen på total antall data
Eksempel: Gjennomsnittet av 2, 2, 4, 3 er 2,75 fordi
1)
2) antall data er 4. -
Median
Medianen er den verdien som vi finner i midten av et rangert datamateriale.
Eksempel: I et datamateriale har vi verdiene 3, 6, 1, 4 og 5. Vi rangerer verdiene til 1, 3, 4, 5, 6. Den midterste verdien er 4. Medianen er 4.
-
Sentralmål
Sentralmål er utregnede verdier som viser "sentrum" for innsamlede data. Tre eksempler på sentralmål er gjennomsnitt, median og typetall.
Se gjennomsnitt, median og/eller typetall
-
Spredningsmål
Spredningsmål er størrelser som sier oss noe om hvor mye dataene i et datasett varierer. Noen eksempler på spredningsmål er variasjonsbredde, varians og kvartiler.
-
Standardavvik
Standardavviket er kvadratroten av variansen. Dette er på en måte et forventet avvik fra gjennomsnittet.
-
Typetall
Typetallet er det tallet som opptrer flest ganger i et innsamlet tallmateriale fra for eksempel en spørreundersøkelse.
Eksempel: 1, 1, 2, 2, 2, 3, 3, 4, 4, 5. Her er typetallet 2.
-
Varians
Et mål for spredningen i et datamateriale, som er lik kvadratet av standardavviket.
Slik finner du varians:
Regn ut gjennomsnittet
Regn forskjellene mellom gjennomsnittet og hvert av tallene
Kvadrer forskjellene
Summer kvadrater av forskjellene
Divider summen med det totale antallet data -
Variasjonsbredde
Variasjonsbredden i et datamateriale er differansen mellom den største verdien og den minste verdien.