Varians og standardavvik

For å få oversikt over statistiske data er det nyttig å ha informasjon om blant annet spredningen i materialet. Spredningsmålene viser hvor spredt tallene ligger rundt de sentrale verdiene. Et mye brukt spredningsmål er varians.

definisjon

Variansen er definert som (trekk pusten!) summen av kvadratet av hver observasjons avstand fra gjennomsnittet dividert med det totale antallet observasjoner.

Hvordan finne varians?

Steg for steg finner vi den ved å:

Regne ut gjennomsnittet.
Regne ut forskjellene mellom gjennomsnittet og hvert av tallene.
Kvadrere forskjellene.
Summere kvadratene av forskjellene.
Dividere summen med det totale antallet observasjoner.

Legg merke til at uansett om differansen mellom et tall og gjennomsnittet er positivt eller negativt er kvadratet av differansen alltid positivt. Variansen direkte er ikke så lett å tolke, så etter å ha regnet den ut tar vi kvadratroten av variansen, og tallet vi får da kalles for standardavviket. Dette er et "forventet" avvik fra gjennomsnittet.

Som du ser av forklaringen over er dette litt komplisert, så vi prøver å vise det fram ved å beregne varians og standardavvik for samme eksempel som vi allerede har regnet ut variasjonsbredden for.

Fritidsaktiviteter

To elevgrupper ble spurt hvor mange ganger de har fritidsaktiviteter i løpet av en uke. Svarene ble:

Gruppe A:

1

3

3

3

5

Gruppe B:

2

3

3

3

4

Datamaterialene for begge elevgruppene har gjennomsnitt, median og typetall lik $3$ . Vi så på forrige side at vi kan fange noe av forskjellen på datasettene ved å bruke variasjonsbredde, men nå skal vi heller bruke varians og standardavvik.

For dataene i gruppe A har vi:

Gjennomsnittet er lik $\frac{1 + 3 + 3 + 3 + 5}{5} = 3$
Differansene er lik $1 - 3 = - 2, 3 - 3 = 0, 3 - 3 = 0, 3 - 3 = 0$ og $5 - 3 = 2$
Kvadratene av differansene er lik ${(- 2)}^{2} = 4, 0^{2} = 0, 0^{2} = 0, 0^{2} = 0$ og $2^{2} = 4$
Summen av kvadrater av differanser er lik $4 + 0 + 0 + 0 + 4 = 8$
Variansen er lik denne summen dividert med det totale antallet data, som er lik $\frac{8}{5} = 1, 6$

For å finne standardavviket, tar vi kvadratroten og får

$\sqrt{1, 6} \approx 1, 26$ .

Test deg selv og regn ut varians og standardavvik for gruppe B – fasitsvarene er varians lik $0, 4$ og standardavvik lik $0, 63$ .

Siden både varians og standardavvik for data i gruppe A er større enn i gruppe B, kan vi si at dataene i gruppe A varierer mer enn dataene i gruppe B.

Del på Facebook

Del på Facebook

Lynkurs 11.-13.trinn

Statistikk (del II)

Består av:

Begrep

Gjennomsnitt

Gjennomsnitt er en middelverdi av alle dataene.

Gjennomsnittet finner du ved å:
1) summere alle data
2) dele summen på total antall data

Eksempel: Gjennomsnittet av 2, 2, 4, 3 er 2,75 fordi
1) $2 + 2 + 4 + 3 = 11$
2) antall data er 4. $11 : 4 = 2, 75$
Median

Medianen er den verdien som vi finner i midten av et rangert datamateriale.

Eksempel: I et datamateriale har vi verdiene 3, 6, 1, 4 og 5. Vi rangerer verdiene til 1, 3, 4, 5, 6. Den midterste verdien er 4. Medianen er 4.
Sentralmål

Sentralmål er utregnede verdier som viser "sentrum" for innsamlede data. Tre eksempler på sentralmål er gjennomsnitt, median og typetall.

Se gjennomsnitt, median og/eller typetall
Spredningsmål

Spredningsmål er størrelser som sier oss noe om hvor mye dataene i et datasett varierer. Noen eksempler på spredningsmål er variasjonsbredde, varians og kvartiler.
Standardavvik

Standardavviket er kvadratroten av variansen. Dette er på en måte et forventet avvik fra gjennomsnittet.
Typetall

Typetallet er det tallet som opptrer flest ganger i et innsamlet tallmateriale fra for eksempel en spørreundersøkelse.

Eksempel: 1, 1, 2, 2, 2, 3, 3, 4, 4, 5. Her er typetallet 2.
Varians

Et mål for spredningen i et datamateriale, som er lik kvadratet av standardavviket.

Slik finner du varians:

Regn ut gjennomsnittet
Regn forskjellene mellom gjennomsnittet og hvert av tallene
Kvadrer forskjellene
Summer kvadrater av forskjellene
Divider summen med det totale antallet data
Variasjonsbredde

Variasjonsbredden i et datamateriale er differansen mellom den største verdien og den minste verdien.

Varians og standardavvik

Hvordan finne varians?

Fritidsaktiviteter

Lynkurs 11.-13.trinn

Statistikk (del II)

Består av:

Begrep

Gjennomsnitt

Median

Sentralmål

Spredningsmål

Standardavvik

Typetall

Varians

Variasjonsbredde