Hopp til hovedinnholdet
www.matematikk.org

Varians og standardavvik

For å få oversikt over statistiske data er det nyttig å ha informasjon om blant annet spredningen i materialet. Spredningsmålene viser hvor spredt tallene ligger rundt de sentrale verdiene. Et mye brukt spredningsmål er varians.

definisjon

Variansen er definert som (trekk pusten!) summen av kvadratet av hver observasjons avstand fra gjennomsnittet dividert med det totale antallet observasjoner.

Hvordan finne varians?

Steg for steg finner vi den ved å:

  1. Regne ut gjennomsnittet.
  2. Regne ut forskjellene mellom gjennomsnittet og hvert av tallene.
  3. Kvadrere forskjellene.
  4. Summere kvadratene av forskjellene.
  5. Dividere summen med det totale antallet observasjoner.

Legg merke til at uansett om differansen mellom et tall og gjennomsnittet er positivt eller negativt er kvadratet av differansen alltid positivt. Variansen direkte er ikke så lett å tolke, så etter å ha regnet den ut tar vi kvadratroten av variansen, og tallet vi får da kalles for standardavviket. Dette er et "forventet" avvik fra gjennomsnittet.

Som du ser av forklaringen over er dette litt komplisert, så vi prøver å vise det fram ved å beregne varians og standardavvik for samme eksempel som vi allerede har regnet ut variasjonsbredden for.

Fritidsaktiviteter

To elevgrupper ble spurt hvor mange ganger de har fritidsaktiviteter i løpet av en uke. Svarene ble:

 Gruppe A:      1   3   3   3   5 
 Gruppe B:      2   3   3   3   4 

 

Datamaterialene for begge elevgruppene har gjennomsnitt, median og typetall lik 3. Vi så på forrige side at vi kan fange noe av forskjellen på datasettene ved å bruke variasjonsbredde, men nå skal vi heller bruke varians og standardavvik.

For dataene i gruppe A har vi:

  1. Gjennomsnittet er lik 1+3+3+3+55=3
  2. Differansene er lik 13=2,33=0,33=0,33=0 og 53=2
  3. Kvadratene av differansene er lik (2)2=4,02=0,02=0,02=0 og 22=4
  4. Summen av kvadrater av differanser er lik 4+0+0+0+4=8
  5. Variansen er lik denne summen dividert med det totale antallet data, som er lik 85=1,6 

For å finne standardavviket, tar vi kvadratroten og får

 1,61,26.

Test deg selv og regn ut varians og standardavvik for gruppe B – fasitsvarene er varians lik 0,4 og standardavvik lik 0,63.

Siden både varians og standardavvik for data i gruppe A er større enn i gruppe B, kan vi si at dataene i gruppe A varierer mer enn dataene i gruppe B.

Del på Facebook

Del på Facebook

Begrep

  • Gjennomsnitt

    Gjennomsnitt er en middelverdi av alle dataene.

    Gjennomsnittet finner du ved å:
    1) summere alle data
    2) dele summen på total antall data

    Eksempel: Gjennomsnittet av 2, 2, 4, 3 er 2,75 fordi
    1) 2+2+4+3=11
    2) antall data er 4.  11:4=2,75

  • Median

    Medianen er den verdien som vi finner i midten av et rangert datamateriale.

    Eksempel: I et datamateriale har vi verdiene 3, 6, 1, 4 og 5. Vi rangerer verdiene til 1, 3, 4, 5, 6. Den midterste verdien er 4. Medianen er 4.

  • Sentralmål

    Sentralmål er utregnede verdier som viser "sentrum" for innsamlede data. Tre eksempler på sentralmål er gjennomsnitt, median og typetall.

    Se gjennomsnitt, median og/eller typetall

  • Spredningsmål

    Spredningsmål er størrelser som sier oss noe om hvor mye dataene i et datasett varierer. Noen eksempler på spredningsmål er variasjonsbredde, varians og kvartiler.

  • Standardavvik

    Standardavviket er kvadratroten av variansen. Dette er på en måte et forventet avvik fra gjennomsnittet.

  • Typetall

    Typetallet er det tallet som opptrer flest ganger i et innsamlet tallmateriale fra for eksempel en spørreundersøkelse.

    Eksempel: 1, 1, 2, 2, 2, 3, 3, 4, 4, 5. Her er typetallet 2.

  • Varians

    Et mål for spredningen i et datamateriale, som er lik kvadratet av standardavviket.

    Slik finner du varians:

    Regn ut gjennomsnittet
    Regn forskjellene mellom gjennomsnittet og hvert av tallene
    Kvadrer forskjellene
    Summer kvadrater av forskjellene
    Divider summen med det totale antallet data

  • Variasjonsbredde

    Variasjonsbredden i et datamateriale er differansen mellom den største verdien og den minste verdien.

Hopp over bunnteksten