Hopp til hovedinnholdet
www.matematikk.org

Histogram

Hva er et histogram? Hvordan leser eller lager vi et histogram?

Et histogram er en grafisk illustrasjon som viser hvordan numeriske data fordeler seg. Det består av søyler som er tegnet inntil hverandre i et aksesystem. Når observasjonene er kontinuerlige (kan ha alle mulige verdier i et intervall), er histogrammet godt egnet for fremstilling av data.

For å tegne et histogram deler vi datamaterialet i grupper (klasser) med like store klassebredder. Klassebredden er differansen mellom den største og minste verdien i hver gruppe. Vi velger selv hvor stor klassebredden skal være, men merk at vi må bruke samme klassebredde i alle gruppene. Etter å ha gruppert data, teller vi opp frekvenser for intervallene og lager en frekvenstabell.

Vi tegner søylene med søylehøydene lik relativ frekvens dividert på klassebredden. På denne måten tilsvarer søylearealene de relative frekvensene, og arealet av alle søylene er alltid lik 1. Man kan også ha frekvens i stedet for relativ frekvens i y-aksen, men da er ikke det totale arealet lik 1.   

Nå skal vi se på et eksempel.

Filmlengde

Filmleverandøren "Snurr" registrerer spilletider på alle filmer de gir ut. Her finner du en oversikt over lengdene til de 25 nyeste filmene de har gitt ut (vi oppgir lengde i minutter):

 

 101   93   92   110   97   95   91   101   118    94    135    96    137 
 102  89  94  105  89  99  95  115  121  108  113  132  

 

Det ser ut som 10 minutter kan være et godt alternativ for klassebredden i dette tilfellet. Da kan vi for eksempel dele dataene inn i 6 grupper med 10 som klassebredden, telle frekvensene for hvert intervall og beregne relative frekvenser og søylehøyder. Vi fører inn tallene og får følgende frekvenstabell:

 Spilletid
 Frekvens       Relativ frekvens
 Søylehøyde 
 [80,90         2               8%       0,008
 [90,100         9              36%       0,036
 [100,110         6              24%       0,024
 [110,120         4              16%       0,016
 [120,130         1                4%       0,004
 [130,140         3              12%       0,012

 

Uttrykket [80,90, for eksempelm betyr at alle filmer med spilletid fra og med 80 minutter og til, men ikke med, 90 minutter er i denne gruppen. Parentesen "[" betyr fra og med, mens "" betyr til.

Histogrammet under er tegnet ved hjelp av Excel, og søylearealene er lik de relative frekvensene for data i ulike grupper.

Histogrammet viser at av filmene "Snurr" gir ut varer de fleste mellom 90 og 99 minutter. Ellers ser vi at det kun er én film med spilletid et sted mellom 120 og 130 minutter.

Merk at på bakgrunn av den valgte klassedelingen, vil histogrammet skjule hvordan dataene er fordelt innenfor klassene. Det er umulig for den som ser histogrammet å si noe om dette uten å få tilgang også til dataene histogrammet er bygget på.

Del på Facebook

Del på Facebook

Begrep

  • Frekvens

    Frekvens er antall ganger et svaralternativ eller en observasjon finnes i en datasamling. Vi finner fekvensen ved å telle opp hvor mange ganger en og samme data inntreffer.

    Se frekvenstabell

  • Frekvenstabell

    Frekvenstabell

    En frekvenstabell er en opptelling og ordning av dataene i en datasamling.

    Se frekvens

  • Histogram

    Et histogram er et søylediagram der hver søyle viser frekvensen innenfor et tallintervall. Hele måleområdet er ofte delt inn i like store intervaller.

  • Intervall

    Et intervall er det samme som et tallområde. Tallene 4, 5, 6 og 7 ligger i intervallet 4–7 (fire til sju).

    Dersom vi ikke har sagt noe annet, lar vi øvre og nedre grense høre med til intervallet.

  • Numeriske data

    En datamengde som består av tall.

  • Relativ frekvens

    Antall observasjoner av en spesiell hendelse dividert på antall observasjoner.

    Eksempel: Dersom du kaster en terning 40 ganger og får 4 seksere, er den relative frekvensen av seksere 4/40 = 0,1.

Hopp over bunnteksten