Histogram je vrsta grafa koji ima široku primjenu u statistici. Histogrami pružaju vizualnu interpretaciju brojčani podaci navođenjem broja podatkovnih točaka unutar raspona vrijednosti. Ti se rasponi vrijednosti nazivaju klase ili kante. Učestalost podataka koji padaju u svakom razredu prikazana je korištenjem trake. Što je traka veća, veća je frekvencija vrijednosti podataka u tom kantu.
Histogrami vs. Stupni grafikoni
Na prvi pogled histogrami izgledaju vrlo slično bar grafikoni. Oba grafikona koriste vertikalne trake za predstavljanje podataka. Visina šipke odgovara visini relativna frekvencija količine podataka u razredu. Što je traka veća, veća je frekvencija podataka. Što je niža traka, niža je učestalost podataka. Ali izgled može obmanjivati. Ovdje se završavaju sličnosti dviju vrsta grafova.
Razlog različitosti ovih vrsta grafova ima veze sa razina mjerenja podataka. S jedne strane, grafikoni se koriste za podatke na nazivnoj razini mjerenja. Stupni grafikoni izmjerite učestalost kategorijskih podataka, a klase za grafikon su ove kategorije. S druge strane, histogrami se koriste za podatke koji su barem na
redna razina mjerenja. Klase za histogram su rasponi vrijednosti.Druga ključna razlika između grafikona i histograma odnosi se na redoslijed šipki. Na šipkama je uobičajena praksa da se redovi preuređuju prema opadajućoj visini. No, šipke u histogramu ne mogu se preurediti. Moraju se prikazati redoslijedom nastave.
Primjer histograma
Dijagram gore prikazuje nam histogram. Pretpostavimo da su četiri novčića okrenuta i rezultati su zabilježeni. Uporaba odgovarajućeg binomna tablica raspodjele ili izravni proračuni s binomnom formulom pokazuju vjerojatnost da nijedna glava nije 1/16, vjerojatnost da jedna glava prikazuje je 4/16. Vjerojatnost dviju glava je 6/16. Vjerojatnost tri glave je 4/16. Vjerojatnost četiri glave je 1/16.
Konstruiramo ukupno pet klasa, svaki širine jedan. Te klase odgovaraju broju mogućih glava: nula, jedna, dvije, tri ili četiri. Iznad svake klase crtamo okomitu traku ili pravokutnik. Visine ovih redova odgovaraju vjerojatnostima spomenutim za naš eksperiment vjerojatnosti prebacivanja četiri kovanice i brojanja glava.
Histogrami i vjerojatnosti
Gornji primjer ne samo da pokazuje izgradnju histograma, već i to pokazuje diskretne distribucije vjerojatnosti može se predstaviti histogramom. Doista, i diskretna raspodjela vjerojatnosti može se predstaviti histogramom.
Da bismo konstruirali histogram koji predstavlja raspodjelu vjerojatnosti, započinjemo odabirom klasa. To bi trebali biti rezultati pokusa vjerojatnosti. Širina svake od tih klasa treba biti jedna jedinica. Visine šipki histograma vjerojatnost su za svaki od ishoda. Uz ovako izrađen histogram, vjerojatna su i područja šipki.
Budući da nam vrsta histograma daje vjerojatnost, podložna je nekoliko uvjeta. Jedna odredba je da se za skali koja nam daje visinu zadanog stupa histograma mogu koristiti samo nenegativni brojevi. Drugi je uvjet da, budući da je vjerojatnost jednaka površini, sva područja šipki moraju iznositi ukupno jedno, što odgovara 100%.
Histogrami i ostale aplikacije
Trake u histogramu ne moraju biti vjerojatnosti. Histogrami su korisni u područjima koja nisu vjerojatna. U bilo kojem trenutku koji želimo usporediti učestalost pojavljivanja kvantitativnih podataka, histogram se može koristiti za prikaz našeg skupa podataka.