Razumijevanje histograma relativne frekvencije

U statistika, postoje mnogi pojmovi koji imaju među njima suptilne razlike. Jedan od primjera toga je razlika između učestalost i relativna učestalost. Iako postoji mnogo korištenja za relativne frekvencije, postoji jedna posebno koja uključuje histogram s relativnom frekvencijom. Ovo je vrsta grafa koji ima veze s drugim temama iz statistike i matematičke statistike.

definicija

Histogrami su statistički grafikoni koji izgledaju bar grafikoni. No obično je izraz histogram rezerviran za kvantitativan varijable. Vodoravna os histograma je brojčana linija koja sadrži klase ili kante jednolike duljine. Te kante su intervali brojačkog broja u koje mogu padati podaci i mogu se sastojati od jednog broja (obično za diskretna skupovi podataka koji su relativno mali) ili raspon vrijednosti (za veće diskretne skupove podataka i stalan podaci).

Na primjer, mogla bi nas zanimati razmatranje raspodjele bodova na kvizu za 50 bodova za razred učenika. Jedan mogući način konstruiranja kanti bio bi drugačiji kanter za svakih 10 bodova.

instagram viewer

Okomita os histograma predstavlja broj ili učestalost pojave podatkovne vrijednosti u svakoj od kanti. Što je traka viša, više podataka prelazi u ovaj raspon vrijednosti kante. Da se vratimo našem primjeru, ako imamo pet učenika koji su na kvizu postigli više od 40 bodova, tada će traka koja odgovara 40 do 50 kanti biti visoka pet jedinica.

Usporedba frekvencije histograma

Histogram relativne frekvencije manje je izmjene tipičnog histograma frekvencije. Umjesto da vertikalnu os koristimo za brojanje vrijednosti podataka koje padnu u danu kantu, mi koristimo ovu osovinu za predstavljanje ukupnog udjela vrijednosti podataka koji padaju u ovaj kantu. Budući da je 100% = 1, sve šipke moraju imati visinu od 0 do 1. Nadalje, visina svih šipki u našem histogramu s relativnom frekvencijom mora biti jednaka 1.

Stoga, u primjeru trčanja koji smo gledali, pretpostavimo da u našem razredu ima 25 učenika, a pet ih je osvojilo više od 40 bodova. Umjesto da za ovaj kantu konstruiramo šipku visine pet, imali bismo traku visine 5/25 = 0,2.

Usporedimo li histogram s histogramom relativne frekvencije, svaki s istim kantama, primijetit ćemo nešto. Ukupni oblik histograma bit će identičan. Histogram relativne frekvencije ne naglašava ukupni broj u svakoj posudi. Umjesto toga, ova vrsta grafikona usredotočuje se na to koliko se broj podataka u kanti odnosi na ostale kante. Način na koji pokazuje taj odnos je u postocima od ukupnog broja vrijednosti podataka.

Funkcije mase vjerojatnosti

Možemo se pitati koja je poanta u definiranju histograma relativne frekvencije. Jedna se ključna aplikacija odnosi na diskretne slučajne varijable u kojima su naši kanti širine jedan i usredotočeni na svaki nenegativni cijeli broj. U ovom slučaju možemo definirati komadno funkciju s vrijednostima koje odgovaraju vertikalnim visinama šipki u našem histogramu relativne frekvencije.

Ova vrsta funkcije naziva se funkcijom mase vjerojatnosti. Razlog konstrukcije funkcije na ovaj način je taj što krivulja koja je definirana funkcijom ima izravnu vezu s vjerojatnost. Područje ispod krivulje od vrijednosti do b je vjerojatnost da slučajna varijabla ima vrijednost od do b.

Veza između vjerojatnosti i područja ispod krivulje je ona koja se više puta pokazuje u matematičkoj statistici. Upotreba funkcije vjerojatnosti mase za modeliranje histograma relativne frekvencije je još jedna takva veza.

instagram story viewer