Ima ih mnogo distribucije vjerojatnosti koji se koriste tijekom statistike. Na primjer, standardna normalna raspodjela, ili krivulja zvona, vjerojatno je najpoznatiji. Normalne raspodjele samo su jedna vrsta distribucije. Jedna vrlo korisna distribucija vjerojatnosti za proučavanje varijacija populacije naziva se F-distribucija. Ispitati ćemo nekoliko svojstava ove vrste distribucije.
Osnovna svojstva
Formula gustoće vjerojatnosti za F-distribuciju je prilično složena. U praksi se ne trebamo baviti ovom formulom. Međutim, može biti korisno znati neke detalje o svojstvima koja se tiču F-distribucije. Neke od važnijih značajki ove distribucije navedene su u nastavku:
- F-distribucija je obitelj distribucija. To znači da postoji beskonačan broj različitih F-distribucija. Konkretna F-distribucija koju koristimo za aplikaciju ovisi o broju stupnjevi slobode koji ima naš uzorak. Ova značajka F-distribucije slična je objema t-podjela i hi-kvadratna distribucija.
- F-distribucija je ili nula ili pozitivna, tako da nema negativnih vrijednosti za F. Ova značajka F-distribucije slična je hi-kvadratnoj distribuciji.
- F-distribucija je iskrivljen nadesno. Stoga je ova distribucija vjerojatnosti nesimetrična. Ova značajka F-distribucije slična je hi-kvadratnoj distribuciji.
Ovo su neke od važnijih i lako prepoznatih značajki. Pobliže ćemo pogledati stupnjeve slobode.
Stupnjevi slobode
Jedna značajka koju dijele hi-kvadrat distribucije, t-distribucije i F-distribucije je ta što u svakoj od tih distribucija postoji zaista beskonačna obitelj. Posebna raspodjela izdvaja se poznavanjem broja stupnjeva slobode. Za t distribucije, broj stupnjeva slobode je jedan manji od naše veličine uzorka. Broj stupnjeva slobode za F-distribuciju određuje se na drugačiji način nego za t-distribuciju ili čak hi-kvadratnu distribuciju.
Niže ćemo vidjeti kako točno nastaje F-distribucija. Za sada ćemo razmotriti dovoljno samo da odredimo broj stupnjeva slobode. Raspodjela F je izvedena iz omjera koji uključuje dvije populacije. Postoji uzorak iz svake od ovih skupina i tako postoje stupnjevi slobode za oba ova uzorka. Zapravo oduzmemo jednu od obje veličine uzorka kako bismo odredili naša dva broja stupnjeva slobode.
Statistički podaci ovih populacija kombiniraju se u djeliću F-statistike. I brojnik i nazivnik imaju stupnjeve slobode. Umjesto da ta dva broja kombiniramo u drugi broj, zadržavamo ih oba. Stoga svaka upotreba tablice distribucije F zahtijeva da potražimo dva različita stupnja slobode.
Upotrebe F-distribucije
F-distribucija proizlazi iz inferencijalna statistika koji se tiču populacija. Konkretnije, koristimo F-distribuciju kada proučavamo omjer varijacija dviju normalno raspoređenih populacija.
F-distribucija se ne koristi samo za izgradnju intervala pouzdanosti i testiranje hipoteza o varijanci populacije. Ova vrsta distribucije koristi se i u jednostrukom faktoru analiza varijance (ANOVA). ANOVA se bavi uspoređivanjem varijacija između nekoliko skupina i varijacija unutar svake skupine. Da bismo to postigli, koristimo omjer odstupanja. Taj omjer varijanci ima F-distribuciju. Nešto složena formula omogućava nam izračunavanje F-statistike kao testne statistike.