Statistički podaci su subjekti s brojnim brojevima distribucije vjerojatnosti i formule. Povijesno su mnogi izračuni koji uključuju ove formule bili prilično zamorni. Tablice vrijednosti generirane su za neke češće korištene distribucije, a većina udžbenika još uvijek u dodatcima ispisuje izvatke iz tih tablica. Iako je važno razumjeti konceptualni okvir koji djeluje iza scene za određenu tablicu vrijednosti, brzi i točni rezultati zahtijevaju upotrebu statističkog softvera.
Postoji čitav niz statističkih softverskih paketa. Jedan koji se obično koristi za izračun na uvodnom dijelu je Microsoft Excel. Mnoge distribucije programiraju se u Excelu. Jedna od njih je hi-kvadratna distribucija. Postoji nekoliko Excelovih funkcija koje koriste hi-kvadratnu distribuciju.
Pojedinosti o kvadraturi
Prije nego što vidimo što Excel može učiniti, podsjetimo se nekih detalja u vezi s distribucijom chi-kvadrat. Ovo je distribucija vjerojatnosti koja je nesimetrična i vrlo velika iskrivljen nadesno. Vrijednosti za distribuciju uvijek su negativne. Zapravo postoji beskonačan broj distribucija chi-kvadratnih. Ono što nas posebno zanima određuje se brojem
stupnjevi slobode koje imamo u svojoj prijavi. Što je veći broj stupnjeva slobode, to će biti manje iskrivljena naša hi-kvadratna distribucija.Upotreba Chi-kvadrata
hi-kvadratna distribucija koristi se za nekoliko primjena. To uključuje:
- Chi-kvadrat test - za određivanje jesu li razine dvije kategorijske varijable neovisne jedna o drugoj.
- Ispitivanje ispravnosti- Da biste odredili kako se dobro promatrane vrijednosti jedne kategorijske varijable podudaraju sa vrijednostima koje očekuje teorijski model.
- Multinomalni eksperiment—Ovo je specifična uporaba hi-kvadrat testa.
Sve ove aplikacije zahtijevaju da koristimo hi-kvadratnu distribuciju. Softver je neophodan za proračune vezane uz ovu distribuciju.
CHISQ.DIST i CHISQ.DIST.RT u Excelu
U programu Excel postoji nekoliko funkcija koje možemo koristiti u radu s hi-kvadratnim distribucijama. Prvi od njih je CHISQ.DIST (). Ova funkcija vraća lijevu vjerojatnost naznačene hi-kvadrat distribucije. Prvi argument funkcije je promatrana vrijednost statistike hi-kvadrata. Drugi argument je broj stupnjevi slobode. Treći argument koristi se za dobivanje kumulativne distribucije.
Usko povezan s CHISQ.DIST je CHISQ.DIST.RT (). Ova funkcija vraća ispravnu vjerojatnost odabrane distribucije chi-kvadratom. Prvi argument je promatrana vrijednost statistike hi-kvadrat, a drugi argument je broj stupnjeva slobode.
Na primjer, ako unesete = CHISQ.DIST (3, 4, istina) u ćeliju, dobit će se 0,442175. To znači da za raspodjelu hi-kvadrata s četiri stupnja slobode 44,2175% područja ispod krivulje nalazi se lijevo od 3. Ako unesete = CHISQ.DIST.RT (3, 4) u ćeliju, dobit će se 0,557825. To znači da za raspodjelu hi-kvadrata s četiri stupnja slobode 55,7825% područja ispod krivulje leži desno od 3.
Za sve vrijednosti argumenata, CHISQ.DIST.RT (x, r) = 1 - CHISQ.DIST (x, r, istina). To je zato što dio distribucije koji ne leži lijevo od vrijednosti x mora ležati s desne strane.
CHISQ.INV
Ponekad započinjemo s područjem za određenu hi-kvadratnu distribuciju. Želimo znati koja bi nam vrijednost statistike trebala da bismo imali ovo područje lijevo ili desno od statistike. To je obrnuti Chi-kvadrat problem i korisno je kada želimo znati kritičnu vrijednost za određenu razinu značaja. Excel rješava ovakav problem pomoću funkcije obrnutog hi-kvadrata.
Funkcija CHISQ.INV vraća inverziju vjerojatnosti lijevog talasa za hi-kvadratnu distribuciju s određenim stupnjevima slobode. Prvi argument ove funkcije je vjerojatnost lijevo od nepoznate vrijednosti. Drugi argument je broj stupnjeva slobode.
Tako će, na primjer, unos = CHISQ.INV (0.442175, 4) u ćeliju dati izlaz od 3. Obratite pažnju na to kako je ovo obrnuto izračunato što smo prije pogledali u vezi sa funkcijom CHISQ.DIST. Općenito, ako P = CHISQ.DIST (x, r), tada x = CHISQ.INV ( P, r).
Usko povezano s tim je funkcija CHISQ.INV.RT. To je isto kao i CHISQ.INV, s iznimkom da se bavi pravougaonim vjerojatnostima. Ova je funkcija posebno korisna u određivanju kritične vrijednosti za određivanje hi-kvadrat testa. Sve što trebamo učiniti je ući u razinu značaja kao naša ispravna vjerojatnost i broj stupnjeva slobode.
Excel 2007 i ranije
Ranije verzije Excela koriste malo drugačije funkcije za rad s chi-kvadratom. Prethodne verzije Excela imale su funkciju samo za izračun vjerojatnosti s desnim repom. Tako CHIDIST odgovara novijem CHISQ.DIST.RT, Na sličan način CHIINV odgovara CHI.INV.RT.