Stupnjevi slobode za neovisnost u dvosmjernoj tablici

click fraud protection

Broj stupnjevi slobode za neovisnost dviju kategorijskih varijabli daje se jednostavna formula: (r - 1)(c - 1). Ovdje r je broj redova i c je broj stupaca u dvosmjerni stol vrijednosti vrijednosti kategorijske varijable. Čitajte dalje da biste saznali više o ovoj temi i da biste razumjeli zašto ova formula daje točan broj.

pozadina

Jedan korak u procesu mnogih testovi hipoteza je određivanje broja stupnjeva slobode. Ovaj je broj važan jer za distribucije vjerojatnosti koje uključuju obitelj distribucija, kao što su hi-kvadrat distribucije, broj stupnjeva sloboda označava točnu raspodjelu iz obitelji koju bismo trebali koristiti u svojoj hipotezi test.

Stupnjevi slobode predstavljaju broj slobodnih izbora koje možemo donijeti u određenoj situaciji. Jedan od testova hipoteze koji zahtijeva da utvrdimo stupnjeve slobode je Hi-kvadrat test neovisnosti za dvije kategorijske varijable.

Testovi za neovisnost i dvosmjerne tablice

Hi-kvadrat test za neovisnost zahtijeva da konstruiramo dvosmjernu tablicu, poznatu i kao tablicu nepredviđenih stanja. Ova vrsta stola ima

instagram viewer
r redovi i c stupaca, predstavljajući r razine jedne kategorijske varijable i c razine druge kategorijske varijable. Dakle, ako ne računamo red i stupac u koji bilježimo zbrojeve, postoji ukupno rc ćelije u dvosmjernoj tablici.

Hi-kvadrat test za neovisnost omogućuje nam testiranje hipoteze da je kategoričan varijable su neovisne jedna o drugoj. Kao što smo gore spomenuli r redovi i c stupci u tablici daju nam (r - 1)(c - 1) stupnjeva slobode. No možda nije odmah jasno zašto je točan broj stupnjeva slobode.

Broj stupnjeva slobode

Da biste vidjeli zašto (r - 1)(c - 1) je točan broj, detaljnije ćemo ispitati ovu situaciju. Pretpostavimo da znamo granične ukupne iznose za svaku od razina naših kategorijskih varijabli. Drugim riječima, znamo za svaki red i ukupno za svaki stupac. Za prvi red postoje c stupaca u našoj tablici, pa ih ima c Stanice. Jednom kada znamo vrijednosti svih osim jedne od ovih ćelija, tada je, budući da znamo ukupan broj svih stanica, jednostavan problem s algebrom odrediti vrijednost preostale ćelije. Ako bismo popunjavali ove ćelije naše tablice, mogli bismo ući c - 1 slobodno, ali tada se preostala ćelija određuje prema ukupnom redu. Tako postoje c - 1 stupanj slobode za prvi red.

Nastavljamo na ovaj način za sljedeći red, a opet ih ima c - 1 stupanj slobode. Taj se postupak nastavlja sve dok ne dođemo do pretposljednjeg reda. Svaki od redaka osim posljednjeg daje svoj doprinos c - 1 stupanj slobode ukupno. Do trenutka kada imamo sve, osim posljednjeg retka, a zatim i zato što znamo zbroj stupaca, možemo odrediti sve unose zadnjeg retka. To nam daje r - 1 redak sa c - 1 stupanj slobode u svakom od njih, ukupno (r - 1)(c - 1) stupnjeva slobode.

Primjer

To vidimo na sljedećem primjeru. Pretpostavimo da imamo dvosmjernu tablicu s dvije kategorijske varijable. Jedna varijabla ima tri razine, a druga dva. Nadalje, pretpostavimo da znamo ukupne vrijednosti redaka i stupaca za ovu tablicu:

Razina A Razina B ukupno
Razina 1 100
Razina 2 200
Razina 3 300
ukupno 200 400 600

Formula predviđa da postoje (3-1) (2-1) = 2 stupnja slobode. To vidimo na sljedeći način. Pretpostavimo da u gornju lijevu ćeliju popunimo s brojem 80. To će automatski odrediti cijeli prvi red unosa:

Razina A Razina B ukupno
Razina 1 80 20 100
Razina 2 200
Razina 3 300
ukupno 200 400 600

Ako znamo da je prvi unos u drugom redu 50, tada se popunjava ostatak tablice, jer znamo ukupan broj svakog retka i stupca:

Razina A Razina B ukupno
Razina 1 80 20 100
Razina 2 50 150 200
Razina 3 70 230 300
ukupno 200 400 600

Tablica je u potpunosti popunjena, ali imali smo samo dva slobodna izbora. Nakon što su se te vrijednosti doznale, ostatak tablice bio je potpuno određen.

Iako obično ne trebamo znati zašto postoji toliko mnogo sloboda, dobro je znati da u novoj situaciji zapravo primjenjujemo koncept stupnjeva slobode.

instagram story viewer