Jedan od ciljeva statistike je uređivanje podataka na smisleni način. Dvosmjerne tablice važan su način organiziranja određene vrste upareni podaci. Kao i kod izrade bilo kojeg grafikona ili tablice u statistici, vrlo je važno znati vrste varijabli s kojima radimo. Ako imamo kvantitativne podatke, onda je graf kao što je a histogram ili plod stabljike i lišća trebalo bi se koristiti. Ako imamo kategorijske podatke, onda je grafikon ili kružni graf odgovara.
Kod rada s uparenim podacima moramo biti oprezni. Postoji rasipani krug za uparene kvantitativne podatke, ali kakav je grafikon za uparene kategoričan podaci? Kad god imamo dvije kategorijske varijable, tada bismo trebali koristiti dvosmjernu tablicu.
Opis dvosmjerne tablice
Prvo, podsjetimo se da se kategorički podaci odnose na osobine ili kategorije. Nije kvantitativan i nema numeričke vrijednosti.
Dvosmjerna tablica uključuje popis svih vrijednosti ili razina za dvije kategorijske varijable. Sve vrijednosti jedne od varijabli navedene su u vertikalnom stupcu. Vrijednosti za drugu varijablu navedene su duž vodoravnog retka. Ako prva varijabla ima
m vrijednosti, a druga varijabla ima n vrijednosti, tada će biti ukupno MN unosi u tablici. Svaki od ovih unosa odgovara određenoj vrijednosti za svaku od dvije varijable.Duž svakog retka i uz svaki stupac unosi se zbrajaju. Ti su zbrojevi važni kod određivanja granične i uvjetne distribucije. Ti su zbrojevi važni i kad provodimo hi-kvadrat test za neovisnost.
Primjer dvosmjerne tablice
Na primjer, razmotrit ćemo situaciju u kojoj razmatramo nekoliko odjeljaka tečaja statistike na sveučilištu. Želimo konstruirati dvosmjernu tablicu koja će odrediti koje razlike postoje, ako postoje, između muškaraca i ženki. Da bismo to postigli, računamo broj svake ocjene slova koju su zaradili pripadnici svakog spola.
Primjećujemo da je prva kategorijska varijabla ona roda, a u istraživanju muškog i ženskog pola postoje dvije moguće vrijednosti. Druga kategorijska varijabla je ocjena za slovo i pet je vrijednosti koje su zadane A, B, C, D i F. To znači da ćemo imati dvosmjernu tablicu s 2 x 5 = 10 unosa, plus dodatni redak i dodatni stupac koji će biti potreban za tabliranje ukupnog broja redaka i stupaca.
Naša istraga pokazuje da:
- 50 mužjaka je zaradilo A, dok je 60 žena zaradilo A.
- 60 mužjaka je zaradilo B, a 80 ženki B.
- 100 mužjaka je zaradilo C, a 50 žena zaradilo C.
- 40 mužjaka je zaradilo D, a 50 žena zaradilo D.
- 30 mužjaka je zaradilo F, a 20 žena zaradilo F.
Ovi podaci unose se u dvosmjernu tablicu u nastavku. Ukupni svaki red govori o tome koliko je zarađenih svake vrste ocjena. Ukupni stupci govore o broju mužjaka i broju ženki.
Važnost dvosmjernih tablica
Dvosmjerne tablice pomažu organizirati naše podatke kada imamo dvije kategorijske varijable. Ova se tablica može upotrijebiti za usporedbu između dviju različitih skupina u našim podacima. Na primjer, možemo razmotriti relativnu izvedbu muškaraca u tečaju statistike u odnosu na performanse žena u tečaju.
Sljedeći koraci
Nakon formiranja dvosmjerne tablice, sljedeći korak može biti statistički analiza podataka. Možemo se zapitati jesu li varijable koje su u studiji neovisne jedna o drugoj ili ne. Za odgovor na ovo pitanje možemo koristiti hi-kvadrat test na dvosmjernoj tablici.
Dvosmjerna tablica za ocjene i spolove
Muški | Žena | ukupno | |
50 | 60 | 110 | |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
ukupno | 280 | 260 | 540 |