Analiza varijance, ili ANOVA ukratko, je statistički test koji traži značajne razlike između sredstva o određenoj mjeri. Na primjer, recimo da ste zainteresirani za proučavanje stupnja obrazovanja sportaša u nekoj zajednici, pa istražite ljude na raznim timovima. Počinjete se, međutim, zapitati je li razina obrazovanja kod različitih timova različita. Možete upotrijebiti ANOVA da biste utvrdili je li srednja razina obrazovanja između softball tima u odnosu na ragbi tim u odnosu na Ultimate Frisbee tim.
Ključni postupci: analiza varijance (ANOVA)
- Istraživači provode ANOVA kad su zainteresirani da utvrde razlikuju li se dvije skupine u određenoj mjeri ili testu.
- Postoje četiri osnovne vrste ANOVA modela: jednosmjerna između grupa, jednosmjerna ponovljena mjera, dvosmjerna između skupina i dvosmjerna ponovljena mjera.
- Statistički softverski programi mogu se koristiti kako bi se provođenje ANOVA učinilo jednostavnijim i učinkovitijim.
ANOVA modeli
Postoje četiri vrste osnovnih ANOVA modela (iako je moguće izvesti i složenije ANOVA testove). Slijede opisi i primjeri svakog od njih.
Jednosmjerna između grupa ANOVA
Jednosmjerna između grupa ANOVA koristi se kada želite testirati razliku između dvije ili više skupina. Gore navedeni primjer, stupanj obrazovanja među različitim sportskim timovima, bio bi primjer ove vrste modela. Naziva se jednosmjernom ANOVA-om jer postoji samo jedna varijabla (vrsta sporta) koja se koristi za podjelu sudionika u različite skupine.
Jednosmjerne ponovljene mjere ANOVA
Ako ste zainteresirani za procjenu jedne grupe u više vremenskih točaka, trebali biste koristiti jednosmjerne ponovljene mjere ANOVA. Na primjer, ako želite testirati razumijevanje predmeta od strane učenika, mogli biste mu upravljati na početku, sredinom i na kraju tečaja. Provođenje jednosmjerne ponovljene mjere ANOVA će vam omogućiti da saznate jesu li se testni rezultati učenika značajno promijenili od početka do kraja predmeta.
Dvosmjerni između grupa ANOVA
Zamislite sada da imate dva različita načina na koje želite grupirati svoje sudionike (ili, statistički gledano, imate dva različita neovisne varijable). Na primjer, zamislite da ste bili zainteresirani za testiranje razlikuju li se rezultati testova između studentskih sportaša i nesportaša, kao i za brucoše i seniore. U ovom ćete slučaju voditi dvosmjerno između grupa ANOVA. Iz ove ANOVE imala bi tri učinka - dva glavna učinka i učinak interakcije. Glavni učinci su učinak sportaša i učinak godine klase. Učinak interakcije promatra utjecaj obojeg sportaša i razredna godina. Svaki od glavnih učinaka je jednosmjerni test. Učinak interakcije jednostavno je pitanje utječu li dva glavna učinka jedna na drugu: na primjer, ako su studentski sportaši postigli različite rezultate nego što to nisu sportaši, ali to je bio slučaj samo tijekom proučavanja brucoša, došlo bi do interakcije između razredne godine i postojanja sportaš.
Dvosmjerne ponovljene mjere ANOVA
Ako želite pogledati kako se različite grupe mijenjaju kroz vrijeme, možete upotrijebiti dvosmjerne ponovljene mjere ANOVA. Zamislite da vas zanima kako se rezultati testova mijenjaju kroz vrijeme (kao u gornjem primjeru za jednosmjernu ponovljenu mjeru ANOVA). Međutim, ovaj put vas zanima i procjena spola. Na primjer, poboljšavaju li mužjaci i žene rezultate testova jednakom stopom ili postoji razlika u spolu? Za odgovaranje na ove vrste pitanja mogu se koristiti dvosmjerne ponovljene mjere ANOVA.
Pretpostavke ANOVA
Sljedeće pretpostavke postoje kada vršite analizu varijance:
- očekivane vrijednosti od pogreške je nula.
- Varijacije svih pogrešaka jednake su jedna drugoj.
- Pogreške su međusobno neovisne.
- Pogreške su normalno distribuira.
Kako je ANOVA gotova
- Srednja vrijednost izračunava se za svaku od vaših skupina. Na primjeru obrazovnih i sportskih timova iz uvoda u prvom stavku gore, prosječna razina obrazovanja izračunava se za svaki sportski tim.
- Tada se izračunava ukupna srednja vrijednost za sve skupine u kombinaciji.
- Unutar svake skupine izračunava se ukupno odstupanje vrijednosti pojedinog od prosjeka grupe. To nam govori imaju li skloni pojedinci u grupi slične rezultate ili postoji mnogo varijacija između različitih ljudi u istoj skupini. Statističari to nazivaju unutar varijacije grupe.
- Zatim se izračunava koliko odstupanje svake skupine od ukupne srednje vrijednosti. Ovo se zove između varijacija grupe.
- Konačno, izračunava se F statistika, koja je omjer između varijacija grupe prema unutar varijacije grupe.
Ako postoji značajno veće između varijacija grupe od unutar varijacije grupe (drugim riječima, kada je F statistika veća), onda je vjerojatno da je razlika između skupina statistički značajna. Statistički softver može se koristiti za izračunavanje F statistike i utvrđivanje je li on značajan ili ne.
Sve vrste ANOVA slijede gore navedene principe. Međutim, kako se broj skupina i učinci interakcije povećavaju, izvori varijacije postat će složeniji.
Izvođenje ANOVA
Budući da je ručno upravljanje ANOVA-om dugotrajan proces, većina istraživača koristi statističke programe dok su zainteresirani za provođenje ANOVA-e. SPSS može se koristiti za provođenje ANOVA-ova, kao što može R, besplatni program. U Excelu možete napraviti ANOVA pomoću dodatka Analiza podataka. SAS, STATA, Minitab i drugi statistički softverski programi koji su opremljeni za rukovanje većim i složenijim skupovima podataka također se mogu koristiti za izvođenje ANOVA.
Reference
Sveučilište Monash. Analiza varijance (ANOVA). http://www.csse.monash.edu.au/~smarkham/resources/anova.htm