Mnogo puta kada proučavamo grupu stvarno uspoređujemo dvije populacije. Ovisno o parametar ove skupine koja nas zanima i uvjeti s kojima se bavimo na raspolaganju je nekoliko tehnika. statistički zaključak postupci koji se tiču usporedbe dvije populacije obično se ne mogu primijeniti na tri ili više populacija. Za proučavanje više od dvije populacije odjednom, potrebne su nam različite vrste statističkih alata. Analiza varijanceili ANOVA, tehnika je iz statističkih interferencija koja nam omogućava da se bavimo s nekoliko populacija.
Usporedba sredstava
Da bismo vidjeli koji problemi nastaju i zašto nam treba ANOVA, razmotrit ćemo primjer. Pretpostavimo da pokušavamo utvrditi je li srednja utezi zelenih, crvenih, plavih i narančastih M&M bombona međusobno se razlikuju. Navest ćemo srednje težine za svaku od tih populacija, μ1, μ2, μ3 μ4 i respektivno. Možda koristimo odgovarajuće test hipoteze nekoliko puta i test C (4,2), ili šest različitih ništavne hipoteze:
- H0: μ1 = μ2 kako biste provjerili je li prosječna težina populacije crvenih bombona različita od srednje težine populacije plavih bombona.
- H0: μ2 = μ3 kako biste provjerili je li prosječna težina populacije plavih bombona različita od srednje težine populacije zelenih bombona.
- H0: μ3 = μ4 kako biste provjerili je li prosječna težina populacije zelenih bombona različita od srednje težine populacije narančastih bombona.
- H0: μ4 = μ1 kako biste provjerili je li prosječna težina populacije narančastih bombona različita od srednje težine populacije crvenih bombona.
- H0: μ1 = μ3 kako biste provjerili je li prosječna težina populacije crvenih bombona različita od srednje težine populacije zelenih bombona.
- H0: μ2 = μ4 kako biste provjerili je li prosječna težina populacije plavih bombona različita od srednje težine populacije narančastih bombona.
Postoji mnogo problema s ovom vrstom analiza. Imat ćemo šest p-vrijednosti. Iako možemo testirati svakog od 95% nivo samopouzdanja, naše povjerenje u cjelokupni proces je manje od ovoga jer se vjerojatnosti množe: .95 x .95 x .95 x .95 x .95 x .95 je otprilike .74 ili 74% razina pouzdanosti. Stoga se vjerojatnost pogreške I. tipa povećala.
Na temeljnijoj razini ne možemo usporediti ova četiri parametra u cjelini uspoređujući ih dva istodobno. Srednja vrijednost crvene i plave M&M može biti značajna, s tim da je srednja težina crvene boje relativno veća od srednje težine plave. Međutim, ako uzmemo u obzir težine svih četiri vrste slatkiša, možda neće biti značajne razlike.
Analiza varijance
Za rješavanje situacija u kojima trebamo napraviti više usporedbi koristimo ANOVA. Ovaj test omogućava nam razmatranje parametara nekoliko populacija odjednom, bez ulaska u neke probleme s kojima se susrećemo provođenje testova hipoteza na dva parametra istodobno.
Da se ANOVA provodi s gornjim primjerom M&M, testirali bismo nultu hipotezu H0:μ1 = μ2 = μ3= μ4. Ovo navodi da nema razlike između srednjih težina crvenih, plavih i zelenih M&M. Alternativna hipoteza je da postoji neke razlike između srednjih težina crvenih, plavih, zelenih i narančastih boja. Ova je hipoteza zaista kombinacija nekoliko tvrdnji H:
- Srednja težina populacije crvenih bombona nije jednaka srednjoj težini populacije plavih bombona, ILI
- Srednja težina populacije plavih bombona nije jednaka srednjoj težini populacije zelenih bombona, ILI
- Srednja težina populacije zelenih bombona nije jednaka srednjoj težini populacije narančastih bombona, ILI
- Srednja težina populacije zelenih bombona nije jednaka srednjoj težini populacije crvenih bombona, ILI
- Srednja težina populacije plavih bombona nije jednaka srednjoj težini populacije narančastih bombona, ILI
- Srednja težina populacije plavih bombona nije jednaka srednjoj težini populacije crvenih bombona.
U ovom konkretnom slučaju, za dobivanje naše p-vrijednosti, koristili bismo a raspodjela vjerojatnosti poznat kao the F-distribucija. Izračuni koji uključuju ANOVA F test mogu se obaviti ručno, ali obično se računaju sa statističkim softverom.
Višestruka usporedba
Ono što razdvaja ANOVA od ostalih statističkih tehnika jest da se koristi za višestruku usporedbu. To je uobičajeno u čitavoj statistici, jer postoji mnogo puta u kojima želimo usporediti više od samo dvije skupine. Općenito, opći test sugerira da postoji neka vrsta razlike između parametara koje proučavamo. Zatim pratimo ovaj test s nekom drugom analizom da bismo utvrdili koji se parametar razlikuje.