U ovom ćemo članku proći korake potrebne za izvođenje a test hipotezeili test važnosti, za razliku od dva udjela populacije. To nam omogućava usporediti dva nepoznata proporcija i zaključiti ako nisu jednake jednakoj ili ako je jedna veća od druge.
Pregled i pozadina testa hipoteze
Prije nego što uđemo u specifičnosti našeg testa hipoteza, razmotrit ćemo okvir testova hipoteza. U testu na značaj pokušavamo pokazati da izjava o vrijednosti stanovništva parametar (ili ponekad i priroda samog stanovništva) vjerojatno je istinita.
Mi prikupljamo dokaze za ovu izjavu izvodeći statistički uzorak. Iz ovog uzorka izračunavamo statistiku. Vrijednost ove statistike je u tome što koristimo za utvrđivanje istinitosti izvorne izjave. Taj postupak sadrži nesigurnost, no mi smo u mogućnosti kvantificirati tu nesigurnost
Cjelokupni postupak testa hipoteza dan je dolje navedenim popisom:
- Provjerite jesu li ispunjeni uvjeti potrebni za naš test.
- Jasno navedite nulta i alternativna hipoteza. Alternativna hipoteza može uključivati jednostrani ili dvostrani test. Također bismo trebali odrediti razinu značaja, koju ćemo označiti grčkim slovom alfa.
- Izračunajte test ispitivanja. Vrsta statistike koju koristimo ovisi o konkretnom testu koji provodimo. Izračun se oslanja na naš statistički uzorak.
- Izračunajte p-vrijednost. Statistika testa može se prevesti u p-vrijednost. P-vrijednost je vjerojatnost da će sama slučajnost proizvesti vrijednost naše testne statistike pod pretpostavkom da je nulta hipoteza istinita. Općenito pravilo je da što je manja p-vrijednost, to je veći dokaz protiv ništavne hipoteze.
- Izvući zaključak. Na kraju koristimo vrijednost alfa koja je već odabrana kao vrijednost praga. Pravilo odluke je da ako je p-vrijednost manja ili jednaka alfa, tada odbacujemo nultu hipotezu. Inače mi ne uspije odbiti nulta hipoteza.
Sada kada smo vidjeli okvir za test hipoteze, vidjet ćemo specifičnosti testa hipoteze za razliku dviju proporcija populacije.
Uvjeti
Test hipoteze za razliku dva udjela populacije zahtijeva ispunjavanje sljedećih uvjeta:
- Imamo dvije jednostavni slučajni uzorci od velike populacije. Ovdje "velika" znači da je populacija najmanje 20 puta veća od veličine uzorka. Veličine uzorka će biti označene sa n1 i n2.
- Osobe iz naših uzoraka odabrane su neovisno jedna o drugoj. Sama populacija također mora biti neovisna.
- U oba naša uzorka postoji barem 10 uspjeha i 10 neuspjeha.
Sve dok su ovi uvjeti zadovoljeni, možemo nastaviti s testom hipoteza.
Nulta i alternativna hipoteza
Sada moramo razmotriti hipoteze za naš test važnosti. Nulta hipoteza je naša izjava bez učinka. U ovom testu određenih vrsta hipoteza naša je ništavna hipoteza da nema razlike između dvije proporcije stanovništva. To možemo napisati kao H0: p1 = p2.
Alternativna hipoteza jedna je od tri mogućnosti, ovisno o specifičnostima onoga na što testiramo:
- H: p1 je veća od p2. Ovo je jednostrani ili jednostrani test.
- H: p1 je manje od p2. Ovo je ujedno i jednostrani test.
- H: p1 nije jednak p2. Ovo je dvokraki ili dvostrani test.
Kao i uvijek, kako bismo bili oprezni, trebali bismo upotrijebiti dvostranu alternativnu hipotezu ako nemamo smjer prije nego što dobijemo naš uzorak. Razlog za to je to što je ništavnu hipotezu teže odbiti dvostranim testom.
Tri hipoteze mogu se prepisati navodeći kako p1 - p2 vezan je za nulu vrijednosti. Da budemo precizniji, nulta hipoteza bi postala H0:p1 - p2 = 0. Potencijalne alternativne hipoteze napisale bi se kao:
- H: p1 - p2 > 0 je ekvivalent izrazu "p1 je veća od p2."
- H: p1 - p2 <0 je ekvivalent izjava "p1 je manje od p2."
- H: p1 - p2 ≠ 0 je ekvivalent izjava „p1 nije jednak p2."
Ova ekvivalentna formulacija zapravo nam pokazuje malo više onoga što se događa iza kulisa. Ono što radimo u ovom testu hipoteze je okretanje dva parametra p1 i p2 u jedinstveni parametar p1 - p2. Tada testiramo ovaj novi parametar na vrijednosti nula.
Statistika testa
Formula za test test je data na gornjoj slici. Objašnjenje svakog od uvjeta slijedi:
- Uzorak iz prve populacije ima veličinu n1. Broj uspjeha ovog uzorka (što se izravno ne vidi u gornjoj formuli) je k1.
- Uzorak iz druge populacije ima veličinu n2. Broj uspjeha iz ovog uzorka je k2.
- Udio uzoraka je str1-šešir = k1 / n1 i str2-što = k2 / n2 .
- Zatim kombiniramo ili objedinimo uspjehe iz oba ova uzorka i dobijemo: p-šešir = (k1 + k2) / (n1 + n2).
Kao i uvijek, budite pažljivi s redoslijedom operacija prilikom izračuna. Prije uzimanja kvadratnog korijena mora se izračunati sve ispod radikala.
P-vrijednost
Sljedeći je korak izračunavanje p-vrijednosti koja odgovara našoj testnoj statistici. Mi koristimo standardnu normalnu distribuciju za našu statistiku i savjetujemo tablicu vrijednosti ili koristimo statistički softver.
Pojedinosti našeg izračuna vrijednosti p ovise o alternativnoj hipotezi koju koristimo:
- Za H: p1 - p2 > 0, izračunavamo udio normalne raspodjele koji je veći od Z.
- Za H: p1 - p2 <0, izračunavamo udio normalne raspodjele koji je manji od Z.
- Za H: p1 - p2 ≠ 0, izračunavamo udio normalne raspodjele koji je veći od |Z|, apsolutna vrijednost Z. Nakon toga, kako bismo uzeli u obzir činjenicu da imamo test s dvije točke, udvostručujemo udio.
Pravilo odluke
Sada donosimo odluku hoćemo li odbaciti ništavnu hipotezu (i time prihvatiti alternativu) ili ne uspjeti odbaciti ništavnu hipotezu. Ovu odluku donosimo uspoređujući našu p-vrijednost sa alfa značajkom.
- Ako je p-vrijednost manja ili jednaka alfa, tada odbacujemo nultu hipotezu. To znači da imamo statistički značajan rezultat i da ćemo prihvatiti alternativnu hipotezu.
- Ako je p-vrijednost veća od alfa, tada ne uspijevamo odbaciti ništavnu hipotezu. To ne dokazuje da je nulta hipoteza istinita. Umjesto toga, to znači da nismo dobili dovoljno uvjerljivih dokaza da odbacimo ništavnu hipotezu.
Posebna napomena
interval pouzdanosti za razliku od dva udjela stanovništva ne objedinjuje uspjehe, dok test hipoteze. Razlog za to je što naša ništavna hipoteza pretpostavlja to p1 - p2 = 0. Interval pouzdanosti to ne pretpostavlja. Neki statističari ne objedinjuju uspjehe ovog testa hipoteza, pa umjesto toga koriste malo izmijenjenu verziju gornjeg statističkog testa.