Ponekad je u statistici korisno vidjeti razrađene primjere problema. Ovi primjeri mogu nam pomoći u pronalaženju sličnih problema. U ovom ćemo članku proći postupak vođenja inferencijalne statistike za rezultat koji se odnosi na dva populacijska sredstva. Ne samo da ćemo vidjeti kako voditi a test hipoteze o razlici dvaju populacijskih sredstava, također ćemo konstruirati a interval pouzdanosti za ovu razliku. Metode koje koristimo ponekad se nazivaju dva uzorka t testa i dva uzorka t intervala pouzdanosti.
Izjava o problemu
Pretpostavimo da želimo testirati matematičku sposobnost djece školske dobi. Jedno pitanje koje bismo mogli imati je ako viša razina ocjene ima viši prosjek rezultata ispitivanja.
Jednostavnim slučajnim uzorkom od 27 trećih razreda dobiva se test iz matematike, njihovi odgovori se ocjenjuju, a rezultati imaju prosječnu ocjenu od 75 bodova s ocjenom standardno odstupanje uzorka od 3 boda.
Jednostavni slučajni uzorak od 20 petih razreda dobiva isti matematički test i dobivaju se njihovi odgovori. Srednja ocjena za pete razrede je 84 boda s uzorkom standardnog odstupanja od 5 bodova.
S obzirom na ovaj scenarij postavljamo sljedeća pitanja:
- Da li nam uzorljeni podaci pružaju dokaz da prosječni rezultat ispitivanja populacije svih petih greda premašuje prosječnu ocjenu populacije svih trećih greda?
- Koliki je interval pouzdanosti od 95% za razliku prosječnih rezultata ispitivanja između populacije trećih i petog razreda?
Uvjeti i postupak
Moramo odabrati koji ćemo postupak koristiti. Pri tome moramo biti sigurni i provjeriti jesu li ispunjeni uvjeti za ovaj postupak. Od nas se traži da usporedimo dva populacijska sredstva. Jedna zbirka metoda koja se može koristiti za to je ona za t-postupke s dva uzorka.
Da bismo koristili ove t-postupke za dva uzorka, moramo biti sigurni da slijede sljedeći uvjeti:
- Imamo dva jednostavna slučajna uzorka iz dvije zanimljive populacije.
- Naši jednostavni slučajni uzorci ne čine više od 5% populacije.
- Dva uzorka međusobno su neovisna i ne postoji podudaranje između ispitanika.
- Promjenjiva je normalno distribuirana.
- Srednja vrijednost stanovništva i standardno odstupanje nisu poznati za obje populacije.
Vidimo da je većina tih uvjeta ispunjena. Rečeno nam je da imamo jednostavne slučajne uzorke. Populacije koje proučavamo velike su jer u tim razredima postoje milijuni učenika.
Uvjet koji ne možemo automatski pretpostaviti je ako se rezultati testova normalno raspodijele. Budući da imamo dovoljno veliku veličinu uzorka, robusnost naših t-postupaka ne mora nužno da se varijabla normalno distribuira.
Budući da su uvjeti zadovoljeni, izvršimo nekoliko preliminarnih izračuna.
Standardna pogreška
Standardna pogreška je procjena standardnog odstupanja. Za ovu statistiku dodamo varijancu uzorka uzoraka, a zatim uzmemo kvadratni korijen. To daje formulu:
(a1 2 / n1 + a22 / n2)1/2
Upotrebom gornjih vrijednosti vidimo da je vrijednost standardne pogreške
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Stupnjevi slobode
Konzervativnu aproksimaciju možemo iskoristiti za naše stupnjevi slobode. To može podcijeniti broj stupnjeva slobode, ali to je mnogo lakše izračunati nego koristiti Welchovu formulu. Koristimo manju od dvije veličine uzorka, a nakon toga oduzmemo jednu.
Za naš primjer, manji od dva uzorka je 20. To znači da je broj stupnjeva slobode 20 - 1 = 19.
Ispitivanje hipoteze
Želimo testirati hipotezu da učenici petih razreda imaju prosjek rezultata testa koji je veći od prosjeka rezultata učenika trećih razreda. Neka je μ1 biti srednja ocjena stanovništva svih petih razreda. Slično tome, pustimo μ2 biti srednji rezultat populacije svih trećih razreda.
Hipoteze su sljedeće:
- H0: μ1 - μ2 = 0
- H: μ1 - μ2 > 0
Statistika testa je razlika između uzorka koja se dijeli sa standardnom pogreškom. Budući da koristimo uzorke standardnih odstupanja za procjenu standardnog odstupanja populacije, testna statistika iz t-distribucije.
Vrijednost testne statistike je (84 - 75) /1.2583. To je otprilike 7,15.
Sada utvrđujemo koja je p-vrijednost za ovaj test hipoteze. Promatramo vrijednost testne statistike i gdje se to nalazi na t-distribuciji s 19 stupnjeva slobode. Za ovu distribuciju imamo 4,2 x 10-7 kao naša p-vrijednost. (Jedan način da se to utvrdi je korištenje T.DIST.RT funkcije u Excelu.)
Budući da imamo tako malu p-vrijednost, odbacujemo nultu hipotezu. Zaključak je da je srednja testna ocjena za grede viša od srednje ocjene za treće grede.
Interval pouzdanosti
Budući da smo utvrdili da postoji razlika između srednjih rezultata, sada određujemo interval pouzdanosti za razliku između ta dva sredstva. Već imamo mnogo onoga što trebamo. Interval pouzdanosti za razliku mora imati i procjenu i granicu pogreške.
Procjena razlike dvaju sredstava je jednostavno izračunati. Jednostavno pronalazimo razliku uzoraka. Ta razlika u uzorku znači procjenu razlike u populacijskim sredstvima.
Za naše podatke, razlika u uzorku znači 84 - 75 = 9.
Granicu pogreške je malo teže izračunati. Za to moramo odgovarajuću statistiku pomnožiti sa standardnom pogreškom. Statistiku koja nam je potrebna pronalazimo konzultiranjem tablice ili statističkog softvera.
Opet koristeći konzervativnu aproksimaciju, imamo 19 stupnjeva slobode. Za interval pouzdanosti od 95% vidimo da t* = 2.09. Mogli bismo koristiti T.INV funkcija u Exceluda izračunam ovu vrijednost.
Sada sve sastavimo i vidimo da je naša pogreška 2,09 x 1,2583, što je otprilike 2,63. Interval pouzdanosti je 9 ± 2,63. Interval iznosi od 6,37 do 11,63 boda na testu koji su odabrali učenici petog i trećeg razreda.