Puno puta političke ankete i druge primjene statistike navode svoje rezultate s razmakom pogreške. Nije neuobičajeno da anketa tvrdi da postoji potpora za pitanje ili kandidata kod određenog postotka ispitanika, plus i minus određenog postotka. To je granica plus i minus koja je granica pogreške. Ali kako se izračunava granica pogreške? Za jednostavan slučajni uzorak dovoljno velike populacije, margina ili greška je zapravo samo ponavljanje veličine uzorka i razine pouzdanosti koja se koristi.
Formula za marginu pogreške
U nastavku ćemo upotrijebiti formulu za granicu pogreške. Planirat ćemo najgori mogući slučaj, u kojem nemamo pojma koja je prava razina podrške pitanja u našoj anketi. Da imamo pojma o ovom broju, možda pomoću podataka prethodnih anketa, završili bismo s manjom razinom pogreške.
Formula koju ćemo koristiti je: E = zα/2/ (2√ n)
Razina samopouzdanja
Prvi podatak koji nam treba da bismo izračunali granicu pogreške je da odredimo koju razinu povjerenja želimo. Taj broj može biti bilo koji postotak manji od 100%, ali najčešće razine pouzdanja su 90%, 95% i 99%. Od ove tri razine 95% se najčešće koristi.
Ako oduzmemo razinu pouzdanosti od jedne, tada ćemo dobiti vrijednost alfa, zapisanu kao α, potrebnu za formulu.
Kritična vrijednost
Sljedeći korak u izračunavanju marže ili pogreške je pronalaženje odgovarajuće kritične vrijednosti. To je naznačeno izrazom zα/2 u gornjoj formuli. Budući da smo pretpostavili jednostavan slučajni uzorak velike populacije, možemo koristiti standardna normalna distribucija od z-scores.
Pretpostavimo da radimo s 95% samopouzdanja. Želimo pogledati gore z-postići z *za koje područje između -z * i z * iznosi 0,95. Iz tablice vidimo da je ta kritična vrijednost 1,96.
Kritičku vrijednost mogli smo pronaći i na sljedeći način. Ako mislimo u smislu α / 2, budući da je α = 1 - 0,95 = 0,05, vidimo da je α / 2 = 0,025. Sada pretražujemo tablicu da bismo pronašli z-posmatrajte područje s 0,025 s desne strane. Završili bismo s istom kritičnom vrijednošću od 1,96.
Druge razine povjerenja će nam dati različite kritične vrijednosti. Što je razina pouzdanosti veća, to će biti i kritična vrijednost. Kritična vrijednost za 90% razinu povjerenja, s odgovarajućom vrijednosti α od 0,10, je 1,64. Kritična vrijednost za 99% razinu povjerenja, s odgovarajućom α vrijednošću od 0,01, iznosi 2,54.
Veličina uzorka
Jedini je drugi broj koji trebamo koristiti formulu za izračun margina pogreške je veličina uzorka, označeno sa n u formuli. Tada uzimamo kvadratni korijen ovog broja.
Zbog lokacije ovog broja u gornjoj formuli to je veći veličina uzorka koje koristimo, to će biti manja granica pogreške. Veliki uzorci su stoga poželjniji od manjih. Međutim, budući da statističko uzorkovanje zahtijeva resurse vremena i novca, postoje ograničenja u kojoj mjeri možemo povećati veličinu uzorka. Prisutnost četvrtastog korijena u formuli znači da će četverostruko uvećanje veličine uzorka biti samo pola pogreške.
Nekoliko primjera
Da bismo smislili formulu, pogledajmo nekoliko primjera.
- Koja je granica pogreške za jednostavan slučajni uzorak od 900 ljudi na 95%nivo samopouzdanja?
- Korištenjem tablice imamo kritičnu vrijednost 1,96, pa je granica pogreške 1,96 / (2 √ 900 = 0,03267, odnosno oko 3,3%.
- Koja je granica pogreške za jednostavan slučajni uzorak od 1600 ljudi uz 95% razinu povjerenja?
- Na istoj razini od samouvjerenost kao prvi primjer, povećanje veličine uzorka na 1600 daje nam grešku od 0,0245 ili oko 2,5%.