Kako izračunati maržu pogreške

Puno puta političke ankete i druge primjene statistike navode svoje rezultate s razmakom pogreške. Nije neuobičajeno da anketa tvrdi da postoji potpora za pitanje ili kandidata kod određenog postotka ispitanika, plus i minus određenog postotka. To je granica plus i minus koja je granica pogreške. Ali kako se izračunava granica pogreške? Za jednostavan slučajni uzorak dovoljno velike populacije, margina ili greška je zapravo samo ponavljanje veličine uzorka i razine pouzdanosti koja se koristi.

Formula za marginu pogreške

U nastavku ćemo upotrijebiti formulu za granicu pogreške. Planirat ćemo najgori mogući slučaj, u kojem nemamo pojma koja je prava razina podrške pitanja u našoj anketi. Da imamo pojma o ovom broju, možda pomoću podataka prethodnih anketa, završili bismo s manjom razinom pogreške.

Formula koju ćemo koristiti je: E = z_α/2/ (2√ n)

Razina samopouzdanja

Prvi podatak koji nam treba da bismo izračunali granicu pogreške je da odredimo koju razinu povjerenja želimo. Taj broj može biti bilo koji postotak manji od 100%, ali najčešće razine pouzdanja su 90%, 95% i 99%. Od ove tri razine 95% se najčešće koristi.

instagram viewer

Ako oduzmemo razinu pouzdanosti od jedne, tada ćemo dobiti vrijednost alfa, zapisanu kao α, potrebnu za formulu.

Kritična vrijednost

Sljedeći korak u izračunavanju marže ili pogreške je pronalaženje odgovarajuće kritične vrijednosti. To je naznačeno izrazom z_α/2 u gornjoj formuli. Budući da smo pretpostavili jednostavan slučajni uzorak velike populacije, možemo koristiti standardna normalna distribucija od z-scores.

Pretpostavimo da radimo s 95% samopouzdanja. Želimo pogledati gore z-postići z *za koje područje između -z * i z * iznosi 0,95. Iz tablice vidimo da je ta kritična vrijednost 1,96.

Kritičku vrijednost mogli smo pronaći i na sljedeći način. Ako mislimo u smislu α / 2, budući da je α = 1 - 0,95 = 0,05, vidimo da je α / 2 = 0,025. Sada pretražujemo tablicu da bismo pronašli z-posmatrajte područje s 0,025 s desne strane. Završili bismo s istom kritičnom vrijednošću od 1,96.

Druge razine povjerenja će nam dati različite kritične vrijednosti. Što je razina pouzdanosti veća, to će biti i kritična vrijednost. Kritična vrijednost za 90% razinu povjerenja, s odgovarajućom vrijednosti α od 0,10, je 1,64. Kritična vrijednost za 99% razinu povjerenja, s odgovarajućom α vrijednošću od 0,01, iznosi 2,54.

Veličina uzorka

Jedini je drugi broj koji trebamo koristiti formulu za izračun margina pogreške je veličina uzorka, označeno sa n u formuli. Tada uzimamo kvadratni korijen ovog broja.

Zbog lokacije ovog broja u gornjoj formuli to je veći veličina uzorka koje koristimo, to će biti manja granica pogreške. Veliki uzorci su stoga poželjniji od manjih. Međutim, budući da statističko uzorkovanje zahtijeva resurse vremena i novca, postoje ograničenja u kojoj mjeri možemo povećati veličinu uzorka. Prisutnost četvrtastog korijena u formuli znači da će četverostruko uvećanje veličine uzorka biti samo pola pogreške.

Nekoliko primjera

Da bismo smislili formulu, pogledajmo nekoliko primjera.

Koja je granica pogreške za jednostavan slučajni uzorak od 900 ljudi na 95%nivo samopouzdanja?
Korištenjem tablice imamo kritičnu vrijednost 1,96, pa je granica pogreške 1,96 / (2 √ 900 = 0,03267, odnosno oko 3,3%.
Koja je granica pogreške za jednostavan slučajni uzorak od 1600 ljudi uz 95% razinu povjerenja?
Na istoj razini od samouvjerenost kao prvi primjer, povećanje veličine uzorka na 1600 daje nam grešku od 0,0245 ili oko 2,5%.