Interval povjerenja za udio stanovništva

Intervali povjerenja može se koristiti za procjenu nekoliko populacija parametri. Jedna vrsta parametra koja se može procijeniti pomoću inferencijalna statistika je udio stanovništva. Na primjer, možda želimo znati koji je postotak američke populacije koja podržava određeni zakon. Za ovu vrstu pitanja trebamo pronaći interval povjerenja.

U ovom ćemo članku vidjeti kako konstruirati interval pouzdanosti za udio stanovništva i istražiti neke teorije koje stoje iza toga.

Opći okvir

Započinjemo gledanjem velike slike prije nego što uđemo u specifičnosti. Tip intervala povjerenja koji ćemo razmotriti ima sljedeći oblik:

Procijenite +/- marginu pogreške

To znači da postoje dva broja koja ćemo morati odrediti. Ove vrijednosti su procjena za željeni parametar, zajedno s granicom pogreške.

Uvjeti

Prije provođenja bilo kakvog statističkog ispitivanja ili postupka, važno je osigurati da su svi uvjeti ispunjeni. Za interval pouzdanosti za udio stanovništva, moramo osigurati da sljedeće:

  • Imamo jednostavan slučajni uzorak veličine n od velike populacije
  • instagram viewer
  • Naši su pojedinci birani neovisno jedan o drugom.
  • U našem uzorku ima najmanje 15 uspjeha i 15 neuspjeha.

Ako zadnja stavka nije zadovoljena, možda će biti moguće malo prilagoditi uzorak i koristiti a plus četiri intervala pouzdanosti. U nastavku, pretpostavit ćemo da su svi gornji uvjeti ispunjeni.

Uzorak i udio stanovništva

Započinjemo s procjenom našeg udjela u stanovništvu. Baš kao što koristimo uzorak znači za procjenu prosjeka stanovništva, mi koristimo uzorak proporcije za procjenu udjela stanovništva. Udio stanovništva je nepoznat parametar. Uzorak uzoraka je statistika. Ovu statistiku pronalazimo brojenjem broja uspjeha u našem uzorku, a zatim dijeljenjem sa ukupnim brojem pojedinaca u uzorku.

Udio stanovništva označen je sa p i samorazumljivo je. Zabilježavanje proporcije uzorka malo je više uključeno. Označujemo uzorak proporcije kao p̂, a ovaj simbol čitamo kao „p-šešir“, jer izgleda kao slovo p sa šeširom na vrhu.

To postaje prvi dio našeg intervala povjerenja. Procjena p je p̂.

Uzorkovanje distribucije uzoraka

Da bismo odredili formulu ograničenja pogreške, moramo razmišljati o raspodjela uzorka od p̂. Morat ćemo znati srednju vrijednost, standardno odstupanje i određenu distribuciju s kojom radimo.

Distribucija uzorkovanja p̂ binomna je raspodjela s vjerojatnošću uspjeha p i n ispitivanja. Ova vrsta slučajne varijable ima srednju vrijednost p i standardno odstupanje od (p(1 - p)/n)0.5. Postoje dva problema s tim.

Prvi problem je što binomna raspodjela može biti vrlo lukava za rad. Prisutnost tvornica može dovesti do vrlo velikog broja. Ovdje nam pomažu uvjeti. Sve dok su naši uvjeti ispunjeni, možemo procijeniti binomnu distribuciju sa standardnom normalnom raspodjelom.

Drugi je problem što se standardna devijacija p̂ koristi p u svojoj definiciji. Nepoznati parametar populacije procjenjuje se korištenjem istog parametra kao granice pogreške. Ovo kružno obrazloženje je problem koji treba riješiti.

Izlaz iz te zagonetke je zamjena standardnog odstupanja s njegovom standardnom pogreškom. Standardne pogreške temelje se na statistici, a ne na parametrima. Za procjenu standardnog odstupanja koristi se standardna pogreška. Ono što ovu strategiju čini vrijednom je to što više ne trebamo znati vrijednost parametra str.

Formula

Da bismo koristili standardnu ​​pogrešku, zamjenjujemo nepoznati parametar p sa statističkim p̂. Rezultat je sljedeća formula intervala pouzdanosti za udio stanovništva:

p̂ +/- z * (p̂ (1 - p̂) /n)0.5.

Ovdje vrijednost z * određuje naša razina povjerenja C. Za standardnu ​​normalnu distribuciju C postotak standardne normalne raspodjele je između -z * i z *. Uobičajene vrijednosti za z * uključuju 1.645 za 90% povjerenja i 1.96 za 95% povjerenja.

Primjer

Pogledajmo kako ova metoda djeluje na primjeru. Pretpostavimo da želimo s 95% pouzdanosti znati postotak biračkog tijela u županiji koja se identificira kao demokratska. Navodimo jednostavan slučajni uzorak od 100 ljudi u ovoj županiji i otkrivamo da se njih 64 identificiraju kao demokrata.

Vidimo da su svi uvjeti ispunjeni. Procjena našeg udjela u stanovništvu iznosi 64/100 = 0,64. To je vrijednost uzoraka udjela p̂, a ona je sredina našeg intervala pouzdanosti.

Pogreška se sastoji od dva dijela. Prva je z*. Kao što smo rekli, za 95% pouzdanost, vrijednost z* = 1.96.

Drugi dio greške dan je formulom (p̂ (1 - p̂) /n)0.5. Postavili smo p̂ = 0,64 i izračunali = standardna pogreška biti (0,64 (0,36) / 100)0.5 = 0.048.

Pomnožimo ta dva broja zajedno i dobijemo granicu pogreške 0.09408. Krajnji rezultat je:

0.64 +/- 0.09408,

ili to možemo prepisati kao 54.592% do 73.408%. Stoga smo 95% sigurni da je pravi udio demokrata u populaciji negdje u granicama tih postotaka. To znači da će dugoročno naša tehnika i formula obuhvatiti udio stanovništva u 95% vremena.

Srodne ideje

Postoji niz ideja i tema koji su povezani s ovom vrstom intervala povjerenja. Na primjer, mogli bismo provesti test hipoteze koji se odnosi na vrijednost udjela stanovništva. Također bismo mogli usporediti dva udjela iz dvije različite populacije.

instagram story viewer