Što je distribucija uzorkovanja?

Statističko uzorkovanje koristi se prilično često u statistici. U ovom procesu želimo odrediti nešto o stanovništvu. Budući da su populacije obično velike veličine, formiramo statistički uzorak odabirom podskupina populacije unaprijed određene veličine. Proučavanjem uzorka možemo koristiti inferencijalnu statistiku da bismo utvrdili nešto o populaciji.

Statistički uzorak veličine n uključuje jednu grupu od n pojedinci ili subjekti koje su nasumično izabrani iz populacije. Usko povezan s konceptom statističkog uzorka je raspodjela uzoraka.

Podrijetlo distribucije uzoraka

Distribucija uzorkovanja događa se kada formiramo više njih jednostavan slučajni uzorak iste veličine iz određene populacije. Za ove se uzorke smatra da su međusobno neovisni. Dakle, ako se pojedinac nalazi u jednom uzorku, tada postoji ista vjerojatnost da će biti u sljedećem uzorku.

Izračunamo određenu statistiku za svaki uzorak. Ovo bi mogao biti uzorak srednja, varijanca uzorka ili omjer uzorka. Budući da statistika ovisi o uzorku koji imamo, svaki će uzorak proizvesti različitu vrijednost za statistiku koja nas zanima. Raspon proizvedenih vrijednosti je ono što nam omogućuje distribuciju uzorkovanja.

instagram viewer

Distribucija uzorkovanja za sredstva

Za primjer, razmotrit ćemo distribuciju uzorkovanja za srednju vrijednost. Srednja vrijednost populacije je parametar koji je obično nepoznat. Ako odaberemo uzorak veličine 100, tada se srednja vrijednost ovog uzorka lako izračuna zbrajanjem svih vrijednosti, a zatim dijeljenjem s ukupnim brojem podataka, u ovom slučaju 100. Jedan uzorak veličine 100 može nam dati prosječnu vrijednost 50. Drugi takav uzorak može imati prosjek 49. Drugi 51 i još jedan uzorak mogli bi imati prosjek od 50,5.

Raspodjela ovih uzoraka znači da nam daju uzorkovanje. Željeli bismo razmotriti više od samo četiri uzorka kao što smo učinili gore. S još nekoliko uzoraka znači da bismo imali dobru predstavu o obliku raspodjele uzorka.

Zašto nas briga?

Distribucija uzorkovanja može se činiti poprilično apstraktnom i teorijskom. Međutim, postoje neke vrlo važne posljedice od korištenja istih. Jedna od glavnih prednosti je što eliminiramo varijabilnost koja je prisutna u statistikama.

Na primjer, pretpostavimo da započnemo s populacijom sa srednjom vrijednosti µ i standardnom devijacijom od σ. Standardno odstupanje daje nam mjerenje koliko je raspodijeljena raspodjela. To ćemo usporediti s distribucijom uzorkovanja dobivenom formiranjem jednostavnih slučajnih uzoraka veličine n. Distribucija uzorkovanja srednje vrijednosti i dalje će imati srednju vrijednost μ, ali standardno odstupanje je drugačije. Standardno odstupanje za raspodjelu uzorka postaje σ / √ n.

Stoga imamo sljedeće

Veličina uzorka 4 omogućava nam raspodjelu uzorka sa standardnim odstupanjem od σ / 2.
Veličina uzorka 9 omogućava nam raspodjelu uzorka sa standardnim odstupanjem od σ / 3.
Veličina uzorka od 25 omogućava nam raspodjelu uzorka sa standardnim odstupanjem od σ / 5.
Veličina uzorka od 100 omogućava nam raspodjelu uzorka sa standardnim odstupanjem od σ / 10.

U praksi

U praksi statistike rijetko oblikujemo distribuciju uzoraka. Umjesto toga, obrađujemo statistike izvedene iz jednostavnog slučajnog uzorka veličine n kao da su jedna točka duž odgovarajuće distribucije uzorkovanja. To ponovno naglašava zašto želimo imati relativno velike veličine uzorka. Što je veća veličina uzorka, to ćemo manje varijacije dobiti u svojoj statistici.

Imajte na umu da, osim središta i širine, nismo u mogućnosti ništa reći o obliku naše distribucije uzorkovanja. Ispada da je pod nekim prilično širokim uvjetima Teorem o središnjoj granici može se primijeniti da nam kaže nešto prilično nevjerojatno o obliku distribucije uzorkovanja.