Primjer intervala pouzdanja za varijantu

Varijansa stanovništva pokazuje kako je raširiti skup podataka. Nažalost, obično je nemoguće točno znati što je ovaj populacijski parametar. Kako bismo nadoknadili naš nedostatak znanja, koristimo temu iz inferencijalne statistike pod nazivom intervali pouzdanosti. Vidjet ćemo primjer kako izračunati interval pouzdanosti za varijancu populacije.

Formula intervala samopouzdanja

Formula za (1 - α) interval pouzdanosti o varijanci populacije. Daje ga sljedeći niz nejednakosti:

[ (n - 1)a2] / B < σ2 < [ (n - 1)a2] / .

Ovdje n je veličina uzorka, a2 varijanca uzorka. Broj je točka distribucije hi-kvadrata sa n -1 stupanj slobode na kojem je točno α / 2 područja ispod krivulje lijevo od . Na sličan način i broj B je točka iste hi-kvadratne distribucije s točno α / 2od područja ispod krivulje desno od B.

Uvodna

Započinjemo s skupom podataka s 10 vrijednosti. Ovaj skup vrijednosti podataka dobiven je jednostavnim slučajnim uzorkom:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Potrebna bi bila neka analiza istraživačkih podataka koja bi pokazala da nema izdataka. Izgradnjom a

instagram viewer
plod stabljike i lišća vidimo da su ti podaci vjerojatno iz distribucije koja se približno normalno distribuira. To znači da možemo nastaviti s pronalaženjem 95% intervala pouzdanosti za varijancu stanovništva.

Varijanta uzorka

Moramo procijeniti varijancu populacije prema varijanci uzorka, označenoj sa a2. Pa počinjemo s izračunavanjem ove statistike. U osnovi smo prosječni zbroj kvadratnih odstupanja od srednje. Međutim, a ne dijeljenje te sume sa n dijelimo ga po n - 1.

Otkrivamo da je vrijednost uzorka 104,2. Pomoću ovoga imamo zbroj kvadratnih odstupanja od srednje vrijednosti koju daje:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Dijelimo ovaj zbroj sa 10 - 1 = 9 da bismo dobili varijansu uzorka od 277.

Chi-Square distribucija

Sada se okrećemo našoj distribuciji hi-kvadrata. Budući da imamo 10 vrijednosti podataka, imamo 9 stupnjevi slobode. Budući da želimo srednjih 95% naše distribucije, potrebno nam je 2,5% u svakom od dva repa. Konzultiramo tablicu ili softver s Chi-kvadratom i vidimo da vrijednosti tablice 2.7004 i 19.023 obuhvaćaju 95% površine distribucije. Ovi brojevi su i B, odnosno.

Sada imamo sve što nam je potrebno i spremni smo sastaviti svoj interval povjerenja. Formula za lijevu krajnju točku je [(n - 1)a2] / B. To znači da je naša lijeva krajnja točka:

(9 x 277) /19.023 = 133

Prava krajnja točka nalazi se zamjenom B s :

(9 x 277) /2.7004 = 923

I tako smo 95% sigurni da odstupanje stanovništva leži između 133 i 923.

Standardno odstupanje stanovništva

Naravno, budući da je standardno odstupanje kvadratni korijen varijancije, ova se metoda može upotrijebiti za konstrukciju intervala pouzdanosti za standardno odstupanje populacije. Sve što bismo trebali učiniti je uzeti četvrtaste korijene krajnjih točaka. Rezultat bi bio 95-postotni interval pouzdanosti za standardno odstupanje.