Kako procijeniti standardna odstupanja (SD)

Standardno odstupanje i raspon su obje mjere širenje skupa podataka. Svaki broj govori nam na svoj način koliko su podaci raspoređeni, jer su oboje mjerilo varijacije. Iako nema eksplicitne veze između raspon i standardno odstupanje, tamo je pravilo palca što može biti korisno za povezivanje ove dvije statistike. Taj se odnos ponekad naziva i pravilo raspona za standardno odstupanje.

Pravilo raspona govori nam da je standardno odstupanje uzorka približno jednako četvrtini raspona podataka. Drugim riječimaa = (Maksimum - minimum) / 4. Ovo je vrlo jednostavna formula za upotrebu i treba je koristiti samo kao vrlo grubu procjena standardnog odstupanja.

Primjer

Da bismo vidjeli primjer funkcioniranja pravila raspona, pogledat ćemo sljedeći primjer. Pretpostavimo da započnemo s podacima podataka 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Te vrijednosti imaju a srednja od 17 i standardno odstupanje od oko 4.1. Ako umjesto toga prvo izračunamo raspon naših podataka kao 25 ​​- 12 = 13, a zatim podijelimo ovaj broj sa četiri, naša je standardna devijacija procijenjena kao 13/4 = 3,25. Ovaj je broj relativno blizu stvarnom standardnom odstupanju i dobar je za grubu procjenu.

instagram viewer

Zašto djeluje?

Može se činiti da je pravilo raspona pomalo čudno. Zašto djeluje? Ne čini li se potpuno proizvoljno samo rasporediti raspon četiri? Zašto se ne bismo podijelili s različitim brojem? Zapravo se događa neko matematičko opravdanje iza kulisa.

Podsjetimo na svojstva krivulja zvona a vjerojatnosti iz a standardna normalna distribucija. Jedna značajka ima veze s količinom podataka koja spada u određeni broj standardnih odstupanja:

  • Otprilike 68% podataka nalazi se unutar jednog standardnog odstupanja (veće ili niže) od srednje vrijednosti.
  • Otprilike 95% podataka nalazi se unutar dva standardna odstupanja (veće ili niže) od srednje vrijednosti.
  • Otprilike 99% nalazi se unutar tri standardna odstupanja (veća ili niža) od srednje vrijednosti.

Broj koji ćemo koristiti ima veze s 95%. Možemo reći da 95% naših dvaju standardnih odstupanja ispod srednje vrijednosti do dva standardna odstupanja iznad srednje vrijednosti imamo 95% naših podataka. Stoga bi se gotovo sva naša normalna distribucija protezala na linijskom liniji koja je dugačka ukupno četiri standardna odstupanja.

Nisu svi podaci normalno distribuirani i u obliku krivulje zvona. No većina podataka dovoljno je dobro raspoložena da odlazak dva standardna odstupanja od srednje vrijednosti obuhvaća gotovo sve podatke. Procjenjujemo i kažemo da su četiri standardna odstupanja otprilike veličina raspona, pa je raspon podijeljen sa četiri gruba aproksimacija standardnog odstupanja.

Koristi za pravilo raspona

Pravilo raspona korisno je u mnogim postavkama. Prvo, vrlo je brza procjena standardnog odstupanja. Standardno odstupanje zahtijeva da prvo pronađemo sredinu, a zatim oduzmemo ovu sredinu iz svake podatkovne točke, kvadrata razlike, zbrojite ih, podijelite za jedan manji od broja podataka, a zatim (konačno) uzmite kvadrat korijen. S druge strane, pravilo raspona zahtijeva samo jedno oduzimanje i jedno dijeljenje.

Ostala mjesta na kojima je korisno pravilo raspona jesu kada imamo nepotpune podatke. Formule poput one za određivanje veličine uzorka zahtijevaju tri informacije: željene margina pogreške, the nivo samopouzdanja i standardnu ​​devijaciju stanovništva koju istražujemo. Mnogo je puta nemoguće znati što je stanovništvo standardno odstupanje je. Pomoću pravila raspona možemo procijeniti ovu statistiku, a zatim znati koliko bismo trebali napraviti naš uzorak.