Razumijevanje kvantala: definicije i upotrebe

click fraud protection

Sažetak statistika kao što je medijan, prvi kvartil i treći kvartil su mjerenja položaja. To je zato što ovi brojevi pokazuju gdje leži određeni udio distribucije podataka. Na primjer, medijan je srednji položaj podataka u ispitivanju. Polovina podataka ima vrijednosti manje od medijana. Slično tome, 25% podataka ima vrijednosti manje od prvog kvartila, a 75% podataka ima vrijednosti manje od trećeg kvartila.

Ovaj se koncept može generalizirati. Jedan od načina da se to postigne je razmatranje percentila. 90. postotak označava točku u kojoj 90% posto podataka ima vrijednosti manje od ovog broja. Općenitije, pth postotil je broj n za koji p% podataka je manje od n.

Kontinuirane slučajne varijable

Iako su statistički podaci o redoslijedu srednjeg, prvog i trećeg kvartila obično se uvode u postavljanje s diskretnim skupom podataka, ove se statistike mogu definirati i za kontinuirani slučajni slučaj promjenjiva. Budući da radimo s kontinuiranom distribucijom, koristimo integral. pth postotil je broj n takav da:

instagram viewer

-₶nf ( x ) dx = p/100.

Ovdje f ( x ) je funkcija gustoće vjerojatnosti. Na taj način možemo dobiti bilo koji postotak koji želimo za a stalan distribucija.

kvantilima

Daljnja generalizacija je napomenuti da naša statistika narudžbi dijeli raspodjelu s kojom radimo. Medijan dijeli skup podataka na pola, a srednji, odnosno 50. postotak kontinuirane raspodjele, podijeli distribuciju na pola u odnosu na površinu. Prvi kvartil, srednja i treći kvartil podijeli naše podatke u četiri dijela s istim brojem u svakom. Gornji integral možemo upotrijebiti za dobivanje 25., 50. i 75. postotka i podijeliti kontinuiranu raspodjelu na četiri dijela jednake površine.

Taj postupak možemo generalizirati. Pitanje s kojim možemo započeti daje prirodni broj n, kako možemo podijeliti raspodjelu varijable na n komada jednako veličine? To izravno govori o ideji kvantala.

n kvantali za skup podataka nalaze se približno rangiranjem podataka po redoslijedu, a zatim dijeljenje tog poretka kroz n - 1 jednako razmaknute točke na intervalu.

Ako imamo funkciju gustoće vjerojatnosti za kontinuiranu slučajnu varijablu, koristimo gornji integral kako bismo pronašli kvantale. Za n kvantali, želimo:

  • Prvi koji imaju 1 /n područja raspodjele s lijeve strane.
  • Drugi imati 2 /n područja raspodjele s lijeve strane.
  • rth imati r/n područja raspodjele s lijeve strane.
  • Zadnji koji ima (n - 1)/n područja raspodjele s lijeve strane.

To vidimo za bilo koji prirodni broj n, the n kvantali odgovaraju 100r/nth postotci, gdje r može biti bilo koji prirodni broj od 1 do n - 1.

Uobičajeni kvantali

Određene vrste kvantila koriste se dovoljno često da imaju određena imena. Ispod je popis ovih:

  • 2 kvantil naziva se medijan
  • 3 kvantila se nazivaju tercili
  • Četiri kvantita nazivamo kvartilima
  • Pet kvantila naziva se kvintilima
  • 6 kvantila naziva se sekstilom
  • 7 kvantila nazivamo septili
  • 8 kvantila naziva se oktilima
  • 10 kvantila naziva se decilima
  • 12 kvantila nazivamo duodecile
  • 20 kvantala nazivamo vigintilima
  • 100 kvantila naziva se postotilima
  • 1000 kvantila naziva se permilles

Naravno, postoje i drugi kvantali osim onih na gore navedenom popisu. Mnogo puta korišteni specifični kvantil odgovara veličini uzorka iz kontinuiranog distribucija.

Uporaba kvantala

Osim što navode položaj skupa podataka, kvantali su korisni i na druge načine. Pretpostavimo da imamo jednostavan slučajni uzorak iz neke populacije, a raspodjela stanovništva nije poznata. Da bismo odredili je li model, kao što je normalna distribucija ili Weibullova distribucija, pogodan za populaciju iz koje smo uzorkovali, možemo pogledati kvantale naših podataka i model.

Usporedbom kvantala iz naših podataka uzoraka s kvantilima određenog raspodjela vjerojatnosti, rezultat je prikupljanje uparenih podataka. Ove podatke crtamo u rasipnoj ploči, poznatoj kao kvantno-kvantni zaplet ili q-q zaplet. Ako je rezultirajući rasipanje otpada približno linearno, tada je model dobro uklopljen u naše podatke.

instagram story viewer