Sažetak statistika kao što je medijan, prvi kvartil i treći kvartil su mjerenja položaja. To je zato što ovi brojevi pokazuju gdje leži određeni udio distribucije podataka. Na primjer, medijan je srednji položaj podataka u ispitivanju. Polovina podataka ima vrijednosti manje od medijana. Slično tome, 25% podataka ima vrijednosti manje od prvog kvartila, a 75% podataka ima vrijednosti manje od trećeg kvartila.
Ovaj se koncept može generalizirati. Jedan od načina da se to postigne je razmatranje percentila. 90. postotak označava točku u kojoj 90% posto podataka ima vrijednosti manje od ovog broja. Općenitije, pth postotil je broj n za koji p% podataka je manje od n.
Kontinuirane slučajne varijable
Iako su statistički podaci o redoslijedu srednjeg, prvog i trećeg kvartila obično se uvode u postavljanje s diskretnim skupom podataka, ove se statistike mogu definirati i za kontinuirani slučajni slučaj promjenjiva. Budući da radimo s kontinuiranom distribucijom, koristimo integral. pth postotil je broj n takav da:
∫-₶nf ( x ) dx = p/100.
Ovdje f ( x ) je funkcija gustoće vjerojatnosti. Na taj način možemo dobiti bilo koji postotak koji želimo za a stalan distribucija.
kvantilima
Daljnja generalizacija je napomenuti da naša statistika narudžbi dijeli raspodjelu s kojom radimo. Medijan dijeli skup podataka na pola, a srednji, odnosno 50. postotak kontinuirane raspodjele, podijeli distribuciju na pola u odnosu na površinu. Prvi kvartil, srednja i treći kvartil podijeli naše podatke u četiri dijela s istim brojem u svakom. Gornji integral možemo upotrijebiti za dobivanje 25., 50. i 75. postotka i podijeliti kontinuiranu raspodjelu na četiri dijela jednake površine.
Taj postupak možemo generalizirati. Pitanje s kojim možemo započeti daje prirodni broj n, kako možemo podijeliti raspodjelu varijable na n komada jednako veličine? To izravno govori o ideji kvantala.
n kvantali za skup podataka nalaze se približno rangiranjem podataka po redoslijedu, a zatim dijeljenje tog poretka kroz n - 1 jednako razmaknute točke na intervalu.
Ako imamo funkciju gustoće vjerojatnosti za kontinuiranu slučajnu varijablu, koristimo gornji integral kako bismo pronašli kvantale. Za n kvantali, želimo:
- Prvi koji imaju 1 /n područja raspodjele s lijeve strane.
- Drugi imati 2 /n područja raspodjele s lijeve strane.
- rth imati r/n područja raspodjele s lijeve strane.
- Zadnji koji ima (n - 1)/n područja raspodjele s lijeve strane.
To vidimo za bilo koji prirodni broj n, the n kvantali odgovaraju 100r/nth postotci, gdje r može biti bilo koji prirodni broj od 1 do n - 1.
Uobičajeni kvantali
Određene vrste kvantila koriste se dovoljno često da imaju određena imena. Ispod je popis ovih:
- 2 kvantil naziva se medijan
- 3 kvantila se nazivaju tercili
- Četiri kvantita nazivamo kvartilima
- Pet kvantila naziva se kvintilima
- 6 kvantila naziva se sekstilom
- 7 kvantila nazivamo septili
- 8 kvantila naziva se oktilima
- 10 kvantila naziva se decilima
- 12 kvantila nazivamo duodecile
- 20 kvantala nazivamo vigintilima
- 100 kvantila naziva se postotilima
- 1000 kvantila naziva se permilles
Naravno, postoje i drugi kvantali osim onih na gore navedenom popisu. Mnogo puta korišteni specifični kvantil odgovara veličini uzorka iz kontinuiranog distribucija.
Uporaba kvantala
Osim što navode položaj skupa podataka, kvantali su korisni i na druge načine. Pretpostavimo da imamo jednostavan slučajni uzorak iz neke populacije, a raspodjela stanovništva nije poznata. Da bismo odredili je li model, kao što je normalna distribucija ili Weibullova distribucija, pogodan za populaciju iz koje smo uzorkovali, možemo pogledati kvantale naših podataka i model.
Usporedbom kvantala iz naših podataka uzoraka s kvantilima određenog raspodjela vjerojatnosti, rezultat je prikupljanje uparenih podataka. Ove podatke crtamo u rasipnoj ploči, poznatoj kao kvantno-kvantni zaplet ili q-q zaplet. Ako je rezultirajući rasipanje otpada približno linearno, tada je model dobro uklopljen u naše podatke.