Jedna značajka skupa podataka koja je važna za utvrđivanje je da li sadrži neke izdatke. U našem se nizu podataka intuitivno smatra vrijednostima koje se uvelike razlikuju od većine ostalih podataka. Naravno, ovo je razumijevanje odmetnika dvosmisleno. Da bi se vrijednost smatrala vanjskim, koliko vrijednost treba odstupati od ostalih podataka? Je li ono što jedan istraživač naziva odmetnikom koji će se podudarati s tuđim? Da bismo osigurali neku dosljednost i kvantitativnu mjeru za određivanje odmica, koristimo unutarnju i vanjsku ogradu.
Da bismo pronašli unutarnju i vanjsku ogradu niza podataka, prvo nam treba nekoliko drugih opisne statistike. Započet ćemo s izračunavanjem kvartila. To će dovesti do interkvartilnog raspona. Napokon, s ovim proračunima koji su iza nas, moći ćemo utvrditi unutarnju i vanjsku ogradu.
kvartili
prvi i treći kvartil dio su sažetak pet brojeva bilo kojeg skupa kvantitativnih podataka. Započinjemo pronalaženjem srednjeg ili srednjeg mjesta podataka nakon što su sve vrijednosti navedene u uzlaznom redoslijedu. Vrijednosti manje od medijana koje odgovaraju otprilike polovini podataka. Nalazimo medijanu ove polovine skupa podataka i ovo je prvi kvartil.
Na sličan način sada razmotrimo gornju polovicu skupa podataka. Ako za ovu polovicu podataka pronađemo medijan, imamo treći kvartil. Ti kvartili dobivaju svoje ime po tome što su podijelili skup podataka u četiri jednaka dijela ili četvrtine. Drugim riječima, otprilike 25% svih vrijednosti podataka manje je od prvog kvartila. Na sličan način otprilike 75% vrijednosti podataka manje je od trećeg kvartila.
Interkvartilni Raspon
Sljedeće moramo pronaći interkvartilni Raspon (IQR). To je lakše izračunati nego prvi kvartil q1 i treći kvartil q3. Treba samo uzeti razliku od ova dva kvartila. To nam daje formulu:
IQR = P3 - P1
IQR nam govori koliko je raširena sredina polovine našeg skupa podataka.
Pronađite unutarnje ograde
Sada možemo pronaći unutarnje ograde. Započinjemo s IQR-om i množimo ovaj broj s 1,5. Zatim oduzimamo ovaj broj od prvog kvartila. Ovom broju dodamo i treći kvartil. Ova dva broja tvore našu unutarnju ogradu.
Pronađite vanjske ograde
Za vanjske ograde započinjemo s IQR i taj broj množimo s 3. Zatim oduzmemo ovaj broj od prvog kvartila i dodamo ga u treći kvartil. Ova dva broja su naše vanjske ograde.
Otkrivanje odmetnika
Otkrivanje outlieri sada postaje jednako lako kao i određivanje gdje se podaci nalaze u odnosu na naše unutarnje i vanjske ograde. Ako je pojedinačna vrijednost podataka ekstremnija od bilo koje od naših vanjskih ograda, tada je to vanjski oblik i ponekad se naziva i snažan vanjski oblik. Ako je naša vrijednost podataka između odgovarajuće unutarnje i vanjske ograde, tada je ta vrijednost sumnjivi vanjski ili blagi odbojnik. Vidjet ćemo kako to funkcionira s primjerom u nastavku.
Primjer
Pretpostavimo da smo izračunali prvi i treći kvartil naših podataka i pronašli te vrijednosti na 50 odnosno 60. Interkvartilni raspon IQR = 60 - 50 = 10. Zatim vidimo da je 1,5 x IQR = 15. To znači da su unutarnje ograde na 50 - 15 = 35 i 60 + 15 = 75. To je 1,5 x IQR manje od prvog kvartila i više od trećeg kvartila.
Sada izračunavamo 3 x IQR i vidimo da je to 3 x 10 = 30. Vanjske su ograde 3 x IQR ekstremnije u odnosu na prvi i treći kvartil. To znači da su vanjske ograde 50 - 30 = 20 i 60 + 30 = 90.
Sve vrijednosti podataka koje su manje od 20 ili veće od 90, smatraju se potpunim. Sumnja se da su sve vrijednosti podataka između 29 i 35 ili između 75 i 90 sumnjive.