Što je kurtoza u statistici?

Raspodjela podataka i distribucije vjerojatnosti nisu svi istog oblika. Neki su asimetrični i iskrivljen lijevo ili desno. Ostale su distribucije s dva vrha i imaju dva vrha. Još jedna značajka koju treba uzeti u obzir kada govorimo o distribuciji je oblik repova distribucije na krajnjoj lijevoj i krajnjoj desnoj strani. Kurtoza je mjera debljine ili jačine repova distribucije. Kurtoza distribucije je u jednoj od tri kategorije klasifikacije:

  • Mesokurtic
  • Leptokurtic
  • Platykurtic

Svaku od tih klasifikacija razmotrit ćemo zauzvrat. Naše ispitivanje ovih kategorija neće biti tako precizno kao što bismo mogli da upotrijebimo tehničku matematičku definiciju kurtoze.

Mesokurtic

Kurtoza se obično mjeri u odnosu na normalna distribucija. Distribucija koja ima repove oblikovane na približno isti način kao i svaka normalna distribucija, a ne samo standardna normalna distribucija, kaže se da je mezokurtičan. Kurtoza mesokurtske raspodjele nije ni visoka ni niska, već se smatra osnovom za ostale dvije klasifikacije.

instagram viewer

osim normalne raspodjele, binomne distribucije za koje p je blizu 1/2, smatraju se mezokurtičkim.

Leptokurtic

Leptokurtska distribucija je ona koja ima kurtozu veću od mezokurtske. Leptokurtske raspodjele ponekad se prepoznaju po vrhovima koji su tanki i visoki. Repovi ovih raspodjela, s desne i lijeve strane, debeli su i teški. Leptokurtske raspodjele nazvane su prefiksom "lepto" što znači "mršav".

Mnogo je primjera leptokurtskih raspodjela. Jedna od najpoznatijih leptokurtskih distribucija je Studentova distribucija.

Platykurtic

Treća klasifikacija kurtoze je platykurtička. Platykurtske distribucije su one koje imaju vitke repove. Mnogo puta imaju vrh niži od mesokurtske distribucije. Naziv ove vrste distribucije potječe od značenja prefiksa "platy" što znači "širok".

svi uniforma raspodjele su platykurtske. Uz sve to diskretna raspodjela vjerojatnosti iz jednog kovanog novca je platykurtska.

Proračun kurtoze

Ove klasifikacije kurtoze još su nekako subjektivne i kvalitativne. Iako možda možemo vidjeti da distribucija ima debljine repove od normalne distribucije, što ako nemamo graf normalne distribucije za usporedbu? Što ako želimo reći da je jedna distribucija leptokurtička od druge?

Da bismo odgovorili na ovakva pitanja, potreban nam je ne samo kvalitativan opis kurtoze, već i kvantitativna mjera. Upotrijebljena formula je μ44 gdje je μ4 je Pearson četvrti trenutak oko srednje a sigma je standardna devijacija.

Prekomjerna kurtoza

Sada kada imamo način izračunati kurtozu, možemo usporediti dobivene vrijednosti umjesto oblika. Otkriva se da u normalnoj distribuciji postoji kurtoza od tri. To sada postaje naša osnova za mezokurske distribucije. Distribucija s kurtozom većom od tri je leptokurtična, a distribucija s kurtozom manjom od tri je platykurtska.

Budući da mesokurtsku distribuciju tretiramo kao osnovu za ostale naše distribucije, možemo oduzeti tri od našeg standardnog izračuna za kurtozu. Formula μ44 - 3 je formula za višak kurtoze. Tada bismo mogli klasificirati distribuciju od njezine suvišne kurtoze:

  • Mezokurtske raspodjele imaju višak kurtoze od nule.
  • Rasprostranjenosti platykurta imaju negativan višak kurtoze.
  • Leptokurtske raspodjele imaju pozitivan višak kurtoze.

Napomena o nazivu

Riječ "kurtoza" čini se neobičnom na prvom ili drugom čitanju. To zapravo ima smisla, ali moramo znati grčki da bismo to prepoznali. Kurtoza potječe od transliteracije grčke riječi kurtos. Ta grčka riječ ima značenje "lučno" ili "ispupčeno", što ga čini prikladnim opisom koncepta poznatog kao kurtoza.