Čebiševa nejednakost u vjerojatnosti

Čebiševa nejednakost kaže da je najmanje 1-1 /K2 podaci iz uzorka moraju biti unutar K standardna odstupanja od srednje vrijednosti (ovdje K je li pozitivan pravi broj veći od jednog).

Bilo koji skup podataka koji se obično distribuira ili je u obliku a krivulja zvona, ima nekoliko značajki. Jedan od njih bavi se širenjem podataka u odnosu na broj standardnih odstupanja od srednje vrijednosti. U normalnoj distribuciji znamo da je 68% podataka jedno standardno odstupanje od srednje vrijednosti, 95% dva standardna odstupanja od srednje vrijednosti, a približno 99% je unutar tri standardna odstupanja od srednje vrijednosti.

Ali ako skup podataka ne bude distribuiran u obliku krivulje zvona, drugačija količina može biti unutar jednog standardnog odstupanja. Čebiševa nejednakost pruža način da se zna u koji dio podataka spada K standardna odstupanja od srednje vrijednosti za bilo koji skup podataka.

Činjenice o nejednakosti

Gore navedenu nejednakost možemo navesti i zamjenom izraza "podaci iz uzorka" s

instagram viewer
raspodjela vjerojatnosti. To je zato što je Čebiševa nejednakost rezultat vjerojatnosti, koja se tada može primijeniti na statistiku.

Važno je napomenuti da je ta nejednakost rezultat koji je matematički dokazan. Nije poput empirijski odnos između srednje i načina, ili the pravilo palca koji povezuje raspon i standardno odstupanje.

Ilustracija nejednakosti

Da bismo ilustrirali nejednakost, razmotrit ćemo je sa nekoliko vrijednosti K:

  • Za K = 2 imamo 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Dakle, nejednakost Chebysheva kaže da najmanje 75% podataka vrijednosti bilo koje distribucije mora biti unutar dva standardna odstupanja od srednje vrijednosti.
  • Za K = 3 imamo 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Dakle, nejednakost Chebysheva kaže da najmanje 89% podataka vrijednosti bilo koje distribucije mora biti unutar tri standardna odstupanja od srednje vrijednosti.
  • Za K = 4 imamo 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Dakle, nejednakost Chebysheva kaže da najmanje 93,75% podataka vrijednosti bilo koje distribucije mora biti unutar dva standardna odstupanja od srednje vrijednosti.

Primjer

Pretpostavimo da smo uzorkovali utege pasa u lokalnom prihvatilištu za životinje i otkrili da naš uzorak ima prosjek od 20 kilograma sa standardnim odstupanjem od 3 kilograma. Upotrebom Čebiševe nejednakosti znamo da najmanje 75% pasa koje smo uzorkovali ima utege koji su dva standardna odstupanja od srednje vrijednosti. Dva puta standardno odstupanje daje nam 2 x 3 = 6. Oduzmite i zbrojite to od prosjeka 20. To nam govori da 75% pasa ima težinu od 14 kilograma do 26 kilograma.

Korištenje nejednakosti

Ako znamo više o distribuciji s kojom radimo, obično možemo jamčiti da je više podataka određeni broj standardnih odstupanja daleko od srednje vrijednosti. Na primjer, ako znamo da imamo normalnu distribuciju, tada su 95% podataka dva standardna odstupanja od srednje vrijednosti. Čebiševa nejednakost kaže da u ovoj situaciji to znamo barem 75% podataka je dva standardna odstupanja od srednje vrijednosti. Kao što vidimo u ovom slučaju, to bi moglo biti puno više od ovih 75%.

Vrijednost nejednakosti je u tome što nam daje "lošiji slučaj" scenarij u kojem je jedino što znamo o našim uzorcima podataka (ili distribuciji vjerojatnosti) srednja i standardno odstupanje. Kad ne znamo ništa više o našim podacima, Čebiševa nejednakost pruža dodatni uvid u raširenost skupa podataka.

Povijest nejednakosti

Nejednakost je dobila ime po ruskom matematičaru Pafnutyju Čebiševu, koji je nejednakost prvi izjavio bez dokaza 1874. godine. Deset godina kasnije nejednakost je dokazao Markov u svom doktoratu. disertacija. Zbog razlika u načinu predstavljanja ruske abecede na engleskom jeziku, Chebyshev je također napisan kao Tchebysheff.

instagram story viewer