Negativna binomna distribucija je a raspodjela vjerojatnosti koji se koristi s diskretnim slučajnim varijablama. Ova vrsta distribucije odnosi se na broj suđenja koje se moraju dogoditi kako bi se postigao unaprijed određeni broj uspjeha. Kao što ćemo vidjeti, negativna binomna distribucija povezana je s binomna raspodjela. Pored toga, ova raspodjela generalizira geometrijsku raspodjelu.
Postavka
Započet ćemo s promatranjem postavke i uvjeta koji dovode do negativne binomne distribucije. Mnogi od ovih uvjeta vrlo su slični binomnim postavkama.
- Imamo eksperiment s Bernoullijem. To znači da svako ispitivanje koje izvodimo ima dobro definiran uspjeh i neuspjeh i da su to jedini rezultati.
- Vjerojatnost uspjeha je konstantna bez obzira koliko puta izvodimo eksperiment. Ovu stalnu vjerojatnost označavamo sa a str.
- Eksperiment se ponavlja za x neovisna suđenja, što znači da ishod jednog ispitivanja nema utjecaja na ishod sljedećeg suđenja.
Ova su tri stanja identična onima u binomnoj distribuciji. Razlika je u tome što binomna slučajna varijabla ima fiksni broj pokusa
br. Jedine vrijednosti x su 0, 1, 2,..., n, pa je ovo konačna raspodjela.Negativna binomna distribucija povezana je s brojem pokusa x to se mora dogoditi dok ne budemo r uspjesi. Broj r je čitav broj koji odaberemo prije nego što počnemo s izvođenjima svojih pokusa. Slučajna varijabla x još uvijek je diskretan. Međutim, sada slučajna varijabla može poprimiti vrijednosti od X = r, r + 1, r + 2,... Ova je slučajna varijabla područno beskonačna, jer bi moglo potrajati proizvoljno dugo vremena prije nego što je dobijemo r uspjesi.
Primjer
Da biste dobili smisao negativne binomne distribucije, vrijedno je razmotriti primjer. Pretpostavimo da bacimo poštenu kovanicu i postavimo pitanje: "Koja je vjerojatnost da u prvoj dobijemo tri glave x coin flips? "To je situacija koja zahtijeva negativnu binomnu raspodjelu.
Kovanice novčića imaju dva moguća ishoda, vjerojatnost uspjeha je konstantna 1/2, a ispitivanja su neovisna jedna o drugoj. Tražimo vjerojatnost dobivanja prve tri glave nakon x kovanica okrene. Stoga moramo novčić baciti najmanje tri puta. Zatim nastavljamo okretati dok se ne pojavi treća glava.
Da bismo izračunali vjerojatnosti povezane s negativnom binomnom raspodjelom, trebaju nam još neke informacije. Moramo znati funkciju mase vjerojatnosti.
Funkcija mase vjerojatnosti
Funkcija mase vjerojatnosti za negativnu binomnu distribuciju može se razviti s malo razmišljanja. Svako suđenje ima vjerojatnost uspjeha str. Budući da postoje samo dva moguća ishoda, to znači da je vjerojatnost neuspjeha konstantna (1 - p ).
ruspjeh se mora dogoditi za xi završno suđenje. Prethodni x - 1 suđenje mora sadržavati točno r - 1 uspjesi. Broj načina na koji se to može dogoditi daje se brojem kombinacija:
C (x - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!].
Pored toga, imamo neovisne događaje, pa ćemo svoje mogućnosti vjerovatno pomnožiti. Spajajući sve to zajedno, dobivamo funkciju mase vjerojatnosti
f(x) = C (x - 1, r -1) pr(1 - p)x - r.
Naziv distribucije
Sada smo u mogućnosti razumjeti zašto ova slučajna varijabla ima negativnu binomnu distribuciju. Gore navedeni broj kombinacija možemo drugačije napisati postavljanjem x - r = k:
(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1)(x + k - 2)... (r + 1) (r) /k! = (-1)k(-r) (- r - 1).. . (- r - (k + 1) / k !.
Ovdje vidimo pojavu negativnog binomnog koeficijenta, koji se koristi kada podignemo binomni izraz (a + b) na negativnu snagu.
srednja
Srednju vrijednost distribucije važno je znati jer je to jedan od načina da se označi središte distribucije. Srednja vrijednost ove vrste slučajnih varijabli dana je očekivanom vrijednošću i jednaka je r / p. To možemo pažljivo dokazati pomoću funkcija generiranja trenutka za ovu distribuciju.
Intuicija nas vodi i prema ovom izrazu. Pretpostavimo da provedemo niz pokusa n1 dok ne dobijemo r uspjesi. I onda to opet radimo, samo ovaj put treba n2 ispitivanja. To nastavljamo iznova i iznova, dok ne budemo imali veliki broj skupina suđenja N = n1 + n2 +... +nk.
Svaki od ovih k suđenja sadrže r uspjeha, i tako ih imamo ukupno kr uspjesi. Ako N je velika, tada bismo očekivali da ćemo otprilike vidjeti np uspjesi. Tako ih izjednačujemo zajedno i imamo kr = Np.
Napravimo neku algebru i to pronađemo N / k = r / p. Frakcija na lijevoj strani ove jednadžbe je prosječni broj ispitivanja potrebnih za svako naše k grupe suđenja. Drugim riječima, ovo je očekivani broj puta za izvođenje eksperimenta, tako da ukupno imamo r uspjesi. To je upravo očekivanje koje želimo pronaći. Vidimo da je to jednaka formuli r / p.
varijacija
Varijanca negativne binomne raspodjele može se izračunati i pomoću funkcije generiranja trenutka. Kada to učinimo, vidimo varijancu ove distribucije danom sljedećom formulom:
r (1 - p)/p2
Funkcija generiranja trenutka
Funkcija generiranja trenutka za ovu vrstu slučajne varijable prilično je složena. Podsjetimo da je funkcija generiranja trenutka definirana kao očekivana vrijednost E [eTX]. Koristeći ovu definiciju s funkcijom mase vjerojatnosti, imamo:
M (t) = E [eTX] = Σ (x - 1)! / [(R - 1)! (x - r)!] ETXpr(1 - p)x - r
Nakon neke algebre to postaje M (t) = (pet)r[1- (1- p) et]-r
Odnos prema drugim distribucijama
Već smo vidjeli kako je negativna binomna raspodjela na mnogo načina slična binomnoj distribuciji. Pored ove veze, negativna binomna raspodjela općenitija je inačica geometrijske distribucije.
Geometrijska slučajna varijabla x broji broj potrebnih ispitivanja prije nego što se dogodi prvi uspjeh. Lako je vidjeti da je to točno negativna binomna distribucija, ali s r jednak jednom.
Postoje i druge formulacije negativne binomne distribucije. Neki udžbenici definiraju x biti broj suđenja do r događaju se kvarovi.
Primjer problema
Pogledati ćemo primjer problema kako bismo vidjeli kako raditi s negativnom binomnom raspodjelom. Pretpostavimo da je košarkaš strijelac sa 80% slobodnih bacanja. Nadalje, pretpostavite da izvođenje jednog slobodnog bacanja ne ovisi o sljedećem. Kolika je vjerojatnost da je za ovog igrača osmi koš napravljen na desetom slobodnom bacanju?
Vidimo da imamo postavku za negativnu binomnu distribuciju. Stalna vjerojatnost uspjeha je 0,8, pa je vjerojatnost neuspjeha 0,2. Želimo odrediti vjerojatnost X = 10 kada je r = 8.
Ove vrijednosti uključujemo u našu funkciju mase vjerojatnosti:
f (10) = C (10 -1, 8 - 1) (0,8)8(0.2)2= 36(0.8)8(0.2)2, što je otprilike 24%.
Tada bismo mogli pitati koliki je prosječni broj izvedenih slobodnih bacanja prije nego što ovaj igrač napravi osam. Budući da je očekivana vrijednost 8 / 0,8 = 10, ovo je broj snimaka.