Primjer automatskog pokretanja statistike

pokretački je snažna statistička tehnika. Posebno je korisno kada uzorak veličina s kojom radimo je mala. U uobičajenim okolnostima, veličine uzorka manjih od 40 ne mogu se rješavati pretpostavkom a normalna distribucija ili a t raspodjela. Bootstrap tehnike prilično dobro rade s uzorcima koji imaju manje od 40 elemenata. Razlog za to je što pokretanje programa uključuje ponovno razmnožavanje. Ovakve tehnike ne podrazumijevaju ništa o tome distribucija naših podataka.

Bootstrapping je postao popularniji kako računalni resursi postaju spremniji. To je zato što se za praktično pokretanje računala mora koristiti računalo. Vidjet ćemo kako to funkcionira u sljedećem primjeru pokretanja programa.

Počinjemo s statistički uzorak iz populacije o kojoj ništa ne znamo. Naš će cilj biti 90% -tni interval pouzdanosti oko srednje vrijednosti uzorka. Iako su za određivanje korištene druge statističke tehnike intervali pouzdanosti pretpostavimo da znamo prosječnu ili standardnu ​​devijaciju naše populacije, pokretanje novih sustava ne zahtijeva ništa drugo nego uzorak.

instagram viewer

U svrhu našeg primjera pretpostavit ćemo da je uzorak 1, 2, 4, 4, 10.

Sada ponovno izvršimo zamjenu iz našeg uzorka kako bismo dobili ono što je poznato kao uzorci za pokretanje. Svaki uzorak za pokretanje sustava će imati veličinu pet, baš kao i naš izvorni uzorak. Budući da nasumično biramo i zatim zamjenjujemo svaku vrijednost, uzorci za pokretanje mogu se razlikovati od izvornog uzorka i jedan od drugog.

Na primjerima, na koje bismo naišli u stvarnom svijetu, napravili bismo to preusmjeravanje stotine, ako ne i tisuće puta. U nastavku, vidjet ćemo primjer 20 uzoraka za pokretanje:

Budući da koristimo bootstrapping za izračun intervala pouzdanosti za prosjek stanovništva, sada izračunavamo sredstva svakog našeg uzorka za pokretanje. Ova sredstva, poredana uzlaznim redoslijedom, su: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Sada dobivamo s našeg popisa uzorak za pokretanje znači interval pouzdanosti. Budući da želimo interval pouzdanosti od 90%, kao krajnje točke intervala koristimo 95. i 5. postotil. Razlog za to je što smo podijelili 100% - 90% = 10% na pola, tako da ćemo imati srednjih 90% svih sredstava uzorka za pokretanje.