Trčanje test za slučajne sekvence

S obzirom na a slijed podataka, jedno se pitanje možemo zapitati je li slijed nastao slučajnim pojavama ili podaci nisu slučajni. Teško je prepoznati slučajnost, jer je vrlo teško jednostavno pogledati podatke i utvrditi je li slučajno proizveden ili ne. Jedna metoda kojom se može utvrditi je li redoslijed doista dogodio slučajno naziva se testom trčanja.

Test vožnje je test značaja ili test hipoteze. Postupak ovog ispitivanja temelji se na pokretanju ili nizu podataka koji imaju određenu osobinu. Da bismo razumjeli kako funkcionira test trčanja, prvo moramo ispitati koncept trčanja.

Slijed podataka

Započet ćemo pregledom primjera trčanja. Razmotrimo slijedeći niz slučajnih znamenki:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Jedan od načina za klasificiranje ovih znamenki jest njihova podjela na dvije kategorije, bilo paparne (uključujući znamenke 0, 2, 4, 6 i 8) ili neparne (uključujući znamenke 1, 3, 5, 7 i 9). Gledat ćemo redoslijed slučajnih znamenki i označiti parne brojeve kao E, a neparne brojeve kao O:

instagram viewer

E E O E E O O E O E E E E E O E E O O

Izvode se lakše vidjeti ako ovo napišemo tako da svi Os-i budu zajedno, a svi Es-ovi zajedno:

EE O EE OO E O EEEEE O EE OO

Brojimo broj blokova parnih ili neparnih brojeva i vidimo da postoji ukupno deset pokreta za podatke. Četiri vožnje imaju duljinu jedna, pet imaju dvije, a jedna imaju pet

Uvjeti

Sa bilo kojim test značaja, važno je znati koji su uvjeti neophodni za provođenje testa. Za test trčanja moći ćemo svaku vrijednost podataka iz uzorka svrstati u jednu od dvije kategorije. Brojat ćemo ukupni broj pokreta u odnosu na broj broja vrijednosti podataka koji spadaju u svaku kategoriju.

Test će biti a dvostrani test. Razlog za to je taj što premalo trčanja znači da vjerojatno nema dovoljno varijacija i broja pokreta koji bi se dogodili slučajnim postupkom. Previše se pokreće ako se proces prečesto izmjenjuje među kategorijama da bi se slučajno opisao.

Hipoteze i P-vrijednosti

Svaki test značaja ima a nulta i alternativna hipoteza. Za test trčanja, nulta hipoteza je da je niz slučajni niz. Alternativna hipoteza je da redoslijed podataka o uzorku nije slučajan.

Statistički softver može izračunati p-vrijednost što odgovara određenoj statistici ispitivanja. Postoje i tablice koje na određeni broj daju kritične brojeve nivo značajnosti za ukupan broj vožnji.

Izvodi testni primjer

Na sljedećem ćemo primjeru vidjeti kako funkcionira test trčanja. Pretpostavimo da se od zadatka traži da student 16 puta baci novčić i zabilježi redoslijed glave i repova koji su se pojavili. Ako završimo s ovim skupom podataka:

H T H H H T T H H T T H T H T H H

Možemo se zapitati je li učenik zapravo učinio domaću zadaću ili je prevario i napisao niz H i T koji izgledaju nasumično? Testiranje vožnje može nam pomoći. Pretpostavke su ispunjene za pokus trčanja jer se podaci mogu razvrstati u dvije skupine kao glava ili rep. Nastavljamo računajući broj trčanja. Pregrupiranje, vidimo sljedeće:

H T HHH TT H TT H T H T HH

Za naše podatke postoji deset vožnji sa sedam repova su devet glava.

Nulta hipoteza je da su podaci slučajni. Alternativa je da nije slučajna. Za razinu značajnosti alfa jednaku 0,05, vidimo savjetovanjem odgovarajuće tablice da odbacujemo nultu hipotezu kada je broj izvoda manji od 4 ili veći od 16. Budući da u našim podacima postoji deset vožnji, mi ne uspije odbiti nulta hipoteza H0.

Normalna aproksimacija

Testiranje je koristan alat za utvrđivanje je li redoslijed vjerojatno da je slučajni ili ne. Za veliki skup podataka ponekad je moguće koristiti normalnu aproksimaciju. Ova normalna aproksimacija zahtijeva korištenje broja elemenata u svakoj kategoriji i zatim izračunavanje srednje vrijednosti i standardne devijacije odgovarajućeg normalna distribucija.