Inferencijalna statistika dobiva svoje ime po onome što se događa u ovoj grani statistike. Umjesto da samo opišu skup podataka, inferencijalna statistika nastoji zaključiti nešto o populaciji na temelju broja statistički uzorak. Jedan specifičan cilj inferencijalne statistike uključuje utvrđivanje vrijednosti nepoznate populacije parametar. Raspon vrijednosti koje koristimo za procjenu ovog parametra naziva se interval pouzdanosti.
Oblik intervala povjerenja
Interval pouzdanosti sastoji se od dva dijela. Prvi dio je procjena parametra stanovništva. Ovu procjenu dobivamo korištenjem a jednostavan slučajni uzorak. Iz ovog uzorka izračunavamo statistiku koja odgovara parametru koji želimo procijeniti. Na primjer, da nas je zanimala prosječna visina svih učenika prvih razreda u Sjedinjenim Državama koristite jednostavan slučajni uzorak američkih prvorazrednih greda, izmjerite ih i zatim izračunajte srednju našu visinu uzorak.
Drugi dio intervala pouzdanosti je granica pogreške. To je nužno jer se i naša procjena može razlikovati od stvarne vrijednosti populacijskog parametra. Da bismo omogućili ostale potencijalne vrijednosti parametra, moramo proizvesti raspon brojeva. Granica pogreške čini to i svaki interval povjerenja ima sljedeći oblik:
Procijenite ± margina pogreške
Procjena je u središtu intervala, a zatim oduzimamo i dodajemo marginu pogreške u ovoj procjeni kako bismo dobili raspon vrijednosti za parametar.
Razina povjerenja
U prilogu svakog intervala pouzdanosti nalazi se razina pouzdanosti. To je vjerojatnost ili postotak koji ukazuje na to koliko izvjesnosti trebamo pripisati našem intervalu povjerenja. Ako su svi drugi aspekti neke situacije identični, to je razina pouzdanosti veća.
Ova razina samopouzdanja može dovesti do neke zbrke. To nije izjava o postupku uzorkovanja ili populaciji. Umjesto toga, daje naznaku uspješnosti procesa izgradnje intervala pouzdanosti. Primjerice, intervali pouzdanosti s 80 posto, dugoročno će propustiti istinski parametar populacije jedan od svakih pet puta.
Bilo koji broj od nule do jedan, u teoriji, može se upotrijebiti za razinu pouzdanosti. U praksi su 90, 95 i 99 posto sve razine zajedničkog povjerenja.
Pogreška
Granicu pogreške razine pouzdanosti određuje nekoliko čimbenika. To možemo vidjeti ispitivanjem formule za ograničenje pogreške. Pogreška je oblika:
Margin of Error = (Statistika za razinu povjerenja) * (Standardno odstupanje / Pogreška)
Statistika za razinu povjerenja ovisi o tome što raspodjela vjerojatnosti se koristi i kakvu smo razinu samopouzdanja odabrali. Na primjer, ako Cje naša razina samopouzdanja i surađujemo sa normalna distribucija, onda C je područje ispod krivulje između -z* do z*. Ovaj broj z* je broj u našoj formuli pogreške.
Standardno odstupanje ili standardna greška
Drugi termin potreban u našoj granici pogreške je standardno odstupanje ili standardna pogreška. Ovdje se preferira standardno odstupanje distribucije s kojom radimo. Međutim, tipično parametri iz populacije nisu poznati. Taj broj obično nije dostupan pri formiranju intervala pouzdanosti u praksi.
Da bi se riješili ove nesigurnosti u poznavanju standardnog odstupanja, umjesto toga koristimo standardnu pogrešku. Standardna pogreška koja odgovara standardnom odstupanju je procjena ovog standardnog odstupanja. Ono što standardnu pogrešku čini tako moćnom je da se ona izračunava iz jednostavnog slučajnog uzorka koji se koristi za izračunavanje naše procjene. Nisu potrebne dodatne informacije jer uzorak čini sve procjene za nas.
Različiti intervali povjerenja
Postoje različite situacije koje zahtijevaju intervale povjerenja. Ovi intervali pouzdanosti koriste se za procjenu velikog broja različitih parametara. Iako su ti aspekti različiti, svi su navedeni intervali pouzdanja objedinjeni istim ukupnim formatom. Neki zajednički intervali povjerenja su oni za populacijsku sredinu, varijancu stanovništva, udio stanovništva, razliku dvaju populacijskih sredstava i razliku dvaju udjela stanovništva.