Polje statistike podijeljeno je u dva glavna odjela: opisno i inferencijalno. Svaki od ovih segmenata je važan, jer nudi različite tehnike za postizanje različitih ciljeva. Opisna statistika opisuje što se događa u programu a populacija ili skup podataka. Nasuprot tome, referentna statistika omogućuje znanstvenicima da uzmu nalaze iz uzorka iz skupine i generaliziraju ih na većoj populaciji. Dvije vrste statistika imaju neke važne razlike.
Opisne statistike
Deskriptivna statistika je vrsta statistike koja vjerojatno potiče na pamet većine ljudi kad čuju riječ "statistika". Cilj je u ovoj grani statistike opisati. Numeričke mjere koriste se za označavanje značajki skupa podataka. U ovaj dio statistike spada određeni broj stavki, poput:
- prosječanili mjera središta skupa podataka, koja se sastoji od srednje, srednje, modne ili srednje vrijednosti
- Širenje skupa podataka, koje se mogu mjeriti s opseg ili standardno odstupanje
- Ukupni opisi podataka kao što su sažetak pet brojeva
- Mjerenja kao što su asimetrija i Kurtosis
- Istraživanje odnosa i poveznica između uparenih podataka
- Prikaz statističkih rezultata u 2003 grafički oblik
Te su mjere važne i korisne jer omogućuju znanstvenicima da vide uzorke među podacima i na taj način imaju smislenost tih podataka. Opisna statistika može se koristiti samo za opisivanje populacije ili skupa podataka koji se proučavaju: Rezultati se ne mogu generalizirati na bilo koju drugu skupinu ili populaciju.
Vrste opisne statistike
Postoje dvije vrste opisnih statistika koje koriste sociolozi:
Mjere središnje tendencije uhvatiti opće trendove unutar podataka i izračunati se i izraziti kao srednja, srednja i modusna. Sredina kaže znanstvenicima matematički prosjek svih podataka, kao što je prosječna dob u prvom braku; medijan predstavlja sredinu raspodjele podataka, poput dobi koja sjedi u sredini raspona dobi u kojima se ljudi prvi put vjenčaju; i način bi mogao biti najčešća dob u kojoj se ljudi prvi put vjenčaju.
Mjere širenja opisuju kako se podaci distribuiraju i odnose jedni s drugima, uključujući:
- Raspon, cijeli raspon vrijednosti prisutnih u skupu podataka
- Distribucija frekvencije koja definira koliko puta se određena vrijednost pojavljuje unutar skupa podataka
- Kvartili, podskupine formirane unutar skupa podataka kada su sve vrijednosti podijeljene u četiri jednaka dijela u cijelom rasponu
- Srednje apsolutno odstupanje, prosjek koliko svaka vrijednost odstupa od srednje vrijednosti
- varijacija, što ilustrira kolika je razlika u podacima
- Standardno odstupanje, koje ilustrira širenje podataka u odnosu na srednju vrijednost
Mjere širenja često su vizualno prikazane u tablicama, pita i grafikonima i histogramima kako bi se pomoglo razumijevanju trendova unutar podataka.
Inferencijalna statistika
Inferencijalna statistika dobiva se kroz složene matematičke proračune koji omogućuju znanstvenicima zaključivanje trendova o većoj populaciji na temelju ispitivanja uzorka uzetog iz nje. Znanstvenici koriste inferencijalnu statistiku kako bi ispitali odnos između varijabli unutar uzorka a zatim napraviti generalizacije ili predviđanja o tome kako će se te varijable odnositi na veću populacija.
Obično je nemoguće ispitati svakog člana populacije pojedinačno. Tako znanstvenici biraju reprezentativnu podskupinu populacije, koja se naziva statistički uzorak, a iz ove analize oni mogu reći nešto o populaciji iz koje je uzorak došao. Postoje dvije glavne podjele inferencijalne statistike:
- Interval pouzdanosti daje raspon vrijednosti za nepoznati parametar populacije mjerenjem statističkog uzorka. To je izraženo u intervalu i stupnju pouzdanosti da je parametar unutar intervala.
- Testovi od značaja ili testiranje hipoteze gdje znanstvenici iznose tvrdnju o populaciji analizirajući statistički uzorak. U dizajnu, postoji nešto neizvjesnosti u ovom procesu. To se može izraziti na razini značajnosti.
Tehnike koje socijalni znanstvenici koriste da ispitaju odnos između varijabli i tako stvaraju inferencijalne statistike uključuju linearne regresijske analize, logističke regresijske analize, ANOVA, korelacijske analize, modeliranje strukturalnih jednadžbii analiza preživljavanja. Tijekom provođenja istraživanja koristeći inferencijalnu statistiku, znanstvenici provode test važnosti kako bi utvrdili mogu li svoje rezultate generalizirati na većoj populaciji. Uobičajeni testovi značaja uključuju: Hi-kvadrat i t-test. Oni znanstvenicima govore vjerojatnost da su rezultati njihove analize uzorka reprezentativni za cjelokupnu populaciju.
Deskriptivni vs. Inferencijalna statistika
Iako je opisna statistika korisna za učenje stvari poput širenja i središta podataka, ništa se u opisnoj statistici ne može upotrijebiti za generiranje. U opisnoj statistici, mjerenja kao što su srednja i standardna devijacija su navedena kao točni brojevi.
Iako se inferencijalna statistika koristi nekim sličnim izračunima - poput prosječne i standardne devijacije - fokus infekcije je različit. Inferencijalna statistika započinje s uzorkom, a zatim se generalizira na populaciju. Ovaj podatak o populaciji nije naveden kao broj. Umjesto toga, znanstvenici te parametre izražavaju kao raspon potencijalnih brojeva, zajedno sa stupnjem pouzdanosti.