Sekundarna analiza podataka je analiza podataka koje je prikupio netko drugi. U nastavku ćemo pregledati definiciju sekundarnih podataka, kako ih istraživači mogu koristiti te koje su prednosti i nedostatke ove vrste istraživanja.
Ključni koraci: Sekundarna analiza podataka
- Primarni podaci odnose se na podatke koje su istraživači prikupili sami, dok se sekundarni podaci odnose na podatke koje je prikupio netko drugi.
- Sekundarni podaci dostupni su iz različitih izvora, kao što su vlade i istraživačke institucije.
- Iako korištenje sekundarnih podataka može biti ekonomičnije, postojeći skupovi podataka možda neće odgovoriti na sva pitanja istraživača.
Usporedba primarnih i sekundarnih podataka
U istraživanju društvenih znanosti pojmovi primarni podaci i sekundarni podaci uobičajeni su izraz. Primarne podatke prikuplja istraživač ili tim istraživača za specifičnu svrhu ili analizu koja se razmatra. Ovdje istraživački tim osmišljava i razvija istraživački projekt, odlučuje o a tehnika uzorkovanja
, prikuplja podatke dizajnirane za rješavanje određenih pitanja i vrši vlastite analize podataka koje su prikupili. U ovom slučaju su ljudi koji su uključeni u analizu podataka upoznati s dizajnom istraživanja i postupkom prikupljanja podataka.Sekundarna analiza podatakas druge strane je upotreba podataka koji netko drugi je sakupljao u neke druge svrhe. U ovom slučaju, istraživač postavlja pitanja koja se bave analizom skupa podataka za koje nisu bili uključeni u prikupljanje. Podaci nisu prikupljeni kako bi odgovorili na posebna istraživačka pitanja, već su prikupljeni za drugu svrhu. To znači da isti skup podataka može zapravo biti primarni skup podataka za jednog istraživača, a sekundarni skup podataka za drugi.
Korištenje sekundarnih podataka
Nekoliko je važnih stvari koje se moraju poduzeti prije upotrebe sekundarnih podataka u analizi. Kako istraživač nije prikupio podatke, važno im je da se upoznaju sa skupom podataka: kako su podaci prikupljeni, koje su kategorije odgovora za svaku pitanje, treba li primjenjivati utege tijekom analize, treba li uzeti u obzir nakupine ili stratifikaciju, ko je populacija studija i više.
Mnogo je sekundarnih izvora podataka i skupova podataka na raspolaganju za sociološka istraživanjaod kojih su mnoge javne i lako dostupne. Popis stanovništva Sjedinjenih Država, the Opće društveno istraživanje, i Anketa američke zajednice neke su od najčešće korištenih dostupnih sekundarnih skupova podataka.
Prednosti sekundarne analize podataka
Najveća prednost korištenja sekundarnih podataka je ta što mogu biti ekonomičniji. Netko je već prikupio podatke, tako da istraživač ne mora posvetiti novac, vrijeme, energiju i resurse ovoj fazi istraživanja. Ponekad se mora kupiti sekundarni skup podataka, ali trošak je gotovo uvijek niži od troškova prikupljanja sličnog skup podataka od nule, što obično uključuje plaće, putovanja i prijevoz, uredski prostor, opremu i druge režijske troškove troškovi. Uz to, budući da su podaci već prikupljeni i obično se čiste i pohranjuju u elektroničkom obliku, istraživač može provesti većinu svog vremena analiziranje podataka umjesto da se podaci pripreme za analizu.
Druga velika prednost korištenja sekundarnih podataka je širina dostupnih podataka. Savezna vlada provodi brojne studije na širokoj, nacionalnoj ljestvici koje bi pojedini istraživači teško sakupljali. Mnogi od tih skupova podataka su također uzdužni, što znači da su isti podaci prikupljeni od iste populacije tijekom nekoliko različitih vremenskih razdoblja. To omogućava istraživačima da sagledaju trendove i promjene pojava tijekom vremena.
Treća važna prednost korištenja sekundarnih podataka jest ta što postupak prikupljanja podataka često održava razinu stručnosti i profesionalizma koji možda nisu prisutni kod pojedinih istraživača ili malih istraživačkih projekata. Na primjer, prikupljanje podataka za mnoge savezne skupove podataka često provode zaposlenici koji su se specijalizirali u određenim zadacima i ima dugogodišnje iskustvo u tom određenom području i s tim određenim istraživanjem. Mnogi manji istraživački projekti nemaju tu razinu stručnosti, jer mnogo podataka prikupljaju studenti koji rade izvanredno.
Nedostaci sekundarne analize podataka
Glavni nedostatak korištenja sekundarnih podataka je taj što on ne može odgovoriti na posebna istraživačka pitanja ili sadržavati određene podatke koje bi istraživač želio imati. Također nije možda prikupljen u zemljopisnoj regiji ili tijekom željenih godina, ili sa specifičnom populacijom koju istraživač zanima. Na primjer, istraživač koji je zainteresiran za proučavanje adolescenata može otkriti da sekundarni skup podataka uključuje samo mlade odrasle osobe.
Uz to, budući da istraživač nije prikupio podatke, oni nemaju kontrolu nad onim što se nalazi u skupu podataka. Često to može ograničiti analizu ili izmijeniti izvorna pitanja na koja je istraživač želio odgovoriti. Na primjer, istraživač koji proučava sreću i optimizam mogao bi otkriti da sekundarni skup podataka uključuje samo jedan od njih varijable, ali ne i jedno i drugo.
Problem povezan je s tim da su varijable možda bile različito definirani ili kategorizirani nego što bi istraživač odabrao. Na primjer, dob se može prikupiti u kategorijama, a ne kao kontinuirana varijabla, ili se utrka može definirati kao "bijela" i "druga", umjesto da sadrže kategorije za svaku glavnu utrku.
Drugi značajan nedostatak korištenja sekundarnih podataka je taj što istraživač ne zna točno kako je prošao postupak prikupljanja podataka ili koliko je dobro proveden. Istraživač obično nije svjestan informacija o tome koliko su ozbiljno na podatke utjecali problemi poput niske stope odgovora ili nerazumijevanja ispitanika iz određenih anketnih pitanja. Ponekad su te informacije lako dostupne, kao što je slučaj s mnogim federalnim skupovima podataka. Međutim, mnogi drugi sekundarni skupovi podataka nisu popraćeni ovom vrstom informacija i analitičar mora naučiti čitati između redaka kako bi otkrio bilo kakva potencijalna ograničenja podataka.