Kako koristiti analizu klastera u istraživanjima društvenih znanosti

Klaster analiza je statistička tehnika koja se koristi da se utvrdi kako se razne jedinice - poput ljudi, grupa ili društava - mogu grupirati zajedno zbog zajedničkih karakteristika. Poznat i kao grupiranje, to je istraživački alat za analizu podataka koji ima za cilj sortirati različite objekte u grupe na takav način da pripadaju istoj grupi imaju maksimalan stupanj udruživanja, a kada ne pripadaju istoj grupi, stupanj njihove udruženosti je minimalan. Za razliku od nekih drugih statističke tehnike, strukture koje su otkrivene klaster analizom ne trebaju objašnjenja ili interpretacije - ona otkriva strukturu u podacima bez objašnjenja zašto postoje.

Što je klasteriranje?

Klasteriranje postoji u gotovo svakom aspektu našeg svakodnevnog života. Uzmimo, na primjer, predmete u trgovini. Na istim ili obližnjim mjestima uvijek se prikazuju različite vrste predmeta - meso, povrće, soda, žitarice, proizvodi od papira itd. Istraživači često žele učiniti isto s podacima i grupirati predmete ili predmete u klastere koji imaju smisla.

instagram viewer

Da bismo uzeli primjer iz društvenih znanosti, recimo da gledamo zemlje i želimo ih grupirati u skupine na temelju karakteristika kao što su podjela rada, vojne, tehnološke ili obrazovane populacije. Otkrili bismo da Britanija, Japan, Francuska, Njemačka i Sjedinjene Države imaju slične karakteristike i da bi bile zajedno. Uganda, Nikaragva i Pakistan također bi bili svrstani u različiti skup zbog toga što imaju različit skup karakteristika, uključujući nisku razinu bogatstva, jednostavnije podjele rada, relativno nestabilne i nedemokratske političke institucije i niske tehnološke razvoj.

Klasterska analiza obično se koristi u istraživačkoj fazi istraživanja kada istraživača nema unaprijed zamišljene hipoteze. To obično nije jedina korištena statistička metoda, već se provodi u ranim fazama projekta kako bi se pomoglo vođenje ostatka analize. Iz tog razloga ispitivanje značajnosti obično nije ni relevantno niti je prikladno.

Postoji nekoliko različitih vrsta analiza klastera. Dvije najčešće korištene su grupiranje s K-sredstvima i hijerarhijsko grupiranje.

K-znači klasteriranje

K-znači klasteriranje promatra opažanja u podacima kao objekte koji imaju lokacije i udaljenosti jedni od drugih (imajte na umu da udaljenosti korištene u grupiranju često ne predstavljaju prostorne udaljenosti). Objekte dijeli na K međusobno isključive klastere tako da objekti unutar svakog klastera jesu kao što bliže jedni drugima i u isto vrijeme, što dalje od objekata u drugim klasterima. Svaki je skup tada okarakteriziran svojim srednja ili srednja točka.

Hijerarhijsko klasteriranje

Hijerarhijsko grupiranje je način za istodobno istraživanje grupiranja podataka na različitim ljestvicama i udaljenostima. To čini stvaranjem grozda stabla s raznim razinama. Za razliku od K-znači grupiranja, stablo nije jedan skup klastera. Umjesto toga, stablo je hijerarhija na više razina gdje se klasteri na jednoj razini spajaju kao klasteri na sljedećoj višoj razini. Algoritam koji se koristi započinje sa svakim slučajem ili varijablom u zasebnom klasteru, a zatim kombinira klastere sve dok ne ostane samo jedan. To omogućava istraživaču da odluči koja je razina klastera najprikladnija za njegovo istraživanje.

Provođenje klaster analize

Najviše programi za statistiku može provesti analizu klastera. U SPSS odaberite analizirati s izbornika, zatim razvrstati i analiza klastera. U SAS-u proc cluster može se koristiti funkcija.

Ažurirao Nicki Lisa Cole, dr. Sc.