Statistika i analiza linearne regresije

Linearna regresija je statistička tehnika koja se koristi da bi se saznalo više o odnosu između neovisne (prediktor) varijable i ovisne (kriterijske) varijable. Kada u svojoj analizi imate više nezavisnih varijabli, to se naziva višestrukom linearnom regresijom. Općenito, regresija omogućava istraživaču da postavi opće pitanje "Koji je najbolji prediktor ???"

Na primjer, recimo da smo proučavali uzroke nastanka gojaznost, mjereno indeksom tjelesne mase (BMI). Konkretno, željeli smo vidjeti jesu li sljedeće varijable značajni prediktori ljudskog BMI-ja: broj brze hrane obroci koji se jedu tjedno, broj sati gledanja televizije tjedno, broj minuta provedenih u vježbanju tjedno i roditelji BMI. Linearna regresija bila bi dobra metodologija za ovu analizu.

Jednadžba regresije

Kada provodite regresijsku analizu s jednom neovisnom varijablom, jednadžba regresije je Y = a + b * X gdje je Y ovisna varijabla, X je nezavisna varijabla, a je konstanta (ili presretanje), a b je nagib regresijske linije

instagram viewer
. Na primjer, recimo da je GPA najbolje predvidjeti jednadžbom regresije 1 + 0,02 * IQ. Ako je student imao IQ od 130, tada bi njegov GPA bio 3,6 (1 + 0,02 * 130 = 3,6).

Kada provodite regresijsku analizu u kojoj imate više od jedne nezavisne varijable, regresijska jednadžba je Y = a + b1 * X1 + b2 * X2 +... + * Bp xp. Na primjer, ako bismo htjeli uključiti više varijabli u našu GPA analizu, poput mjera motivacije i samodiscipline, koristili bismo to jednadžba.

R-kvadrat

R-kvadrat, također poznat kao koeficijent odlučnosti, je uobičajena statistika za procjenu uklapanja modela regresijske jednadžbe. Odnosno, koliko su dobre sve vaše neovisne varijable u predviđanju vaše ovisne varijable? Vrijednost R-kvadrata kreće se od 0,0 do 1,0 i može se množiti sa 100 da bi se dobio postotak varijacija objasnio je. Na primjer, povratak na našu GPA regresijsku jednadžbu sa samo jednom neovisnom varijablom (IQ)... Recimo da R-kvadrat za jednadžbu iznosio je 0,4. To bismo mogli protumačiti tako da znači da 40% varijance GPA objašnjava IQ. Ako tome dodamo još dvije naše varijable (motivacija i samodisciplina) i R-kvadrat se povećava na 0.6, to znači da IQ, motivacija i samodisciplina zajedno objašnjavaju 60% varijance GPA rezultate.

Regresijske analize obično se rade statističkim softverom, kao što je SPSS ili SAS, pa se R-kvadrat izračunava za vas.

Tumačenje regresijskih koeficijenata (b)

Koeficijenti b iz gornjih jednadžbi predstavljaju snagu i smjer odnosa između neovisnih i ovisnih varijabli. Ako pogledamo jednadžbu GPA i IQ, 1 + 0,02 * 130 = 3,6, 0,02 je koeficijent regresije za varijablu IQ. To nam govori da je smjer veze pozitivan, tako da kako IQ raste, tako se povećava i GPA. Ako je jednadžba bila 1 - 0,02 * 130 = Y, to bi značilo da je odnos između IQ i GPA negativan.

pretpostavke

Postoji nekoliko pretpostavki o podacima koje treba ispuniti kako bi se provela analiza linearne regresije:

  • linearnost: Pretpostavlja se da je odnos između neovisnih i ovisnih varijabli linearni. Iako se ta pretpostavka nikada ne može u potpunosti potvrditi, gledajući na scatterplot vaših varijabli može vam pomoći u odlučivanju. Ako je prisutna zakrivljenost u odnosu, razmotrite pretvaranje varijabli ili izričito dopuštanje nelinearnih komponenti.
  • Normalnost: Pretpostavlja se da je ostatci vaših varijabli normalno se distribuira. Odnosno, pogreške u predviđanju vrijednosti Y (ovisna varijabla) raspodijeljene su na način koji se približava normalnoj krivulji. Možete pogledati histograma ili normalne vjerojatnostne ploce da provjere raspodjelu vaših varijabli i njihove preostale vrijednosti.
  • neovisnost: Pretpostavlja se da su pogreške u predviđanju vrijednosti Y neovisne jedna o drugoj (nisu u korelaciji).
  • Homoscedasticity: Pretpostavlja se da je varijanca oko regresijske linije jednaka za sve vrijednosti neovisnih varijabli.

Izvor

  • StatSoft: Elektronički udžbenik statistike. (2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.
instagram story viewer