Nagib regresijske linije i koeficijent korelacije

Mnogo puta u studiji o statistika važno je povezati različite teme. Vidjet ćemo primjer toga u kojem je nagib regresijske linije izravno povezan s koeficijent korelacije. Budući da oba koncepta uključuju ravne linije, prirodno je postaviti pitanje: "Koliki su koeficijent korelacije i najmanje kvadratna linija odnose?”

Prvo ćemo se pozabaviti nekim pozadinama vezanim za obje ove teme.

Pojedinosti o korelaciji

Važno je zapamtiti detalje koji se odnose na koeficijent korelacije, koji je označen sa r. Ova statistika koristi se kada smo upalili kvantitativni podaci. Iz rasipane mreže upareni podaci, možemo tražiti trendove u ukupnoj distribuciji podataka. Neki upareni podaci pokazuju linearni ili ravni oblik. Ali u praksi podaci nikada ne padaju točno ravno.

Nekoliko ljudi gleda isto scatterplot uparenih podataka ne bi se složilo u tome koliko je blizu prikazivanju sveukupnog linearnog trenda. Napokon, naši kriteriji za to mogu biti pomalo subjektivni. Ljestvica koju koristimo također može utjecati na našu percepciju podataka. Iz tih razloga i više trebamo neku vrstu objektivne mjere kako bismo otkrili koliko su naši upareni podaci linearni. Koeficijent korelacije to postiže za nas.

instagram viewer

Nekoliko osnovnih činjenica o r uključuju:

  • Vrijednost r se kreće između bilo kojeg stvarnog broja od -1 do 1.
  • Vrijednosti od r blizu 0 znači da postoji malo ili ne postoji linearni odnos između podataka.
  • Vrijednosti od r blizu 1 znači da postoji pozitivan linearni odnos između podataka. To znači da kao x povećava to y također se povećava.
  • Vrijednosti od r blizu -1 implicira da postoji negativan linearni odnos između podataka. To znači da kao x povećava to y smanjuje.

Nagib linije najmanje kvadrata

Zadnje dvije stavke na gornjem popisu usmjeravaju nas prema nagibu linije najmanjeg kvadrata koji najbolje odgovara. Podsjetimo da je nagib crte mjera koliko jedinica ide gore ili dolje za svaku jedinicu koju pomičemo udesno. Ponekad se to navodi kao porast linije podijeljene s trčanjem ili promjena u y vrijednosti podijeljene s promjenom u x vrijednosti.

Općenito, ravne linije imaju nagibe koji su pozitivni, negativni ili nula. Ako bismo pregledali naše regresijske linije najmanje kvadrata i usporedili odgovarajuće vrijednosti r, primijetili bismo da svaki put kada naši podaci imaju koeficijent negativne korelacije, nagib regresijske linije je negativan. Slično tome, za svaki put kada imamo koeficijent pozitivne korelacije, nagib regresijske linije je pozitivan.

Iz ovog promatranja treba biti vidljivo da definitivno postoji veza između znaka koeficijenta korelacije i nagiba linije najmanjeg kvadrata. Ostaje nam objasniti zašto je to istina.

Formula za nagib

Razlog za vezu između vrijednosti r a nagib linije najmanjeg kvadrata ima veze s formulom koja nam daje nagib ove crte. Za uparene podatke (x, y) označavamo standardno odstupanje od x podatke po ax i standardno odstupanje od y podatke po ay.

Formula za nagib linije regresije su:

  • a = r (sy/ sx)

Izračun standardnog odstupanja uključuje uzimanje pozitivnog kvadratnog korijena nenegativnog broja. Zbog toga oba standardna odstupanja u formuli za nagib moraju biti nenegativna. Ako pretpostavimo da u našim podacima postoji određena varijacija, moći ćemo zanemariti mogućnost da bilo koji od ovih standardnih odstupanja bude nula. Stoga će znak koeficijenta korelacije biti isti kao i znak nagiba regresijske crte.

instagram story viewer