Prečac formule zbroja kvadrata

click fraud protection

Izračun a uzorak varijanca ili standardno odstupanje obično se navodi kao frakcija. Brojač ovog ulomka uključuje zbroj kvadratnih odstupanja od srednje vrijednosti. U statistici, formula za ovaj ukupni zbroj kvadrata je

Σ (xja - x)2

Ovdje se simbol x̄ odnosi na vrijednost uzorka, a simbol Σ govori da zbrojimo kvadratne razlike (xja - x̄) za sve ja.

Iako ova formula funkcionira za izračune, postoji ekvivalentna formula za prečac koja ne zahtijeva da prvo izračunamo uzorak srednje. Ova je prečačka formula za zbroj kvadrata

Σ (xja2) - (Σ xja)2/n

Ovdje varijabla n odnosi se na broj podataka u našem uzorku.

Primjer standardne formule

Da bismo vidjeli kako funkcionira ova formula prečaca, razmotrit ćemo primjer koji se izračunava pomoću obje formule. Pretpostavimo da je naš uzorak 2, 4, 6, 8. Srednja vrijednost uzorka je (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Sada izračunavamo razliku svake točke podataka sa srednjom vrijednosti 5.

  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3

Sada dijelimo svaki od tih brojeva i zbrajamo ih. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

instagram viewer

Primjer formule prečaca

Sada ćemo koristiti isti skup podataka: 2, 4, 6, 8, s formulom prečaca za određivanje zbroja kvadrata. Svaku točku podataka prvo ucrtamo i zbrajamo: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

Sljedeći je korak zbrajanje svih podataka i taj zbroj je kvadratan: (2 + 4 + 6 + 8)2 = 400. Dijelimo to s brojem podataka da bismo dobili 400/4 = 100.

Sada oduzimamo ovaj broj od 120. To nam daje da je zbroj kvadratnih odstupanja 20. Točno je bio broj koji smo već pronašli iz druge formule.

Kako ovo radi?

Mnogi će ljudi jednostavno prihvatiti formulu po nominalnoj vrijednosti i nemaju pojma zašto ta formula funkcionira. Upotrebom malo algebre možemo vidjeti zašto je ova formula prečaca ekvivalentna standardnom, tradicionalnom načinu izračuna zbroja kvadratnih odstupanja.

Iako u skupu podataka u stvarnom svijetu može biti stotine, ako ne i tisuće vrijednosti, pretpostavit ćemo da postoje samo tri podatkovne vrijednosti: x1, x2, x3. Ono što ovdje vidimo moglo bi se proširiti na skup podataka koji ima tisuće točaka.

Započinjemo primjetom da je (x1 + x2 + x3) = 3 x̄. Izraz Σ (xja - x)2 = (x1 - x)2 + (x2 - x)2 + (x3 - x)2.

Sada koristimo činjenicu iz osnovne algebre da (a + b)2 = a2 + 2ab + b2. To znači da (x1 - x)2 = x12 -2x1 x̄ + x̄2. To radimo za ostala dva izraza našeg sažetka i imamo:

x12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.

To preuređujemo i imamo:

x12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .

Prepisivanjem (x1 + x2 + x3) = 3x̄ gore navedeno postaje:

x12+ x22 + x32 - 3x̄2.

Sad od 3x̄2 = (x1+ x2 + x3)2/ 3, naša formula postaje:

x12+ x22 + x32 - (x1+ x2 + x3)2/3

A ovo je poseban slučaj opće formule koja je gore spomenuta:

Σ (xja2) - (Σ xja)2/n

Je li to doista prečac?

Možda se ne čini kako je ova formula uistinu prečac. Uostalom, u primjeru iznad čini se da postoji isto toliko izračuna. Dio toga ima veze s činjenicom da smo gledali samo veličinu uzorka koja je bila mala.

Kako povećavamo veličinu našeg uzorka, vidimo da formula prečaca smanjuje broj izračuna za oko polovinu. Ne trebamo oduzimati sredinu od svake podatkovne točke, a zatim kvadratiti rezultat. To značajno smanjuje ukupni broj operacija.

instagram story viewer