Što je medijan u statistici?

Ponoćna je emisija najnovijeg hit filma. Ljudi su postrojeni ispred kazališta koji čekaju da uđu. Pretpostavimo da se od vas traži da pronađete središte linije. Kako biste to učinili?

Postoji nekoliko različitih načina rješavanje ovog problema. Na kraju biste morali shvatiti koliko je ljudi na redu, a zatim uzeti polovinu tog broja. Ako je ukupan broj paran, onda bi središte crte bilo između dvije osobe. Ako je neparni ukupni broj, u središtu bi bila jedna osoba.

Možete se pitati: "Kakve veze ima pronalazak središta crte statistika? "Ova ideja pronalaska središta upravo je ono što se koristi prilikom izračunavanja medijane skupa podataka.

Što je medijan?

Medijan je jedan od tri glavna načina pronalaženja prosjeka Statistički podaci. Teže je izračunati od načina rada, ali nije toliko naporno kao izračunavanje srednje vrijednosti. To je centar na gotovo isti način kao i pronalazak središta niza ljudi. Nakon popisa vrijednosti podataka u uzlaznom redoslijedu, medijan je vrijednost podataka s istim brojem vrijednosti podataka iznad i ispod njega.

instagram viewer

Prvi slučaj: neparni broj vrijednosti

Jedanaest baterija testirano je kako bi se vidjelo koliko dugo traju. Njihov životni vijek, u satima, daje se 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Koji je srednji životni vijek? Budući da postoji neparan broj vrijednosti podataka, to odgovara liniji s neparnim brojem ljudi. Sredina će biti srednja vrijednost.

Postoji jedanaest vrijednosti podataka, tako da je šesta u sredini. Stoga je prosječno trajanje baterije šesta vrijednost na ovom popisu, odnosno 105 sati. Imajte na umu da je medijan jedna od vrijednosti podataka.

Slučaj drugi: Parni broj vrijednosti

Dvadeset mačaka su izvagane. Njihove težine u kilogramima daju se 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Kolika je srednja težina mačaka? Budući da postoji paran broj vrijednosti podataka, to odgovara liniji s ujednačenim brojem ljudi. Središte je između dvije srednje vrijednosti.

U ovom slučaju je središte između desete i jedanaeste vrijednosti podataka. Da bismo pronašli medijanu, izračunali smo sredinu ove dvije vrijednosti i dobili (7 + 8) / 2 = 7,5. Ovdje medijan nije jedna od vrijednosti podataka.

Bilo koji drugi slučaj?

Jedine dvije mogućnosti su da imaju paran ili neparan broj podataka. Stoga su gornja dva primjera jedini mogući način izračunavanja medijane. Ili će medijan biti srednja vrijednost, ili će medijan biti srednja vrijednost srednje od dvije srednje vrijednosti. Tipično su skupovi podataka mnogo veći od onih koje smo pogledali gore, ali postupak pronalaženja medijane isti je kao u ova dva primjera.

Učinak odmetnika

Srednja vrijednost i način rada vrlo su osjetljivi na odmetnike. To znači da će prisustvo izvanserijske dramatično utjecati na obje ove mjere centra. Jedna od prednosti medijane je u tome što na nju ne utječe toliko stranac.

Da biste to vidjeli, razmotrite skupove podataka 3, 4, 5, 5, 6. Srednja vrijednost je (3 + 4 + 5 + 5 + 6) / 5 = 4,6, a medijan je 5. Sada zadržite isti skup podataka, ali dodajte vrijednost 100: 3, 4, 5, 5, 6, 100. Jasno da je 100 izvanserijski, jer je puno veći od svih ostalih vrijednosti. Srednja vrijednost novog skupa sada je (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Međutim srednja vrijednost novog seta je 5. iako

Primjena medijane

Zbog onoga što smo vidjeli gore, medijan je preferirana mjera prosjeka kada podaci sadrže izdatke. Kada se izvještavaju o primanjima, tipičan je pristup prijavljivanje srednjeg dohotka. To se događa zato što srednji dohodak iskrivljuje mali broj ljudi s vrlo visokim primanjima (pomislite Bill Gates i Oprah).