Evo kako napraviti Boxplot

Boxplots svoje ime dobivaju po onome na što nalikuju. Ponekad ih nazivaju zapletima kutija i šapica. Ove vrste grafova koriste se za prikaz raspona, srednjai kvartili. Kada su gotove, okvir sadrži karticu prvi i treći kvartil. Šapat se proteže od okvira do minimalnih i maksimalnih vrijednosti podataka.

Na sljedećim će se stranicama pokazati kako napraviti okvir za skup podataka s najmanje 20, prvi kvartil 25, srednji 32, treći kvartil 35 i maksimalni 43.

Nacrtajte pet vertikalnih linija iznad brojčane crte, po jednu za svaku od vrijednosti minimalne, prvi kvartil, srednja, treća četvrtina i maksimum. Linije za minimum i maksimum obično su kraće od linija za kvartile i medijan.

Za naše podatke minimalno je 20, prvi kvartil je 25, srednji je 32, treći kvartil je 35, a maksimalan 43. Crte koje odgovaraju tim vrijednostima su izvučene gore.

Zatim nacrtamo okvir i koristimo neke od crta koje će nas voditi. Prvi kvartil je lijeva strana naše kutije. Treći kvartil je desna strana naše kutije. Medijan pada bilo gdje unutar okvira.

instagram viewer

Prema definiciji prvog i trećeg kvartila, polovica svih vrijednosti podataka nalazi se u okviru.

Sada vidimo kako graf kutija i brkova dobiva drugi dio svog imena. Čaplji se crtaju kako bi demonstrirali raspon podataka. Nacrtajte vodoravnu crtu od crte najmanje za lijevu stranu okvira u prvom kvartilu. Ovo je jedan od naših brkova. Nacrtajte drugu vodoravnu liniju s desne strane okvira na trećem kvartilu do crte koja predstavlja maksimum podataka. Ovo nam je drugi šapat.

Naš grafikon s kutijama i šapama, ili boxplotom, sada je gotov. Na prvi pogled možemo utvrditi raspon vrijednosti podataka i stupanj skupa podataka. Sljedeći korak pokazuje kako možemo usporediti i usporediti dva boxplota.

Grafovi na okvirima i naličjima prikazuju sažetak od pet brojeva skupa podataka. Dva različita skupa podataka mogu se stoga usporediti ako se zajedno ispituju njihove okvirne kutije. Iznad druge kutije je nacrtano iznad onoga koji smo izgradili.

Postoji nekoliko značajki koje se zaslužuju spomenuti. Prvi je da su medijani oba skupa podataka identični. Okomita crta unutar oba okvira nalazi se na istom mjestu na brojčanoj liniji. Drugo što treba napomenuti o grafovima s dva kutija i šapama jest da gornja ploha nije tako raširena na donjoj. Gornja kutija je manja, a viski se ne pružaju tako daleko.

Izvlačenjem dviju razglednica iznad iste brojčane pretpostavke pretpostavlja se da podaci iza svake zaslužuju usporedbu. Ne bi imalo smisla uspoređivati ​​okvir s visinama trećih razreda i utezima pasa u lokalnom prihvatilištu. Iako obje sadrže podatke u omjeru razina mjerenja, nema razloga za usporedbu podataka.

S druge strane, imalo bi smisla usporediti okvirne visine visina trećih razreda ako je jedna parcela predstavljao je podatke dječaka u školi, a drugi zaplet predstavljao je podatke djevojčica u škola.