Bio Stat is Tika

6
Distribucija frekvencija Formiranje distribucije frek.: predstavlja prilagodjavanje ispitivane serije statistickim analizama. U skupu sa N elem. svaki element ima niz karakteristika (obelezja)>posmatrana pojava, oznaka X. Obelezja se dela na 1) atributivna, izrazavaju se opisno 2)numericka, izrazavaju se opisno => prekidna (celi broj) I neprekidna (dec.br.) Form.dist.frek. sa prekidnim obelezjima Nesredjenu seriju prvo uredjujemo redjanjem vrednosto ka rastucoj u SREDJENU seriju. Jos preglednije prikazivanje serija je grupisanje podataka gde se za svaku vrednost obelezja upisuje koliko se puta javlja u seriji > UCESTALOST, odnosno dolazi se do 2. osnovnog pojma u statistici > FREKVENCIJA > F i . F i je uvek br. puta koliko se obelezje ponavlja u seriji, Serija svih vrednosti stat.skupa naziva se Distribucija frekvencija. Grafikon dis.frek. kada su obel. prekidna je poligon (linijski gr. u koor.sis. gde vred.ob. nanosimo na x osu a frek. na y osu) Form. dis. frek. sa neprekidnim ob. Prvo se formira KLASNI (grupni) INTERVAL. prvo treba obratiti paznju na sledece a)izbor velicine klasnog intevala b) odredjivanje granice interval c) grupisanje jedinica posmatranja u odgovarajuce klasne intervale Prvo se ranziraju vrednosti, I formira se dist.frek. Ali pre toga se odredi velicina klasnog interval, odnosno razmak izmedju clanova 1. klase. Vrednosti za klasni int. koje su najcesce su 2,5,10,15,20… br. klasa za seriju dus.fr. treba da bude najvise 15 a najmanje 5. Prikaz stat.serije pomocu klas.int. je pregledniji, a najpregledniji je grafik > histogram (u koor.sis. uspravni pravougaonici), visina je Fi. iz histograma se moze dobiti I poligon iste povrsine povezivanjem sredina vrhova pravougaonika. Srednje vrednosti Citav niz vrednosti obelezja koje sadrzi dis. rek. moze se zameniti 1 vrednoscu > srednja vrednost. Sr.vred. je vred. obelezja koja po datim merilima reprezentuje citav

Transcript of Bio Stat is Tika

Page 1: Bio Stat is Tika

Distribucija frekvencija

Formiranje distribucije frek.: predstavlja prilagodjavanje ispitivane serije statistickim analizama. U skupu sa N elem. svaki element ima niz karakteristika (obelezja)>posmatrana pojava, oznaka X.Obelezja se dela na 1) atributivna, izrazavaju se opisno 2)numericka, izrazavaju se opisno => prekidna (celi broj) I neprekidna (dec.br.)

Form.dist.frek. sa prekidnim obelezjima

Nesredjenu seriju prvo uredjujemo redjanjem vrednosto ka rastucoj u SREDJENU seriju. Jos preglednije prikazivanje serija je grupisanje podataka gde se za svaku vrednost obelezja upisuje koliko se puta javlja u seriji > UCESTALOST, odnosno dolazi se do 2. osnovnog pojma u statistici > FREKVENCIJA > Fi . Fi je uvek br. puta koliko se obelezje ponavlja u seriji, Serija svih vrednosti stat.skupa naziva se Distribucija frekvencija.Grafikon dis.frek. kada su obel. prekidna je poligon (linijski gr. u koor.sis. gde vred.ob. nanosimo na x osu a frek. na y osu)

Form. dis. frek. sa neprekidnim ob.

Prvo se formira KLASNI (grupni) INTERVAL. prvo treba obratiti paznju na sledece a)izbor velicine klasnog intevala b) odredjivanje granice interval c) grupisanje jedinica posmatranja u odgovarajuce klasne intervalePrvo se ranziraju vrednosti, I formira se dist.frek. Ali pre toga se odredi velicina klasnog interval, odnosno razmak izmedju clanova 1. klase. Vrednosti za klasni int. koje su najcesce su 2,5,10,15,20… br. klasa za seriju dus.fr. treba da bude najvise 15 a najmanje 5. Prikaz stat.serije pomocu klas.int. je pregledniji, a najpregledniji je grafik > histogram (u koor.sis. uspravni pravougaonici), visina je Fi. iz histograma se moze dobiti I poligon iste povrsine povezivanjem sredina vrhova pravougaonika.

Srednje vrednosti

Citav niz vrednosti obelezja koje sadrzi dis. rek. moze se zameniti 1 vrednoscu > srednja vrednost.Sr.vred. je vred. obelezja koja po datim merilima reprezentuje citav skup I uporedjivanje izmedju skupova. Sred.vred. > Pozicione ( modus Mo I medijana Me) > izracunate (aritmeticka sred. X, geometrijska sed. G, harmonijska sred. H, srednji kvadrat S).Sr.vred. moraju ispuniti par usova a) da se mogu objektivnim racunskim putem izracunati na 1 nacin b) da se njihova vrednost nalazi izmedju min I max vred. serije c) ako su sve vred.ob. jednake onda je I sr.vred. jednaka

Najvise se koristi Aritmeticka sredina (X) zbog svoje jednostavnosti. Za njeno izracunavanje se koriste sve vred.ob. koje uticu na nju. Ako se zameni svaki podatak u seriji sa sred.vr. zbir ostaje nepromenjen. Zbir negativnih odstupanja jednak je zbiru pozitivnih.

Ako se jedna ista vrednost ob. javlja vise puta u seriji, tada se za izracunavanje arit.sr. ukljucuju I frekvencije koje se mnoye sa svakom vrednoscu obelezja I podeli sa zbirom frek. *ponderisana ar.srX=E Fi*Xi/E Fi

Page 2: Bio Stat is Tika

Intervalna serija

Kada je obelezje u vidu interval, arit.sr. se izracunava po obrascu za ponderisanu arit.sr. stim sto se prvo nadje sredina svakog interval I sa tom vrednoscu mnozi frekvencija.501-550, mi=525X=E Fi*mi/E Fi

Harmonijska sredina je reciprocna vred. aritmeticke sredine. Koristi se u sledecim slucajevima: 1)pri izracunavanju sredne kupovne moci valute 2) pri izracunavanju prosecne produktivnosti rada 3) pri izr. prosecnog predjenog puta.

MODUS

Je vrednost obelezja koje ima najvecu frekvenciju. Pri njegovom izracunavanju iz intervalne serije prvo se odredjuje klasa u kojoj se modus nalazi > klasa sa max Fi.Xmo-pocetna vrednost modalne klase

MEDIJANA

Je vrednost obelezja koji deli sredjenu stat. seriju na 2 jednaka dela. Pri njenom izracunavanju iz intervalne serije prvo se odredjuje klasa u kojoj se nalazi medijana. Klasa u kojoj se nalazi je ona klasa koja ima kumulativnu Fi jednaku ili prvu vecu u odnosu na polovinu br. podataka u seriji.Kf-kumulativna frek.E Fi=70 -> Kf=35 ili prvi veci Xme-pocetak klase u kojoj je medijana Si-suma Kf u klasi koja predhodi klasi u kojoj je medijana Pme-frek. klase u kojoj je medijanaKf= Kfn+Fin+1

Mere varijacije

Sluze za potpunije sagledavanje dis.frek. I dele se na: 1) apsolutne – izrazavaju varijabilitet obelezja u aps. iznosima. iskazuju se u onim jedinicama mere u kojima je dato obelezje, zbog toga ove mere var. nisu podesne za poredjenje varijabiliteta vise serija ukoliko su te serije iskazane u razlicitim jedinicama mere. U aps. mere var. ubrajaju se a) interval var. Iv b) interkvartilna razlika Q

c)srednje odstupanje AD d) varijansa [malo beta na kvadrat] e) standardna devijacija [malo beta na kv] [SD]2) Relativne mere var. izrazavaju varijabilitet u %, pa su podesnije za poredjenje var. izmedju serija, dele se na a)koef. var. Cv b) normalizovano odstupanje [Z] [t] Da bi neka mera var. bila dobra, mora da zadovolji: 1) ako se svakom clanu +/- isti iznos mera var. se ne menja 2) ako se svaki clan u seriji *,/ sa istom vrednosti, mera var. ce se za toliko puta povecati ili smanjiti 3) u izracunavanju mera var. moraju da ucestvuju svi clanovi serije podjednakoOd svih navedenih mera ove uslove ispunjava samo varijansa I standardna devijacija

Page 3: Bio Stat is Tika

Iv=Xmax-XminQ=q3-q1 q1= (N+1)/4 q3= 3*(N+1)/4AD= E|Xi-Ar.sr.vred.|/N

Koef. var. Cv= (malo beta ili SD)/X * 100

Normalna raspodela

Normalna kriva I momenti

Ako posmatramo neku pojavu, I ako na nju deluje niz nezavisnih faktora podjednake jacine a suprotnih pravaca, onda nastaje simetricna distribucija koja se zove normalna raspodela – Gausova kriva. Ima oblik zvona I raspodele frek. podjednako opadaju sa leve I desne strane u dnosu na aritmeticku sredinu. Ukupna povrsina ispod krive je ukupan broj svih posmatranih slucajeva.

Ako povucemo ordinate na odstojanju jedne standardne devijacije levo I desno od ar.sr. dobicemo de povrsine spod krive od 68.27%. svih slucajeva => prvo б pravilo t=1isto to uradimo na odstojanju 2 stand. devijacije, dobijamo povrsinu od 95.45% svih slucajeva, to je drugo б pravilo, t=2.isto za 3 stan.dev. , povrsina je 99.73% svih slucajeva, trece б pravilo, t=3

Normalni raspored je jedan od teorijskih rasporeda I pored njega postoje jos i: -binomni, F. raspored, Stugenov…

Svaki od teorijskih rasporeda ima svoje odredjene karakteristike, Na osnovu tih kar. odredjuje se kojom od postojecih rasporeda pripada posmatrana distribucija frek. Bilo koji od teor. rasp. moze se opisati na zadovoljavajuc nacin sa 5 stat. velicina: 1) br. slucajeva [n] 2) njene centralne tendencije [arit.sred.] 3)mere varijacije [б] 4) mere asimetrije [α3] 5) mera spljostenosti [α4]

normalizovano obelezje [Z] Z= (Xi – ar.sr.)/σ

Analiza trenda

Zadatak trenda je da ustanovi pravilnosti I zakonitosti koje se ispoljavaju u varijaciji pojave tokom vremena. Na osnovu promene kretanja posmatrane pojave u vremenskim serijama razlikujemo 3 vrste promena: 1) sekularni trend (sek. oblik promene) 2) regularne promene (sezonske, ciklicne oblike promene) 3) Neregularne (slucajne) promene

Najcesci oblik trenda u primeni je jednacina 1. stepena. Ona odgovara pravolinijskom trendu I glasi:Ÿ=a+b*Xi Ÿ je zavisna promenljiva, pokazuje prosecnu ili ocekivanu vrednost posmatrane pojave. ‘a’ I ‘b’ su parametric, ‘a’ je prosecan pocetni nivo pojave. ‘b’ pros. povecanje/smanjenje pojave, ‘Xi’ pros. vremenski period nezavisne promenljive.

Page 4: Bio Stat is Tika

Racunskim postupkom, metodom najmanjih kvadrata izracunati ‘a I b’ I odrediti najbolje prolagodjenu liniju trenda. Jednacina 1. stepena primejnuje se na vremesku seriju sa neprekidnim rastom ili opadanjem posmatrane pojave.

Korelacija I regresija

Posmatrajuci 2+ promenljivih za koje znamo ili redpostavljamo das u u medjusobnoj vezi mozemo ustanoviti njihovu medjusobnu zavisnost. Ona moze biti strogo odredjena ili Funkcionalna y=f(x), ili labavija Stohaticna/Korelaciona. Mora se ustanoviti postojanje korelacione veze pri uspostavljanju korelacione zavisnosti. Pokazatelji korelacije su: 1) koef. korelacije [rxy], pokazuje meru zavisnosti 2 medjusobno zavisne pojave 2) koef. determinacije [dxy], pokazuje koliki je % uticaj promenljive x u ukupnoj promeni zavisno promenljive y. 3) koef. nedeterminacije [d’xy], pokazuje koliko % uticu drugi faktori, bez uticaja nez.prom. x na promenu zavisne y.koef. korelacije moze imati vrednosti od -0.99 do +0.99

Jacina korelacione zavisnosti moze biti: 1) slaba (0-0.5) 2) srednja (0.51-0.75) 3) jaka (0.76-0.95)4) vrlo jaka (0.96-0.99)

Cilj regresione anaize je ustanovljavanje kvantitativnog slaganja varijacije posmatranih pojava – ustanovljavanje modela promene zavisno promenljive y u odnosu na promenu nez. prom. x.

Pokazatelji regresije su: 1) jednacina regresije (ista kao jednacina trenda) Ÿ- ocenjena vrednost zavisne prom. a-zavistan pocetni nivo prom. b-prosecna promena zav.prom. za svaku jedinicu nez.prom. Xi-vrednost nez.prom.2) Standardna greska regresije – pokazuje srednju meru odstupanja stvarnih podataka od linije regresije

Eksperimentalna statistika, Testiranje hipoteze

Eksp. stat. metode nam omogucavaju analizu I medjusobno poredjenje dobijenih eksp. zad. Osnovni cilj eks.s.met. je ustanovljavanje bitnih razlika izmedju ispitanih oglednih grupa. Za ustanovljavanje razlika koriste se odredjene grupe stat. testova. Za ustanovljavanje znacajnosti razlika izmedju 2 grupe podataka koriste se pojedinacni testovi: 1) T test 2) Tucky test 3) LSD test 4) Najmanje znacajna razlika 5) Danteov testZa testiranje znacajnih razlika izmedju 3 I vise eks. grupa koristi se analiza varijanse (ANOVA). Prilikom izracunavanja ANOVE koristi se grupni Fiserov F test. 1. korak u uporedjivanju rezultata je postavljanje nulte hipoteze, Ovom hipotezom se pretpostavlja da ne postoje razlike izmedju eks. grupa.H0: Sr.vr.1=sr.vr.2=sr.vr.nNakon postavljanja nulte hipoteze pristupa se izracunavanju stat. vrednosti odabranog odg. testa. Izracunata vrednost testa se uporedjuje sa kriticnim tablicnim vrednostima. Nivoi verovatnoci koji se koriste u svim testiranjima su 1% I 5%. Na osnovu medj. odnosa izr.vred. testa I krit.tab.vred. uspostavlja se signifikantnost razlika ispitivanih arit.sred. U slucajevima kada odbacujemo tacnu

Page 5: Bio Stat is Tika

nultu hipotezu pravimo gresku prve vrste (α) a ukoliko prihvatamo netacnu nultu hipotezu pravimo gresku druge vrste (ß). U odnosu na kriticne tab.vred. izracunata vrednost odg. testa moze da bude: 1) manja od obe kriticne tab.vred. I onda razlika izmedju testiranih sred.vred. nije znacajna I nulta hip. se prihvata (p≥0.05) 2) izmedju krit. tab. vred. kada postoji znacajna razlika izmedju ispitivanih sred.vred. I nulta hip. se ne prihvata (p≤0.05) 3) veca od obe krit. tab. vred. kada postoji vrlo znacajna razlika izmedju ispitivanih sred. vred. I nulta hip. se ne prihvata (p≤0.01)