C10-TesteStatistice

8/18/2019 C10-TesteStatistice

1/31

TESTE

STATISTICE

1


2/31

2

Notiuni

Testarea ipotezelor statistice

Ipoteza nulă, ipoteza alternativa

Erori în testarea ipotezelor statistice

Regiunea critică

Teste parametrice Teste nonparametrice


3/31

3

Introducere

Formularea de noi ipoteze (modele sau

teorii) este una dintre cele mai importante

aspecte ale cercetării ştiinţifice.

Aceste ipoteze în mod experimental încercă

să descrie sau să explice anumite fenomene

reale.

In multe cazuri există ipoteze anterioare(descrieri sau explicaţii) pe care oamenii de

ştiinţă doresc să le înlocuiască cu altele noi.


4/31

4

Introducere

O ipoteză nouă trebuie testată pentru a vedea

că are temei (în concordanţă cu observaţiile),

şi pentru a justifica că este “mai bună” decâtalte ipoteze alternative.

Aceasta conduce la scheme de experimente

în scopul obţinerii de dovezi pentru

susţinerea (sau respingerea) unei noiipoteze.


5/31

5

Metode pentru testarea ipotezelor

Compararea a două ipoteze sau teorii concurente

Prima dată trebuie formulate ca modele.

Ipoteza nulă H0, reprezintă modelul pe careexperimentatorul ar dori să-l înlocuiască.

Ipoteza alternativă H1 este noul model care de regulă

reprezintă o negaţie a ipotezei nule.


6/31

6

Metode pentru testarea

ipotezelor Indiferent cum este formulat protocolul experimentului,

scopul cercetătorului este de a testa ipoteza nulă (decele mai multe ori pentru a o rejecta)

Ipoteza nulă nu trebuie probată, ci anulată Inferenţă negativă

Scopul testului statistic este de a dovedi că ipoteza nulă

H0 este falsă nu putem niciodată afirma că acceptăm ipoteza nulă

O putem nega sau nu o putem nega


7/31

7

Metode pentru testarea

ipotezelor Prin respingerea ipotezei nule,

cercetătorul afirmă că rezultatele

observate nu sunt datorate întâmplării(efect semnificativ)

Când ipoteza nulă nu este rejectată,

cercetătorul afirmă că diferenţeleobservate sunt datorate întâmplării şi

rezultatele nu sunt semnificative.


8/31

8

Teste stat ist ice –

C omparaţia uneicaracter is t ic i observate cu ocaracteristică teoretică.


9/31

9

scenariu

Se presupune că media taliei normale a nou-

născuţilor la termen este de 51 cm. Pe un eşantion

reprezentativ de 60 nou-născuţi prematur se observă o medie a taliei de 45 cm.

Diferenţa între cele două medii este semnificativă?

Adică, se poate afirma că prematurii se nasc cu o

talie mai mică decât nou-născuţii la termen?


10/31

10

Etapele unui test s tat ist ic

Pasul 1: Specificăm ipoteza nulă şi ipotezaalternativă.

Pasul 2: Alegem statistica adaptată situaţiei .

Pasul 3: Alegem nivelul de semnificaţie şi pe baza sacalculăm pragul de separare (între valorile“acceptabile” şi cele considerate ca “inacceptabile”).

Pasul 4: Calculăm valoarea statisticii, folosind dateledin eşantion (ales aleator).

Pasul 5: Decidem, prin compararea valorii calculatecu pragul dat de nivelul de semnificaţie, dacărespingem sau nu ipoteza nulă.


11/31

11

Etapele unu i test s tat ist ic – 1 (ipo tezele

stat ist ice)

Ipoteza nulă H0 este ipoteza care trebuie testată, testulefectuându-se sub prezumţia că ipoteza nulă ar fiadevărată.

Ipoteza alternativă H1 este acea ipoteză care într -unsens sau altul contrazice ipoteza nulă. Această ipotezăse mai numeşte şi ipoteza de lucru.


12/31

12

Etapele unui test s tat ist ic -1 exemplu

Ipoteza nulă H0: μA = μB (μA - μB = 0)

Media valorilor unei variabile cantitative în

populaţia A nu este diferită de media valorilor înpopulaţia B;

Ipoteza alternativă

H1: μA ≠ μB (μA - μB ≠ 0) Media valorilor în populaţia A este diferită de

media valorilor în populaţia B.


13/31

13

Etapele unu i test s tat is t ic -1 exemplu

Ipotezele anterioare stipulau diferenţa fără ao enunţa: ipoteze non-direcţionale

Uneori se urmăreşte tocmai respingereaipotezei alternative (comparaţia unuitratament cu un standard)

Ipoteze direcţionale H1: μA < μB (μA - μB < 0)

H1: μA > μB (μA - μB > 0)


14/31

14

Regiunea critica

Accept Ho

1 – α

Critical value Critical value

Critical value

Critical value

Reject Ho Reject Ho

Reject Ho

Reject Ho

Accept Ho

1 – α

Accept Ho

1 – α


15/31

15

Etapele unu i test s tat ist ic – 2 (defin irea

parametru lui stat ist ic)

Definirea unui parametru care sub ipotezanulă H0 urmează o anumită lege deprobabilitate cunoscută (de exemplu, legea

normală).

Ţinând seama de faptul că eşantionul saueşantioanele utilizate sunt aleator extrase din

populaţiile care fac obiectul testului,parametrul statistic este o variabilă aleatoarede selecţie, care urmează o anumită lege deprobabilitate.


16/31


parametrulu i s tat ist ic)

Un bun parametru statistic al testului trebuiesă îndeplinească două condiţii:

trebuie să se comporte diferit atunci când ipotezanulă H0 este adevărată faţă de situaţia în careipoteza alternativă H1 este adevărată.

distribuţia de probabilitate a parametrului statistical testului sub prezumţia că H0 este adevărată,este cunoscută.

16


17/31

17

Etapele unu i test s tat is t ic –3

3. Definirea unui prag de semnificaţie

(probabilitatea de a respinge H0 cand ea de

fapt este adevarata)

-de obicei se alege un nivel de semnificaţie între 1% ( =0.01) şi 5%. ( = 0.05)


18/31


parametrulu i s tat ist ic)

4. Definirea unei regiuni critice pentru

parametrul definit la punctul 2, asociată

pragului de semnificaţie (adica aregiunii unde parametrul are cel puţin

probabi l i tatea de a se găsi ).

18


19/31

19

Etapele unu i test s tat is t ic –4

Depinzând de ipoteza alternativă, se poate alege una dinurmătoarele trei regiuni critice:

Regiunea critică unilaterală la dreapta – valoarea parametruluistatistic al testului este mai mare sau egală cu valoarea din

dreapta a intervalului critic; Regiunea critică unilaterală la stânga – valoarea parametrului

statistic al testului este mai mică sau egală cu valoarea dinstânga a intervalului critic;

Regiunea critică bilaterală – valoarea parametrului statistic al

testului este mai mică sau egală cu valoarea extremă dinstânga regiunii critice sau mai mare sau egală cu valoareaextremă din dreapta regiunii critice, valorile extreme aleregiunii critice având nivele egale de semnificaţie.


20/31

20

Etapele unui test stat ist ic – 5Decizia (folosind regiunea critică)

Dacă parametrul statistic calculat se află înregiunea critică atunci se respinge ipotezanulă H0, deci se acceptă ipoteza alternativă

H1. Această decizie are un risc de eroare ,fiind riscul de prima speţă.

Dacă parametrul statistic nu se află înregiunea critică atunci nu există niciun motiv

de a respinge ipoteza nulă H0. Acceptând-oexistă un risc de eroare, numit risc de speţaa doua notat cu .


21/31

21

Etapele unu i tes t stat ist ic – 5Decizia (fo los ind valoarea lui p )

La aplicarea testelor statistice programele deprelucrare statistica vor afisa o probabilitate desemnificatie a testului statistic, numita si nivel de

semnificatie observat (notat cu p). Stabilirea semnificaţiei testului pe baza valorii lui p se

face frecvent cu următoarea regulă empirică (consideramnivelul ales =0,05) :

1. Dacă 0,01


22/31

22

Erori în testarea ipotezelor

statistice

H0 este falsa H0 esteadevarata

Respingem H0 Corectă!

Eronată (eroare

de tipul I)

Nu respingem

H0 Eronată (eroare

de tipul al II-lea) Corectă!

decizia

realitatea


23/31

23

Eroarea de tip I şi nivelul de semnificaţie

Probabilitatea comiterii unei erori de tip I = nivelul desemnificaţie, α (alfa)

Probabilitatea este determinată prin teste statistice

Am concluzionat că există reale diferenţe deşi acestea

sunt datorate şansei Concluzionăm că un tratament este eficient pe baza unei

interpretări greşite

Nivelul alfa (riscul maxim acceptabil) 5% există oşansă de 5% de a respinge incorect ipoteza nulă

exemple: p= 0,18 ipoteza nulă nu se poate respinge

p= 0,04 ipoteza nulă se poate respinge cu un risc acceptabilde 4% de a comite o eroare de tipul I


24/31

24

Eroarea de tip II

H0 este nu este respinsă, deşi este falsă;

Am concluzionat că există diferenţele observate suntdatorate şansei atunci când acestea apar datorită

diferenţelor dintre eşantioane Am putea abandona un tratament pe care tocmai îl

testăm sau o direcţie de cercetare

Probabilitatea de a nu rejecta o ipoteză nulă falsă =

β, probabilitatea de a face o eroare de tipul II 1- β = complementul lui β, puterea unui test

Puterea = probabilitatea ca un test să respingăipoteza nulă sau să obţină semnificaţie statistică

H0 este falsa H0 este adevarata

Respingem H0 Corectă!

Eronată (eroare

de tipul I)

Nu respingem H0 Eronată (eroare

de tipul al II-lea)

Corectă!


25/31

25

25

Ce determină puterea unui test?

Criteriul de semnificaţie Varianţa

Dimensiunea eşantionului

Dimensiunea efectului


26/31

26

Regiunea critică = regiunea de respingere, aria mărginită de

Z=±1,96


27/31

27

Regiunea critică - exemplu

Media taliei nou-nascuţiilor la termen µ=50 cm

S2=9

n=50

m=45 cm (media taliei pentru un esantion de prematuri)

Sx=0,42Etapele testului:

1. formularea ipotezelor

2. α=0,05;

3. Parametrul testului: Z=11.7

4.Regiunea critica:5. Decizia:

Testul este semnificativ, se poate

respinge ipoteza nulă pentru ca

parametrul testului apartine regiunii critice.

X s

X Z

);96.1[]96.1;(


28/31

28

28

Test non-direcţional (cu două cozi)

Nu s-a evaluat

direcţia diferenţei

dintre cele două medii

Un test cu un nivel de

semnificaţie α are o

probabilitate de α/2pentru fiecare coadă


29/31


30/31

30

Statistici parametrice şi non-

parametrice Statisticile utilizate pentru a estima parametrii unei

populaţii sunt statistici parametrice

Sunt bazate pe extragerea randomizată de eşantioane

dintr-o populaţie normal distribuită Eşantioanele reprezintă parametrii populaţiei

Dacă nu se respectă aceste condiţii sunt necesare

altfel de teste statistice: teste nonparametrice:

Nu fac supoziţii asupra populaţiei Pot fi folosite atunci când criteriile de normalitate şi

omogenitate nu sunt îndeplinite


31/31

31

Vă mulţ umesc!!!

C10-TesteStatistice

Documents

Transcript of C10-TesteStatistice