C10-TesteStatistice
-
Upload
cojocariu-emanuel -
Category
Documents
-
view
216 -
download
0
Transcript of C10-TesteStatistice
-
8/18/2019 C10-TesteStatistice
1/31
TESTE
STATISTICE
1
-
8/18/2019 C10-TesteStatistice
2/31
2
Notiuni
Testarea ipotezelor statistice
Ipoteza nulă, ipoteza alternativa
Erori în testarea ipotezelor statistice
Regiunea critică
Teste parametrice Teste nonparametrice
-
8/18/2019 C10-TesteStatistice
3/31
3
Introducere
Formularea de noi ipoteze (modele sau
teorii) este una dintre cele mai importante
aspecte ale cercetării ştiinţifice.
Aceste ipoteze în mod experimental încercă
să descrie sau să explice anumite fenomene
reale.
In multe cazuri există ipoteze anterioare(descrieri sau explicaţii) pe care oamenii de
ştiinţă doresc să le înlocuiască cu altele noi.
-
8/18/2019 C10-TesteStatistice
4/31
4
Introducere
O ipoteză nouă trebuie testată pentru a vedea
că are temei (în concordanţă cu observaţiile),
şi pentru a justifica că este “mai bună” decâtalte ipoteze alternative.
Aceasta conduce la scheme de experimente
în scopul obţinerii de dovezi pentru
susţinerea (sau respingerea) unei noiipoteze.
-
8/18/2019 C10-TesteStatistice
5/31
5
Metode pentru testarea ipotezelor
Compararea a două ipoteze sau teorii concurente
Prima dată trebuie formulate ca modele.
Ipoteza nulă H0, reprezintă modelul pe careexperimentatorul ar dori să-l înlocuiască.
Ipoteza alternativă H1 este noul model care de regulă
reprezintă o negaţie a ipotezei nule.
-
8/18/2019 C10-TesteStatistice
6/31
6
Metode pentru testarea
ipotezelor Indiferent cum este formulat protocolul experimentului,
scopul cercetătorului este de a testa ipoteza nulă (decele mai multe ori pentru a o rejecta)
Ipoteza nulă nu trebuie probată, ci anulată Inferenţă negativă
Scopul testului statistic este de a dovedi că ipoteza nulă
H0 este falsă nu putem niciodată afirma că acceptăm ipoteza nulă
O putem nega sau nu o putem nega
-
8/18/2019 C10-TesteStatistice
7/31
7
Metode pentru testarea
ipotezelor Prin respingerea ipotezei nule,
cercetătorul afirmă că rezultatele
observate nu sunt datorate întâmplării(efect semnificativ)
Când ipoteza nulă nu este rejectată,
cercetătorul afirmă că diferenţeleobservate sunt datorate întâmplării şi
rezultatele nu sunt semnificative.
-
8/18/2019 C10-TesteStatistice
8/31
8
Teste stat ist ice –
C omparaţia uneicaracter is t ic i observate cu ocaracteristică teoretică.
-
8/18/2019 C10-TesteStatistice
9/31
9
scenariu
Se presupune că media taliei normale a nou-
născuţilor la termen este de 51 cm. Pe un eşantion
reprezentativ de 60 nou-născuţi prematur se observă o medie a taliei de 45 cm.
Diferenţa între cele două medii este semnificativă?
Adică, se poate afirma că prematurii se nasc cu o
talie mai mică decât nou-născuţii la termen?
-
8/18/2019 C10-TesteStatistice
10/31
10
Etapele unui test s tat ist ic
Pasul 1: Specificăm ipoteza nulă şi ipotezaalternativă.
Pasul 2: Alegem statistica adaptată situaţiei .
Pasul 3: Alegem nivelul de semnificaţie şi pe baza sacalculăm pragul de separare (între valorile“acceptabile” şi cele considerate ca “inacceptabile”).
Pasul 4: Calculăm valoarea statisticii, folosind dateledin eşantion (ales aleator).
Pasul 5: Decidem, prin compararea valorii calculatecu pragul dat de nivelul de semnificaţie, dacărespingem sau nu ipoteza nulă.
-
8/18/2019 C10-TesteStatistice
11/31
11
Etapele unu i test s tat ist ic – 1 (ipo tezele
stat ist ice)
Ipoteza nulă H0 este ipoteza care trebuie testată, testulefectuându-se sub prezumţia că ipoteza nulă ar fiadevărată.
Ipoteza alternativă H1 este acea ipoteză care într -unsens sau altul contrazice ipoteza nulă. Această ipotezăse mai numeşte şi ipoteza de lucru.
-
8/18/2019 C10-TesteStatistice
12/31
12
Etapele unui test s tat ist ic -1 exemplu
Ipoteza nulă H0: μA = μB (μA - μB = 0)
Media valorilor unei variabile cantitative în
populaţia A nu este diferită de media valorilor înpopulaţia B;
Ipoteza alternativă
H1: μA ≠ μB (μA - μB ≠ 0) Media valorilor în populaţia A este diferită de
media valorilor în populaţia B.
-
8/18/2019 C10-TesteStatistice
13/31
13
Etapele unu i test s tat is t ic -1 exemplu
Ipotezele anterioare stipulau diferenţa fără ao enunţa: ipoteze non-direcţionale
Uneori se urmăreşte tocmai respingereaipotezei alternative (comparaţia unuitratament cu un standard)
Ipoteze direcţionale H1: μA < μB (μA - μB < 0)
H1: μA > μB (μA - μB > 0)
-
8/18/2019 C10-TesteStatistice
14/31
14
Regiunea critica
Accept Ho
1 – α
Critical value Critical value
Critical value
Critical value
Reject Ho Reject Ho
Reject Ho
Reject Ho
Accept Ho
1 – α
Accept Ho
1 – α
-
8/18/2019 C10-TesteStatistice
15/31
15
Etapele unu i test s tat ist ic – 2 (defin irea
parametru lui stat ist ic)
Definirea unui parametru care sub ipotezanulă H0 urmează o anumită lege deprobabilitate cunoscută (de exemplu, legea
normală).
Ţinând seama de faptul că eşantionul saueşantioanele utilizate sunt aleator extrase din
populaţiile care fac obiectul testului,parametrul statistic este o variabilă aleatoarede selecţie, care urmează o anumită lege deprobabilitate.
-
8/18/2019 C10-TesteStatistice
16/31
Etapele unu i test s tat ist ic – 2 (defin irea
parametrulu i s tat ist ic)
Un bun parametru statistic al testului trebuiesă îndeplinească două condiţii:
trebuie să se comporte diferit atunci când ipotezanulă H0 este adevărată faţă de situaţia în careipoteza alternativă H1 este adevărată.
distribuţia de probabilitate a parametrului statistical testului sub prezumţia că H0 este adevărată,este cunoscută.
16
-
8/18/2019 C10-TesteStatistice
17/31
17
Etapele unu i test s tat is t ic –3
3. Definirea unui prag de semnificaţie
(probabilitatea de a respinge H0 cand ea de
fapt este adevarata)
-de obicei se alege un nivel de semnificaţie între 1% ( =0.01) şi 5%. ( = 0.05)
-
8/18/2019 C10-TesteStatistice
18/31
Etapele unu i test s tat ist ic – 2 (defin irea
parametrulu i s tat ist ic)
4. Definirea unei regiuni critice pentru
parametrul definit la punctul 2, asociată
pragului de semnificaţie (adica aregiunii unde parametrul are cel puţin
probabi l i tatea de a se găsi ).
18
-
8/18/2019 C10-TesteStatistice
19/31
19
Etapele unu i test s tat is t ic –4
Depinzând de ipoteza alternativă, se poate alege una dinurmătoarele trei regiuni critice:
Regiunea critică unilaterală la dreapta – valoarea parametruluistatistic al testului este mai mare sau egală cu valoarea din
dreapta a intervalului critic; Regiunea critică unilaterală la stânga – valoarea parametrului
statistic al testului este mai mică sau egală cu valoarea dinstânga a intervalului critic;
Regiunea critică bilaterală – valoarea parametrului statistic al
testului este mai mică sau egală cu valoarea extremă dinstânga regiunii critice sau mai mare sau egală cu valoareaextremă din dreapta regiunii critice, valorile extreme aleregiunii critice având nivele egale de semnificaţie.
-
8/18/2019 C10-TesteStatistice
20/31
20
Etapele unui test stat ist ic – 5Decizia (folosind regiunea critică)
Dacă parametrul statistic calculat se află înregiunea critică atunci se respinge ipotezanulă H0, deci se acceptă ipoteza alternativă
H1. Această decizie are un risc de eroare ,fiind riscul de prima speţă.
Dacă parametrul statistic nu se află înregiunea critică atunci nu există niciun motiv
de a respinge ipoteza nulă H0. Acceptând-oexistă un risc de eroare, numit risc de speţaa doua notat cu .
-
8/18/2019 C10-TesteStatistice
21/31
21
Etapele unu i tes t stat ist ic – 5Decizia (fo los ind valoarea lui p )
La aplicarea testelor statistice programele deprelucrare statistica vor afisa o probabilitate desemnificatie a testului statistic, numita si nivel de
semnificatie observat (notat cu p). Stabilirea semnificaţiei testului pe baza valorii lui p se
face frecvent cu următoarea regulă empirică (consideramnivelul ales =0,05) :
1. Dacă 0,01
-
8/18/2019 C10-TesteStatistice
22/31
22
Erori în testarea ipotezelor
statistice
H0 este falsa H0 esteadevarata
Respingem H0 Corectă!
Eronată (eroare
de tipul I)
Nu respingem
H0 Eronată (eroare
de tipul al II-lea) Corectă!
decizia
realitatea
-
8/18/2019 C10-TesteStatistice
23/31
23
Eroarea de tip I şi nivelul de semnificaţie
Probabilitatea comiterii unei erori de tip I = nivelul desemnificaţie, α (alfa)
Probabilitatea este determinată prin teste statistice
Am concluzionat că există reale diferenţe deşi acestea
sunt datorate şansei Concluzionăm că un tratament este eficient pe baza unei
interpretări greşite
Nivelul alfa (riscul maxim acceptabil) 5% există oşansă de 5% de a respinge incorect ipoteza nulă
exemple: p= 0,18 ipoteza nulă nu se poate respinge
p= 0,04 ipoteza nulă se poate respinge cu un risc acceptabilde 4% de a comite o eroare de tipul I
-
8/18/2019 C10-TesteStatistice
24/31
24
Eroarea de tip II
H0 este nu este respinsă, deşi este falsă;
Am concluzionat că există diferenţele observate suntdatorate şansei atunci când acestea apar datorită
diferenţelor dintre eşantioane Am putea abandona un tratament pe care tocmai îl
testăm sau o direcţie de cercetare
Probabilitatea de a nu rejecta o ipoteză nulă falsă =
β, probabilitatea de a face o eroare de tipul II 1- β = complementul lui β, puterea unui test
Puterea = probabilitatea ca un test să respingăipoteza nulă sau să obţină semnificaţie statistică
H0 este falsa H0 este adevarata
Respingem H0 Corectă!
Eronată (eroare
de tipul I)
Nu respingem H0 Eronată (eroare
de tipul al II-lea)
Corectă!
-
8/18/2019 C10-TesteStatistice
25/31
25
25
Ce determină puterea unui test?
Criteriul de semnificaţie Varianţa
Dimensiunea eşantionului
Dimensiunea efectului
-
8/18/2019 C10-TesteStatistice
26/31
26
Regiunea critică = regiunea de respingere, aria mărginită de
Z=±1,96
-
8/18/2019 C10-TesteStatistice
27/31
27
Regiunea critică - exemplu
Media taliei nou-nascuţiilor la termen µ=50 cm
S2=9
n=50
m=45 cm (media taliei pentru un esantion de prematuri)
Sx=0,42Etapele testului:
1. formularea ipotezelor
2. α=0,05;
3. Parametrul testului: Z=11.7
4.Regiunea critica:5. Decizia:
Testul este semnificativ, se poate
respinge ipoteza nulă pentru ca
parametrul testului apartine regiunii critice.
X s
X Z
);96.1[]96.1;(
-
8/18/2019 C10-TesteStatistice
28/31
28
28
Test non-direcţional (cu două cozi)
Nu s-a evaluat
direcţia diferenţei
dintre cele două medii
Un test cu un nivel de
semnificaţie α are o
probabilitate de α/2pentru fiecare coadă
-
8/18/2019 C10-TesteStatistice
29/31
-
8/18/2019 C10-TesteStatistice
30/31
30
Statistici parametrice şi non-
parametrice Statisticile utilizate pentru a estima parametrii unei
populaţii sunt statistici parametrice
Sunt bazate pe extragerea randomizată de eşantioane
dintr-o populaţie normal distribuită Eşantioanele reprezintă parametrii populaţiei
Dacă nu se respectă aceste condiţii sunt necesare
altfel de teste statistice: teste nonparametrice:
Nu fac supoziţii asupra populaţiei Pot fi folosite atunci când criteriile de normalitate şi
omogenitate nu sunt îndeplinite
-
8/18/2019 C10-TesteStatistice
31/31
31
Vă mulţ umesc!!!