Clase 2 - Experimentos con 1 y 2 tratamientos.pdf
-
Upload
victorjulionunezcruz -
Category
Documents
-
view
8 -
download
2
Transcript of Clase 2 - Experimentos con 1 y 2 tratamientos.pdf
-
Experimentos con uno y dos tratamientos
Dr. Ral Benito Siche Jara
1
Curso: Mtodos Estadsticos para la Investigacin
ESCUELA ACADMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL
UNIVERSIDAD NACIONAL DE TRUJILLO
-
Factor: Variable (Independiente) que manipula el
investigador para estudiar sus efectos sobre la
variable dependiente.
Nivel del Factor: es cada una de las categoras,
valores o formas especficas del factor.
Tratamientos: Conjunto de condiciones experi-
mentales que sern impuestas a una unidad
experimental en un diseo elegido. En experimentos
unifactoriales, un tratamiento corresponde a un nivel
de factor. En experimentos multifactoriales, un
tratamiento corresponde a la combinacin de niveles
de factores.
Mtodos estadsticos para la investigacin 2 Dr. Ral Siche UNT
DEFINICIONES
-
Tratamiento Control: tratamiento al que no se le
aplica tratamiento alguno.
Rplicas: corridas experimentales que corresponden a una misma combinacin de tratamientos. Son repeticiones del experimento bajo idnticas condicio-nes de los factores. Objetivos: Lograr mayor precisin en la estimacin de los efectos de los factores y de sus interacciones, y estimar el error experimental.
Mtodos estadsticos para la investigacin 3 Dr. Ral Siche UNT
DEFINICIONES
-
INFERENCIA ESTADISTICA
Mtodos estadsticos para la investigacin 4 Dr. Ral Siche UNT
PARMETROS
(Siempre desconocidos)
ESTADSTICOS (conocidos)
ALE
ATO
RIA
Representativa
-
MEDIDAS DE TENDENCIA
Mtodos estadsticos para la investigacin 5 Dr. Ral Siche UNT
Si tuvieramos que resumir en un slo valor representativo todo el conjunto de observaciones,
qu valor usamos?
-
MEDIDAS DE TENDENCIA
Media
Mtodos estadsticos para la investigacin 6 Dr. Ral Siche UNT
La media (media aritmtica o promedio) es el valor caracterstico de una serie de datos cuantitativos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral. Una de las limitaciones de la media es que es una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.
-
MEDIDAS DE TENDENCIA
Moda
Mtodos estadsticos para la investigacin 7 Dr. Ral Siche UNT
Valor o clase de valores que se observa con mayor frecuencia en la muestra.
Puede no existir o no ser nico.
Funciona para cualquier tipo de dato: categricos, ordinales numricos.
-
MEDIDAS DE TENDENCIA
Mediana
Mtodos estadsticos para la investigacin 8 Dr. Ral Siche UNT
Valor que divide el rango de valores observados en dos mitades con el mismo nmero de observaciones. Su cmputo requiere ordenar la muestra. Si n (n de observaciones) es impar: Me = Si n es par: Me = Ejemplo: 2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par)
Me = (7+8)/2 = 7,5
2
XX 1(n/2)n/2
2
1nX
-
MEDIDAS DE TENDENCIA
Mtodos estadsticos para la investigacin 9 Dr. Ral Siche UNT
Robustez de la Media versus la Mediana La media es extremadamente sensible a situaciones en que hay valores numricamente muy distantes del resto (outliers) La mediana en cambio permite obtener valores ms representativos en estos casos Ejemplo: 1, 2, 2, 2, 3, 9
-
MEDIDAS DE TENDENCIA
Mtodos estadsticos para la investigacin 10 Dr. Ral Siche UNT
Robustez de la Media versus la Mediana
0,0000
0,0500
0,1000
0,1500
0,2000
0,2500
0,3000
0,3500
0,4000
0,4500
0,5000
4 5 6 7 0 1 2 3
Q1 Q2 Q3 Q4
Moda
Media Aritmtica
Mediana
Rango
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 11 Dr. Ral Siche UNT
Cmo damos cuenta de la variabilidad del conjunto de observaciones? Podemos medir las diferencias observadas con respecto a nuestras medidas de tendencia
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 12 Dr. Ral Siche UNT
Varianza
s2 : Variancia Muestral x : Media Aritmtica xi : i-simo valor observado n : Tamao Muestra
n
ii xx
ns
1
22 )(1
Promedio de las diferencias al cuadrado con respecto a la media.
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 13 Dr. Ral Siche UNT
Desviacin estndar
Raz cuadrada de la varianza.
Tiene las mismas unidades de medida que las observaciones de la muestra
n
ii xx
ns
1
2)(1
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 14 Dr. Ral Siche UNT
Asimetra
ndice de asimetra de Pearson
s
x
X MoA
s
Est basado en la relacin entre la media y la moda en distribuciones simtricas y asimtricas:
Si la distribucin es simtrica As ser 0 Si la distribucin es asimtrica positiva, As ser mayor que 0 Si la distribucin es asimtrica negativa, As ser menor que 0
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 15 Dr. Ral Siche UNT
Curtosis
Hace referencia al apuntamiento de la distribucin en relacin a un estndar, que es la distribucin normal.
4
1
4
( )
3
n
i
ir
x
X X n
Cs
Si la distribucin es normal (mesocrtica), el ndice vale 0
Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0
-
MEDIDAS DE DISPERSIN
Mtodos estadsticos para la investigacin 16 Dr. Ral Siche UNT
Curtosis
Distribucin normal (estndar): Distribucin Mesocrtica
Si la distribucin es ms apuntada que la distribucin normal: Distribucin Leptocrtica
Si la distribucin es ms achatada que la distribucin normal: Distribucin platicrtica.
-
EJEMPLO
Mtodos estadsticos para la investigacin 17 Dr. Ral Siche UNT
Colormetro Konica Minolta Sistema de Visin Computacional 45 45 45 48 50 42.3 45.3 45 53.8 45.1 11 63 37 45 8 19.1 63.2 36.3 47.4 2.6 60 89 73 60 20 67.8 86.7 81 59.5 17.3 45 40 34 34 67 27.5 50 25.5 27 70 14 23 15 56 64 14.6 21 12.7 56 66.6 10 5 50 34 67 10.1 5.4 54.3 34 68.9 63 70 63 64 67 42.2 78.6 63 70.4 67.1 90 57 54 56 24 75 57 51.9 56.1 15.4 59 60 68 70 35 59 60 75.1 72.5 31.4 52 52 35 51 36 52 55.9 39.1 48.2 32.1
En la siguiente tabla se muestran valores del parmetro de color L (Luminosidad) medidas en 50 rodajas de yacn utilizando Colormetro Konica Minolta (CKM) y Sistema de Visin Computacional (SVC):
-
EJEMPLO
Mtodos estadsticos para la investigacin 18 Dr. Ral Siche UNT
Estadsticos
50 50
0 0
47.6600 47.1600
50.5000 50.9500
45.00 2.60a
20.37466 21.64382
415.127 468.455
-.341 -.327
.337 .337
-.310 -.790
.662 .662
5.00 2.60
90.00 86.70
Vlidos
Perdidos
N
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Error tp. de asimetra
Curtosis
Error tp. de curtos is
Mnimo
Mximo
CKM SVC
Existen varias modas. Se mostrar el menor de los valores.a.
Analizar Estadsticos descriptivos Frecuencias
Secuencia - SPSS
-
Formulacin de la Hiptesis de nulidad Paso 1
Formulacin de la Hiptesis alternativa Paso 2
Estadstico de la prueba y nivel de significacin Paso 3
Clculo del valor emprico del estadstico de la prueba
Paso 4
Decisin estadstica de aceptar o rechazar la hiptesis nula
Rechazo de H0 Si p 0,05
Paso 5
PRUEBA ESTADSTICA: PASOS
Mtodos estadsticos para la investigacin 19 Dr. Ral Siche UNT
-
DISTRIBUCIN DE PROBABILIDAD
Es una descripcin del conjunto de valores posibles de X, con la probabilidad asociada a cada uno de estos valores.
Importancia
Modela los posibles valores de un estadstico muestral, con lo que al observar un estadstico se puede corroborar o rechazar supuestos (prueba de hiptesis).
Mtodos estadsticos para la investigacin 20 Dr. Ral Siche UNT
-
DISTRIBUCIN DE PROBABILIDAD
Mtodos estadsticos para la investigacin 21 Dr. Ral Siche UNT
-
DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas
Pruebas Formales
Histograma de Frecuencias IQR/S Grficos de Probabilidad normal
Shapiro Wilk Kolmogorov Smirnov Test de DAgostino
N < 50 N > 50 N 10
Mtodos estadsticos para la investigacin 22 Dr. Ral Siche UNT
Ho = Los datos siguen una distribucin normal Ha = Los datos no siguen una distribucin normal
p 0.05 p < 0.05
-
DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas
Histograma de Frecuencias
Mtodos estadsticos para la investigacin 23 Dr. Ral Siche UNT
Analizar Estadsticos descriptivos Frecuencias Grficos Histograma con curva normal
Secuencia - SPSS
-
DISTRIBUCIN NORMAL
Pruebas de Normalidad de una muestra
Pruebas Grficas
Mtodos estadsticos para la investigacin 24 Dr. Ral Siche UNT
Secuencia SPSS Analizar
Estadsticos descriptivos
Explorar
Shapiro Wilk Kolmogorov Smirnov
N < 50 N > 50
Ho = Los datos siguen una distribucin normal Ha = Los datos no siguen una distribucin normal
p 0.05 p < 0.05
-
DISTRIBUCIN NORMAL
Pruebas Paramtricas
Pruebas No Paramtricas Transformacin
Prueba de Normalidad
S
No
S
No
Distribucin normal
Mtodos estadsticos para la investigacin 25 Dr. Ral Siche UNT
-
PRUEBAS PARAMTRICAS
Las PRUEBAS PARAMTRICAS, generalmente requieren para su uso, el SUPUESTO DE NORMALIDAD, es decir, que las muestras aleatorias se extraen de poblaciones que estn normalmente distribuidas, o aproximadamente normal.
Mtodos estadsticos para la investigacin 26 Dr. Ral Siche UNT
-
PRUEBAS NO PARAMTRICAS
Las PRUEBAS NO PARAMTRICAS, son mtodos que no suponen nada acerca de la distribucin poblacin muestreada, por eso tambin a los mtodos de la estadstica no paramtrica se le llama de distribucin libre. Estos mtodos se basan ms en el anlisis de los rangos de los datos que en las propias observaciones.
Mtodos estadsticos para la investigacin 27 Dr. Ral Siche UNT
-
PRUEBAS ESTADSTICAS
Mann Whitney
(Independientes)
Pruebas No Paramtricas
Prueba de Normalidad
Datos del Experimento
Distribucin Normal Sin Distribucin Normal
Shapiro Wilk n < 50
Kolmogorov Smirnov n 50
Test de DAgostino n 10
Transformacin
Pruebas Paramtricas
2 muestras k muestras
Test de
Tamhane
Kruskal Walis
(Independientes)
Wilcoxon
(Relacionadas)
Test de Friedman
(Relacionadas)
Comparacin de medias Test de Homogeneidad de
Varianzas Test de Levene
Duncan y/o
Tuckey
Transformacin
1 muestra
Prueba T
Kruskal Walis
Test de Friedman
Si los datos vienen de muestras
transformadas, se debe
continuar con estos datos hasta
el final del anlisis estadstico.
Si al menos un trat. es
diferente
2 muestras
Prueb T
(Relacionada)
Prueb T
(Independ.)
Kruskal Walis
Test de Friedman
Si al menos un tratamiento es diferente
2 muestras
Varianzas
iguales
k muestras
ANOVA
(1 Factor)
K muestras
Varianzas
distintas
Mtodos estadsticos para la investigacin 28 Dr. Ral Siche UNT
-
PRUEBAS PARAMTRICAS
PRUEBA T
Es la Prueba Paramtrica ms poderosa que existe para determinar diferencia entre dos poblaciones ( tratamientos), sin embargo requiere que los datos pertenezcan a una DISTRIBUCIN NORMAL y que LAS VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para varianzas distintas).
ANOVA
Requiere una DISTRIBUCIN NORMAL MODERADA (ROBUSTA), sin embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o el Test de Friedman (No Paramtricas)
DUNCAN
Y/O TUCKEY
Pruebas de Comparaciones mltiples de medias, son robustas a la falta de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE VARIANZAS, caso contrario usar la Prueba Paramtrica de Tamhane.
TAMHANE
Pruebas Paramtrica de Comparaciones mltiples de medias, robusta a la falta de normalidad, no requiere que se cumpla la igualdad de varianzas.
Mtodos estadsticos para la investigacin 29 Dr. Ral Siche UNT
-
PRUEBAS NO PARAMTRICAS
WILCOXON
Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras relacionadas, por lo tanto requiere que los individuos sean los mismos en ambos tratamientos.
MANN WHITNEY
Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras independientes, por lo tanto NO requiere que los individuos sean los mismos en ambos tratamientos.
FRIEDMAN
Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuo deben haber sido los mismos en todos los tratamientos.
KRUSKAL
WALIS
Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuos no necesariamente deben haber sido los mismos en todos los tratamientos.
Mtodos estadsticos para la investigacin 30 Dr. Ral Siche UNT
-
PRUEBA T PARA 1 TRATAMIENTO
Mtodos estadsticos para la investigacin 31 Dr. Ral Siche UNT
Colormetro Konica Minolta Sistema de Visin Computacional
45 45 45 48 50 42.3 45.3 45 53.8 45.1
11 63 37 45 8 19.1 63.2 36.3 47.4 2.6
60 89 73 60 20 67.8 86.7 81 59.5 17.3
45 40 34 34 67 27.5 50 25.5 27 70
14 23 15 56 64 14.6 21 12.7 56 66.6
10 5 50 34 67 10.1 5.4 54.3 34 68.9
63 70 63 64 67 42.2 78.6 63 70.4 67.1
90 57 54 56 24 75 57 51.9 56.1 15.4
59 60 68 70 35 59 60 75.1 72.5 31.4
52 52 35 51 36 52 55.9 39.1 48.2 32.1
Determinar si el valor medio de la muestra puede ser 47
-
PRUEBA T PARA 2 TRATAMIENTOS
Mtodos estadsticos para la investigacin 32 Dr. Ral Siche UNT
Colormetro Konica Minolta Sistema de Visin Computacional
45 45 45 48 50 42.3 45.3 45 53.8 45.1
11 63 37 45 8 19.1 63.2 36.3 47.4 2.6
60 89 73 60 20 67.8 86.7 81 59.5 17.3
45 40 34 34 67 27.5 50 25.5 27 70
14 23 15 56 64 14.6 21 12.7 56 66.6
10 5 50 34 67 10.1 5.4 54.3 34 68.9
63 70 63 64 67 42.2 78.6 63 70.4 67.1
90 57 54 56 24 75 57 51.9 56.1 15.4
59 60 68 70 35 59 60 75.1 72.5 31.4
52 52 35 51 36 52 55.9 39.1 48.2 32.1
Determinar si existen (o no) diferencias estadsticas entre los valores de L obtenidos por el CKM y el SVC
-
PRUEBA T PARA 2 TRATAMIENTOS
Prueba de Homogeneidad de Varianzas Uno de los pasos previos a la comprobacin de si existen diferencias entre las medias de varias muestras es determinar si las varianzas en tales muestras son iguales (es decir, si se cumple la condicin de homogeneidad de varianzas), ya que de que se cumpla o no esta condicin depender la formulacin que empleemos en el contraste de medias.
Test de Levene
Valor p < 0.05 No se asume varianzas iguales
Valor p > 0.05 Se asume varianzas iguales
Mtodos estadsticos para la investigacin 33 Dr. Ral Siche
UNT
-
PRUEBA T PARA 2 TRATAMIENTOS
Prueba de Homogeneidad de Varianzas Test de Levene
Valor p < 0.05 No se asume varianzas iguales
Valor p > 0.05 Se asume varianzas iguales
Mtodos estadsticos para la investigacin 34 Dr. Ral Siche UNT
Prueba T Student Valor p < 0.05 Existen diferencias significativas Valor p > 0.05 No existen diferencias significativas
-
PRUEBA T PARA 2 TRATAMIENTOS
Mtodos estadsticos para la investigacin 35 Dr. Ral Siche UNT
Prueba T Student Valor p < 0.05 Existen diferencias significativas Valor p > 0.05 No existen diferencias significativas
No existen diferencias significativas entre los valores de L obtenidos con CKM en relacin a los valores de L obtenidos con el SVC