Clase 2 - Experimentos con 1 y 2 tratamientos.pdf

35
Experimentos con uno y dos tratamientos Dr. Raúl Benito Siche Jara 1 Curso: Métodos Estadísticos para la Investigación ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL UNIVERSIDAD NACIONAL DE TRUJILLO

Transcript of Clase 2 - Experimentos con 1 y 2 tratamientos.pdf

  • Experimentos con uno y dos tratamientos

    Dr. Ral Benito Siche Jara

    1

    Curso: Mtodos Estadsticos para la Investigacin

    ESCUELA ACADMICO PROFESIONAL DE INGENIERIA AGROINDUSTRIAL

    UNIVERSIDAD NACIONAL DE TRUJILLO

  • Factor: Variable (Independiente) que manipula el

    investigador para estudiar sus efectos sobre la

    variable dependiente.

    Nivel del Factor: es cada una de las categoras,

    valores o formas especficas del factor.

    Tratamientos: Conjunto de condiciones experi-

    mentales que sern impuestas a una unidad

    experimental en un diseo elegido. En experimentos

    unifactoriales, un tratamiento corresponde a un nivel

    de factor. En experimentos multifactoriales, un

    tratamiento corresponde a la combinacin de niveles

    de factores.

    Mtodos estadsticos para la investigacin 2 Dr. Ral Siche UNT

    DEFINICIONES

  • Tratamiento Control: tratamiento al que no se le

    aplica tratamiento alguno.

    Rplicas: corridas experimentales que corresponden a una misma combinacin de tratamientos. Son repeticiones del experimento bajo idnticas condicio-nes de los factores. Objetivos: Lograr mayor precisin en la estimacin de los efectos de los factores y de sus interacciones, y estimar el error experimental.

    Mtodos estadsticos para la investigacin 3 Dr. Ral Siche UNT

    DEFINICIONES

  • INFERENCIA ESTADISTICA

    Mtodos estadsticos para la investigacin 4 Dr. Ral Siche UNT

    PARMETROS

    (Siempre desconocidos)

    ESTADSTICOS (conocidos)

    ALE

    ATO

    RIA

    Representativa

  • MEDIDAS DE TENDENCIA

    Mtodos estadsticos para la investigacin 5 Dr. Ral Siche UNT

    Si tuvieramos que resumir en un slo valor representativo todo el conjunto de observaciones,

    qu valor usamos?

  • MEDIDAS DE TENDENCIA

    Media

    Mtodos estadsticos para la investigacin 6 Dr. Ral Siche UNT

    La media (media aritmtica o promedio) es el valor caracterstico de una serie de datos cuantitativos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral. Una de las limitaciones de la media es que es una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.

  • MEDIDAS DE TENDENCIA

    Moda

    Mtodos estadsticos para la investigacin 7 Dr. Ral Siche UNT

    Valor o clase de valores que se observa con mayor frecuencia en la muestra.

    Puede no existir o no ser nico.

    Funciona para cualquier tipo de dato: categricos, ordinales numricos.

  • MEDIDAS DE TENDENCIA

    Mediana

    Mtodos estadsticos para la investigacin 8 Dr. Ral Siche UNT

    Valor que divide el rango de valores observados en dos mitades con el mismo nmero de observaciones. Su cmputo requiere ordenar la muestra. Si n (n de observaciones) es impar: Me = Si n es par: Me = Ejemplo: 2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par)

    Me = (7+8)/2 = 7,5

    2

    XX 1(n/2)n/2

    2

    1nX

  • MEDIDAS DE TENDENCIA

    Mtodos estadsticos para la investigacin 9 Dr. Ral Siche UNT

    Robustez de la Media versus la Mediana La media es extremadamente sensible a situaciones en que hay valores numricamente muy distantes del resto (outliers) La mediana en cambio permite obtener valores ms representativos en estos casos Ejemplo: 1, 2, 2, 2, 3, 9

  • MEDIDAS DE TENDENCIA

    Mtodos estadsticos para la investigacin 10 Dr. Ral Siche UNT

    Robustez de la Media versus la Mediana

    0,0000

    0,0500

    0,1000

    0,1500

    0,2000

    0,2500

    0,3000

    0,3500

    0,4000

    0,4500

    0,5000

    4 5 6 7 0 1 2 3

    Q1 Q2 Q3 Q4

    Moda

    Media Aritmtica

    Mediana

    Rango

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 11 Dr. Ral Siche UNT

    Cmo damos cuenta de la variabilidad del conjunto de observaciones? Podemos medir las diferencias observadas con respecto a nuestras medidas de tendencia

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 12 Dr. Ral Siche UNT

    Varianza

    s2 : Variancia Muestral x : Media Aritmtica xi : i-simo valor observado n : Tamao Muestra

    n

    ii xx

    ns

    1

    22 )(1

    Promedio de las diferencias al cuadrado con respecto a la media.

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 13 Dr. Ral Siche UNT

    Desviacin estndar

    Raz cuadrada de la varianza.

    Tiene las mismas unidades de medida que las observaciones de la muestra

    n

    ii xx

    ns

    1

    2)(1

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 14 Dr. Ral Siche UNT

    Asimetra

    ndice de asimetra de Pearson

    s

    x

    X MoA

    s

    Est basado en la relacin entre la media y la moda en distribuciones simtricas y asimtricas:

    Si la distribucin es simtrica As ser 0 Si la distribucin es asimtrica positiva, As ser mayor que 0 Si la distribucin es asimtrica negativa, As ser menor que 0

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 15 Dr. Ral Siche UNT

    Curtosis

    Hace referencia al apuntamiento de la distribucin en relacin a un estndar, que es la distribucin normal.

    4

    1

    4

    ( )

    3

    n

    i

    ir

    x

    X X n

    Cs

    Si la distribucin es normal (mesocrtica), el ndice vale 0

    Si la distribucin es leptocrtica, el ndice es superior a 0

    Si la distribucin es platicrtica, el ndice es inferior a 0

  • MEDIDAS DE DISPERSIN

    Mtodos estadsticos para la investigacin 16 Dr. Ral Siche UNT

    Curtosis

    Distribucin normal (estndar): Distribucin Mesocrtica

    Si la distribucin es ms apuntada que la distribucin normal: Distribucin Leptocrtica

    Si la distribucin es ms achatada que la distribucin normal: Distribucin platicrtica.

  • EJEMPLO

    Mtodos estadsticos para la investigacin 17 Dr. Ral Siche UNT

    Colormetro Konica Minolta Sistema de Visin Computacional 45 45 45 48 50 42.3 45.3 45 53.8 45.1 11 63 37 45 8 19.1 63.2 36.3 47.4 2.6 60 89 73 60 20 67.8 86.7 81 59.5 17.3 45 40 34 34 67 27.5 50 25.5 27 70 14 23 15 56 64 14.6 21 12.7 56 66.6 10 5 50 34 67 10.1 5.4 54.3 34 68.9 63 70 63 64 67 42.2 78.6 63 70.4 67.1 90 57 54 56 24 75 57 51.9 56.1 15.4 59 60 68 70 35 59 60 75.1 72.5 31.4 52 52 35 51 36 52 55.9 39.1 48.2 32.1

    En la siguiente tabla se muestran valores del parmetro de color L (Luminosidad) medidas en 50 rodajas de yacn utilizando Colormetro Konica Minolta (CKM) y Sistema de Visin Computacional (SVC):

  • EJEMPLO

    Mtodos estadsticos para la investigacin 18 Dr. Ral Siche UNT

    Estadsticos

    50 50

    0 0

    47.6600 47.1600

    50.5000 50.9500

    45.00 2.60a

    20.37466 21.64382

    415.127 468.455

    -.341 -.327

    .337 .337

    -.310 -.790

    .662 .662

    5.00 2.60

    90.00 86.70

    Vlidos

    Perdidos

    N

    Media

    Mediana

    Moda

    Desv. tp.

    Varianza

    Asimetra

    Error tp. de asimetra

    Curtosis

    Error tp. de curtos is

    Mnimo

    Mximo

    CKM SVC

    Existen varias modas. Se mostrar el menor de los valores.a.

    Analizar Estadsticos descriptivos Frecuencias

    Secuencia - SPSS

  • Formulacin de la Hiptesis de nulidad Paso 1

    Formulacin de la Hiptesis alternativa Paso 2

    Estadstico de la prueba y nivel de significacin Paso 3

    Clculo del valor emprico del estadstico de la prueba

    Paso 4

    Decisin estadstica de aceptar o rechazar la hiptesis nula

    Rechazo de H0 Si p 0,05

    Paso 5

    PRUEBA ESTADSTICA: PASOS

    Mtodos estadsticos para la investigacin 19 Dr. Ral Siche UNT

  • DISTRIBUCIN DE PROBABILIDAD

    Es una descripcin del conjunto de valores posibles de X, con la probabilidad asociada a cada uno de estos valores.

    Importancia

    Modela los posibles valores de un estadstico muestral, con lo que al observar un estadstico se puede corroborar o rechazar supuestos (prueba de hiptesis).

    Mtodos estadsticos para la investigacin 20 Dr. Ral Siche UNT

  • DISTRIBUCIN DE PROBABILIDAD

    Mtodos estadsticos para la investigacin 21 Dr. Ral Siche UNT

  • DISTRIBUCIN NORMAL

    Pruebas de Normalidad de una muestra

    Pruebas Grficas

    Pruebas Formales

    Histograma de Frecuencias IQR/S Grficos de Probabilidad normal

    Shapiro Wilk Kolmogorov Smirnov Test de DAgostino

    N < 50 N > 50 N 10

    Mtodos estadsticos para la investigacin 22 Dr. Ral Siche UNT

    Ho = Los datos siguen una distribucin normal Ha = Los datos no siguen una distribucin normal

    p 0.05 p < 0.05

  • DISTRIBUCIN NORMAL

    Pruebas de Normalidad de una muestra

    Pruebas Grficas

    Histograma de Frecuencias

    Mtodos estadsticos para la investigacin 23 Dr. Ral Siche UNT

    Analizar Estadsticos descriptivos Frecuencias Grficos Histograma con curva normal

    Secuencia - SPSS

  • DISTRIBUCIN NORMAL

    Pruebas de Normalidad de una muestra

    Pruebas Grficas

    Mtodos estadsticos para la investigacin 24 Dr. Ral Siche UNT

    Secuencia SPSS Analizar

    Estadsticos descriptivos

    Explorar

    Shapiro Wilk Kolmogorov Smirnov

    N < 50 N > 50

    Ho = Los datos siguen una distribucin normal Ha = Los datos no siguen una distribucin normal

    p 0.05 p < 0.05

  • DISTRIBUCIN NORMAL

    Pruebas Paramtricas

    Pruebas No Paramtricas Transformacin

    Prueba de Normalidad

    S

    No

    S

    No

    Distribucin normal

    Mtodos estadsticos para la investigacin 25 Dr. Ral Siche UNT

  • PRUEBAS PARAMTRICAS

    Las PRUEBAS PARAMTRICAS, generalmente requieren para su uso, el SUPUESTO DE NORMALIDAD, es decir, que las muestras aleatorias se extraen de poblaciones que estn normalmente distribuidas, o aproximadamente normal.

    Mtodos estadsticos para la investigacin 26 Dr. Ral Siche UNT

  • PRUEBAS NO PARAMTRICAS

    Las PRUEBAS NO PARAMTRICAS, son mtodos que no suponen nada acerca de la distribucin poblacin muestreada, por eso tambin a los mtodos de la estadstica no paramtrica se le llama de distribucin libre. Estos mtodos se basan ms en el anlisis de los rangos de los datos que en las propias observaciones.

    Mtodos estadsticos para la investigacin 27 Dr. Ral Siche UNT

  • PRUEBAS ESTADSTICAS

    Mann Whitney

    (Independientes)

    Pruebas No Paramtricas

    Prueba de Normalidad

    Datos del Experimento

    Distribucin Normal Sin Distribucin Normal

    Shapiro Wilk n < 50

    Kolmogorov Smirnov n 50

    Test de DAgostino n 10

    Transformacin

    Pruebas Paramtricas

    2 muestras k muestras

    Test de

    Tamhane

    Kruskal Walis

    (Independientes)

    Wilcoxon

    (Relacionadas)

    Test de Friedman

    (Relacionadas)

    Comparacin de medias Test de Homogeneidad de

    Varianzas Test de Levene

    Duncan y/o

    Tuckey

    Transformacin

    1 muestra

    Prueba T

    Kruskal Walis

    Test de Friedman

    Si los datos vienen de muestras

    transformadas, se debe

    continuar con estos datos hasta

    el final del anlisis estadstico.

    Si al menos un trat. es

    diferente

    2 muestras

    Prueb T

    (Relacionada)

    Prueb T

    (Independ.)

    Kruskal Walis

    Test de Friedman

    Si al menos un tratamiento es diferente

    2 muestras

    Varianzas

    iguales

    k muestras

    ANOVA

    (1 Factor)

    K muestras

    Varianzas

    distintas

    Mtodos estadsticos para la investigacin 28 Dr. Ral Siche UNT

  • PRUEBAS PARAMTRICAS

    PRUEBA T

    Es la Prueba Paramtrica ms poderosa que existe para determinar diferencia entre dos poblaciones ( tratamientos), sin embargo requiere que los datos pertenezcan a una DISTRIBUCIN NORMAL y que LAS VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para varianzas distintas).

    ANOVA

    Requiere una DISTRIBUCIN NORMAL MODERADA (ROBUSTA), sin embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o el Test de Friedman (No Paramtricas)

    DUNCAN

    Y/O TUCKEY

    Pruebas de Comparaciones mltiples de medias, son robustas a la falta de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE VARIANZAS, caso contrario usar la Prueba Paramtrica de Tamhane.

    TAMHANE

    Pruebas Paramtrica de Comparaciones mltiples de medias, robusta a la falta de normalidad, no requiere que se cumpla la igualdad de varianzas.

    Mtodos estadsticos para la investigacin 29 Dr. Ral Siche UNT

  • PRUEBAS NO PARAMTRICAS

    WILCOXON

    Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras relacionadas, por lo tanto requiere que los individuos sean los mismos en ambos tratamientos.

    MANN WHITNEY

    Prueba No Paramtrica, cuya finalidad es la misma que la Prueba T para muestras independientes, por lo tanto NO requiere que los individuos sean los mismos en ambos tratamientos.

    FRIEDMAN

    Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuo deben haber sido los mismos en todos los tratamientos.

    KRUSKAL

    WALIS

    Prueba de Comparacin de medias para ms de 2 poblaciones (tratamientos), cuyos individuos no necesariamente deben haber sido los mismos en todos los tratamientos.

    Mtodos estadsticos para la investigacin 30 Dr. Ral Siche UNT

  • PRUEBA T PARA 1 TRATAMIENTO

    Mtodos estadsticos para la investigacin 31 Dr. Ral Siche UNT

    Colormetro Konica Minolta Sistema de Visin Computacional

    45 45 45 48 50 42.3 45.3 45 53.8 45.1

    11 63 37 45 8 19.1 63.2 36.3 47.4 2.6

    60 89 73 60 20 67.8 86.7 81 59.5 17.3

    45 40 34 34 67 27.5 50 25.5 27 70

    14 23 15 56 64 14.6 21 12.7 56 66.6

    10 5 50 34 67 10.1 5.4 54.3 34 68.9

    63 70 63 64 67 42.2 78.6 63 70.4 67.1

    90 57 54 56 24 75 57 51.9 56.1 15.4

    59 60 68 70 35 59 60 75.1 72.5 31.4

    52 52 35 51 36 52 55.9 39.1 48.2 32.1

    Determinar si el valor medio de la muestra puede ser 47

  • PRUEBA T PARA 2 TRATAMIENTOS

    Mtodos estadsticos para la investigacin 32 Dr. Ral Siche UNT

    Colormetro Konica Minolta Sistema de Visin Computacional

    45 45 45 48 50 42.3 45.3 45 53.8 45.1

    11 63 37 45 8 19.1 63.2 36.3 47.4 2.6

    60 89 73 60 20 67.8 86.7 81 59.5 17.3

    45 40 34 34 67 27.5 50 25.5 27 70

    14 23 15 56 64 14.6 21 12.7 56 66.6

    10 5 50 34 67 10.1 5.4 54.3 34 68.9

    63 70 63 64 67 42.2 78.6 63 70.4 67.1

    90 57 54 56 24 75 57 51.9 56.1 15.4

    59 60 68 70 35 59 60 75.1 72.5 31.4

    52 52 35 51 36 52 55.9 39.1 48.2 32.1

    Determinar si existen (o no) diferencias estadsticas entre los valores de L obtenidos por el CKM y el SVC

  • PRUEBA T PARA 2 TRATAMIENTOS

    Prueba de Homogeneidad de Varianzas Uno de los pasos previos a la comprobacin de si existen diferencias entre las medias de varias muestras es determinar si las varianzas en tales muestras son iguales (es decir, si se cumple la condicin de homogeneidad de varianzas), ya que de que se cumpla o no esta condicin depender la formulacin que empleemos en el contraste de medias.

    Test de Levene

    Valor p < 0.05 No se asume varianzas iguales

    Valor p > 0.05 Se asume varianzas iguales

    Mtodos estadsticos para la investigacin 33 Dr. Ral Siche

    UNT

  • PRUEBA T PARA 2 TRATAMIENTOS

    Prueba de Homogeneidad de Varianzas Test de Levene

    Valor p < 0.05 No se asume varianzas iguales

    Valor p > 0.05 Se asume varianzas iguales

    Mtodos estadsticos para la investigacin 34 Dr. Ral Siche UNT

    Prueba T Student Valor p < 0.05 Existen diferencias significativas Valor p > 0.05 No existen diferencias significativas

  • PRUEBA T PARA 2 TRATAMIENTOS

    Mtodos estadsticos para la investigacin 35 Dr. Ral Siche UNT

    Prueba T Student Valor p < 0.05 Existen diferencias significativas Valor p > 0.05 No existen diferencias significativas

    No existen diferencias significativas entre los valores de L obtenidos con CKM en relacin a los valores de L obtenidos con el SVC