Grafica de probabilidad normal

26

Transcript of Grafica de probabilidad normal

Distribuciones continuas

MSc Edgar Madrid Cuello

Departamento de Matemática, UNISUCREEstadística I

2016

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 1 / 16

Distribución normal

De�nición (Grá�cas de probabilidad normal)

Una grá�ca de probabilidad normal es una grá�ca estadística especial que

se utiliza para evaluar la normalidad. algunos autores la presentan para

evaluar la no normalidad

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 2 / 16

Distribución normal

De�nición (Grá�cas de probabilidad normal)

Una grá�ca de probabilidad normal es una grá�ca estadística especial que

se utiliza para evaluar la normalidad. algunos autores la presentan para

evaluar la no normalidad

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 2 / 16

Ejemplo

Las alturas (en pulgadas) de una muestra de , 11 mujeres, es:

61 62.5 63 64 64.5 65 66.5 67 68 68.5 70.5

hist(alturas, freq=F, xlab="Altura",right = F,

col=terrain.colors(6, alpha = 1), main=" ")

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 3 / 16

Ejemplo

Las alturas (en pulgadas) de una muestra de , 11 mujeres, es:

61 62.5 63 64 64.5 65 66.5 67 68 68.5 70.5

hist(alturas, freq=F, xlab="Altura",right = F,

col=terrain.colors(6, alpha = 1), main=" ")

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 3 / 16

Altura

Den

sity

60 62 64 66 68 70 72

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

Figure: Histograma de las alturas de la muestra

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 4 / 16

Altura

Den

sity

60 65 70

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

Figure: Histograma con la curva de la distribución normal superpuesta

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 5 / 16

curve(dnorm(x,65.5,2.9), add=T, lwd=2)

Es difícil examinar, a simple vista un histograma y decidir si tiene formaacampanada o no, para esto se ha desarrollado una grá�ca visualmente massimple, la grá�ca de la probabilidad normal. Una grá�ca de probabilidad

normal es un diagrama de dispersión, de datos esperados1 vs datosobservados, si los datos provienen de una distribución, no muy alejada de lanormal, los puntos de esta grá�ca deberían ajustarse a un segmento de lalínea recta f(x) = x, que es mucho más fácil de reconocer que la forma decampana del histograma.

1los valores que habría que esperar si la población fuera normalMSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16

curve(dnorm(x,65.5,2.9), add=T, lwd=2)

Es difícil examinar, a simple vista un histograma y decidir si tiene formaacampanada o no, para esto se ha desarrollado una grá�ca visualmente massimple, la grá�ca de la probabilidad normal. Una grá�ca de probabilidad

normal es un diagrama de dispersión, de datos esperados1 vs datosobservados, si los datos provienen de una distribución, no muy alejada de lanormal, los puntos de esta grá�ca deberían ajustarse a un segmento de lalínea recta f(x) = x, que es mucho más fácil de reconocer que la forma decampana del histograma.

1los valores que habría que esperar si la población fuera normalMSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16

curve(dnorm(x,65.5,2.9), add=T, lwd=2)

Es difícil examinar, a simple vista un histograma y decidir si tiene formaacampanada o no, para esto se ha desarrollado una grá�ca visualmente massimple, la grá�ca de la probabilidad normal. Una grá�ca de probabilidad

normal es un diagrama de dispersión, de datos esperados1 vs datosobservados, si los datos provienen de una distribución, no muy alejada de lanormal, los puntos de esta grá�ca deberían ajustarse a un segmento de lalínea recta f(x) = x, que es mucho más fácil de reconocer que la forma decampana del histograma.

1los valores que habría que esperar si la población fuera normalMSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16

curve(dnorm(x,65.5,2.9), add=T, lwd=2)

Es difícil examinar, a simple vista un histograma y decidir si tiene formaacampanada o no, para esto se ha desarrollado una grá�ca visualmente massimple, la grá�ca de la probabilidad normal. Una grá�ca de probabilidad

normal es un diagrama de dispersión, de datos esperados1 vs datosobservados, si los datos provienen de una distribución, no muy alejada de lanormal, los puntos de esta grá�ca deberían ajustarse a un segmento de lalínea recta f(x) = x, que es mucho más fácil de reconocer que la forma decampana del histograma.

1los valores que habría que esperar si la población fuera normalMSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16

Se comparan los valores reales observados de las alturas de mujeres queesperaríamos ver si los datos provinieran de una población normal.Porejemplo, la mujer más baja de nuestra muestra tiene una altura de 61pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61pulgadas o menos. Si las alturas de las mujeres siguieran realmente unadistribución normal, de media 65,5 y la desviación típica 2,9. entonces sepuede esperar que el percentil 9,09 seaµ+ Z1−0.09091σ = 65, 5− 1, 34× 2, 9, o 61.6 pulgadas.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16

Se comparan los valores reales observados de las alturas de mujeres queesperaríamos ver si los datos provinieran de una población normal.Porejemplo, la mujer más baja de nuestra muestra tiene una altura de 61pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61pulgadas o menos. Si las alturas de las mujeres siguieran realmente unadistribución normal, de media 65,5 y la desviación típica 2,9. entonces sepuede esperar que el percentil 9,09 seaµ+ Z1−0.09091σ = 65, 5− 1, 34× 2, 9, o 61.6 pulgadas.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16

Se comparan los valores reales observados de las alturas de mujeres queesperaríamos ver si los datos provinieran de una población normal.Porejemplo, la mujer más baja de nuestra muestra tiene una altura de 61pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61pulgadas o menos. Si las alturas de las mujeres siguieran realmente unadistribución normal, de media 65,5 y la desviación típica 2,9. entonces sepuede esperar que el percentil 9,09 seaµ+ Z1−0.09091σ = 65, 5− 1, 34× 2, 9, o 61.6 pulgadas.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16

Este valor es cercano al valor observado de 61 pulgadas. Podríamos repetireste tipo de cálculo para cada uno de los 11 valores de los datosobservados. Una grá�ca de probabilidad normal proporciona unacomparación visual de estos valores.El primer paso para crear una grá�ca de probabilidad normal, por tanto, escalcular los percentiles muéstrales. El siguiente ejemplo presenta la formade realizar este cálculo, que en general es realizado por los paquetes desoftware estadístico.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 8 / 16

Este valor es cercano al valor observado de 61 pulgadas. Podríamos repetireste tipo de cálculo para cada uno de los 11 valores de los datosobservados. Una grá�ca de probabilidad normal proporciona unacomparación visual de estos valores.El primer paso para crear una grá�ca de probabilidad normal, por tanto, escalcular los percentiles muéstrales. El siguiente ejemplo presenta la formade realizar este cálculo, que en general es realizado por los paquetes desoftware estadístico.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 8 / 16

Ejemplo (Altura de 11 mujeres)

Cálculo de índices y percentiles de las alturas de 11 mujeres

i 1 2 3 4 5 6 7 8 9 10 11

Altura Observada 61 62.5 63 64 64.5 65 66.5 67 68 68.5 70.5

Percentil ajustado 100(i− 0.5)/11 86.36

z 1.10

Altura teórica 68.7

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 9 / 16

Toma de decisiones sobre normalidad.

Si los puntos de una grá�ca de probabilidad normal no están más o menosa lo largo de una línea recta, esto es una indicación de que los datos noprovienen de una población normal. Por ejemplo, si la parte alta de lagrá�ca se curva, esto signi�ca que los valores de x en el extremo superiorde la distribución son demasiado grandes para que la distribución tengaforma de campana. Es decir, la distribución está sesgada hacia la derecha otiene outliers grandes, como se muestra en la Figura

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 10 / 16

Toma de decisiones sobre normalidad.

Si los puntos de una grá�ca de probabilidad normal no están más o menosa lo largo de una línea recta, esto es una indicación de que los datos noprovienen de una población normal. Por ejemplo, si la parte alta de lagrá�ca se curva, esto signi�ca que los valores de x en el extremo superiorde la distribución son demasiado grandes para que la distribución tengaforma de campana. Es decir, la distribución está sesgada hacia la derecha otiene outliers grandes, como se muestra en la Figura

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 10 / 16

Figure: �gura 3

1.png

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 11 / 16

Si la parte baja de la grá�ca se curva hacia abajo, esto signi�ca que losvalores de x en el extremo inferior de la distribución son demasiadopequeños para que la distribución tenga forma de campana. Es decir, ladistribución esta sesgada hacia la izquierda o tiene outliers pequeños. LaFigura 4 presenta la distribución del contenido de humedad en la fruta aguadulce del Ejemplo 4.4.2. que está fuertemente sesgada hacia la izquierda.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 12 / 16

Si la parte baja de la grá�ca se curva hacia abajo, esto signi�ca que losvalores de x en el extremo inferior de la distribución son demasiadopequeños para que la distribución tenga forma de campana. Es decir, ladistribución esta sesgada hacia la izquierda o tiene outliers pequeños. LaFigura 4 presenta la distribución del contenido de humedad en la fruta aguadulce del Ejemplo 4.4.2. que está fuertemente sesgada hacia la izquierda.

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 12 / 16

2.png

Figure: �gura 4

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 13 / 16

Si la distribución tiene una cola muy larga hacia la izquierda y una colalarga hacia la derecha, al compararla con la curva normal la grá�ca deprobabilidad normal tendrá una forma parecida a una S. La Figura 5muestra una distribución de ese tipo.

5.png

Figure: 5. Histograma y grá�ca de probabilidad normal de una distribución que

tiene colas largas

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 14 / 16

Algunas veces un mismo valor aparece repetidamente en una muestra,debido al redondeo del proceso de medida. Esto produce una granularidaden la grá�ca de probabilidad normal, como la Figura 6, pero esto no evitaque sigamos deduciendo que la distribución subyacente es normal.

6.png

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 15 / 16

@BookFEC1,author = Myra L. Samuels, Je�rey A. Witmer, Andew A.Scha�ner, editor = PEARSON EDUCACION, S.A., title = Fundamentosde Estadistica para las Ciencias de la Vida, publisher = 4a edicion, year =2012, volume = 1, OPTaddress = Madrid, pages134-145

MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 16 / 16