Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL...

25
Capítulo Resumir datos numéricamente (parte II) © 2010 Pearson Prentice Hall. All rights reserved 3 3

Transcript of Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL...

Page 1: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Capítulo

Resumir datos

numéricamente

(parte II)

© 2010 Pearson Prentice Hall. All rights reserved

3 3

Page 2: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-2 © 2010 Pearson Prentice Hall. All rights reserved

Si un conjunto de datos tiene una distribución

aproximadamente simétrica se pueden utilizar las

siguientes reglas prácticas para describir el conjunto de

datos. Este conjunto de reglas se conoce como la

Regla Empírica de la Estadística. • Aproximadamente 68% de los datos está a una

desviación estándar de la media. (dentro del intervalo

μ ± 𝜎 ó 𝑥 ± 𝑠) • Aproximadamente 95% de los datos está a dos

desviaciones estándares de la media. (dentro del

intervalo μ ± 2𝜎 ó 𝑥 ± 2𝑠) • Aproximadamente 99.7% de los datos está a dos

desviaciones estándares de la media. (dentro del

intervalo μ ± 3𝜎 ó 𝑥 ± 3𝑠)

La regla empírica

Page 3: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-3 © 2010 Pearson Prentice Hall. All rights reserved

Page 4: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

El siguiente conjunto de datos presenta el

colesterol HDL (total) de los 54 pacientes del

sexo femenino de un médico de familia.

41 48 43 38 35 37 44 44 44

62 75 77 58 82 39 85 55 54

67 69 69 70 65 72 74 74 74

60 60 60 61 62 63 64 64 64

54 54 55 56 56 56 57 58 59

45 47 47 48 48 50 52 52 53

3-4 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Usar la Regla Empírica

Page 5: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

(a) Determinar la media y la desviación estádar para la

población

(b) Construir un histograma para comprobar la forma

de los datos

(c) Determinar el porcentage de pacientes que tiene

HDL en suero entre 34 y 69 según la regla empírica.

(d) Determinar el porcentage de pacientes que tiene

verdaderamente el HDL en suero entre 34 y 69.

3-5 © 2010 Pearson Prentice Hall. All rights reserved

Page 6: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Usando EXCEL encontramos que:

3-6 © 2010 Pearson Prentice Hall. All rights reserved

Page 7: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

22.3 34.0 45.7 57.4 69.1 80.8 92.5

3-7 © 2010 Pearson Prentice Hall. All rights reserved

Page 8: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

El k-ésimo percentil de un conjunto de datos, que se

denota, Pk, es el valor tal que k porciento de las

observaciones es menor o igual al valor.

3-8 © 2010 Pearson Prentice Hall. All rights reserved

Percentiles

Page 9: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

El Graduate Record Examination (GRE) es una prueba necesaria para

la admisión a muchas escuelas graduadas de Estados Unidos. La

Escuela Graduada de Salud Pública de la Universidad de Pittsburgh

requiere una puntuación en el GRE no menor que el percentil 70 para

la admisión en su program graduada de Genética Humana (Fuente:

http://www.publichealth.pitt.edu/interior.php?pageID=101.)

Interprete este requisito de admisión.

3-9 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO

Page 10: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Los cuartiles dividen un conjunto de datos en cuartos o 4

partes iguales.

• El 1er cuartil, se denota Q1, separa el 25% inferior de los

datos del 75% superior. Por lo tanto, el 1er cuartil es

equivalente al percentil 25.

• El 2do cuartil, se denota Q2, separa el 50% inferior de los

datos del 50% superior. Por lo tanto, el 2do cuartil es

equivalente a la mediana.

• El 3er cuartil, se denota Q3, separa el 75% inferior de los

datos del 25% superior. Por lo tanto, el 3er cuartil es

equivalente al percentil 75.

3-10 © 2010 Pearson Prentice Hall. All rights reserved

Cuartiles

Page 11: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-11 © 2010 Pearson Prentice Hall. All rights reserved

Cuartiles - resumen

•Q2 es la mediana del conjunto completo.

•Q1 es la mediana de la mitad inferior del conjunto.

•Q3 es la mediana de la mitad superior del conjunto.

Page 12: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Un grupo de estudiantes recolectó datos sobre la velocidad de

vehículos que viajan por una zona de construcción en una carretera

estatal, donde la velocidad máxima es 25 mph. La velocidad

registrada de 14 vehículos seleccionados al azar, es la siguiente:

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

Determinar e interpretar los cuartiles para la velocidad en la zona de

construcción.

3-12

EJEMPLO Determinar e interpretar los cuartiles

Page 13: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Interpretación:

3-13 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Determinar e interpretar los cuartiles (cont.)

Page 14: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-14 © 2010 Pearson Prentice Hall. All rights reserved

El rango intercuartil, se denota IQR, es el rango del

50% central de los datos. Esto es la diferencia entre Q3 y Q1 .

𝐼𝑄𝑅 = 𝑄3 − 𝑄1

Rango intercuartil

Page 15: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

3-15 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Determinar e interpretar el rango intercuartil

para los datos sobre velocidad en la zona de construcción

Page 16: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Suponer que se toma la velocidad de un 15to automovil que

atraviesa la zona de construcción y que su velocidad es 100 miles

por hora. ¿Qué impacto tiene sobre la media, mediana, desviación

estándar y rango intercuartil?

Con 14 autos Con 15 autos

Media 32.1 mph 36.7 mph

Mediana 32.5 mph 33 mph

Desviación estándar 6.2 mph 18.5 mph

IQR 10 mph 11 mph

3-16 © 2010 Pearson Prentice Hall. All rights reserved

Resumen: ¿Cuál medida debes reportar?

Forma de la distribución

Medida de tendencia central

Medida de dispersión

Simétrica Media Desviación estándar

Sesgado Media Rango intercuartil

Page 17: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-17 © 2010 Pearson Prentice Hall. All rights reserved

𝑥𝑖 se considera un valor extremo si:

• 𝑥𝑖 < 𝑄1 − 1.5(𝐼𝑄𝑅) ó

• 𝑥𝑖 > 𝑄3 + 1.5(𝐼𝑄𝑅)

donde

𝑄1 − 1.5(𝐼𝑄𝑅) es el límite inferior del conjunto y

𝑄3 + 1.5(𝐼𝑄𝑅) es el límite superior del conjunto

Valores Extremos

Page 18: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Paso 1: Determinar Q1 y Q3

Q1 = 28 mph and Q3 = 38 mph.

Paso 2: Determinar IQR

IQR = 10 mph.

Paso 3: Calcular los límites

límite inferior= Q1 – 1.5(IQR) límite superior= Q3 + 1.5(IQR)

= 28 – 1.5(10) = 38 + 1.5(10)

= 13 mph = 53 mph

Paso 4: Ya que no hay valores menores que 13 mph o mayores

que 53 mph. El conjunto no tiene datos extremos.

3-18

EJEMPLO Determinar valores extremos en el conjunto de

velocidades en la zona de construcción

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

Page 19: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-19 © 2010 Pearson Prentice Hall. All rights reserved

Cinco valores que resumen un conjunto de datos

son:

Resumen de 5 valores

Mínimo 𝑸𝟏 M 𝑸𝟑 Máximo

Resumen de 5 valores

Page 20: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Cada seis meses, la Junta de la Reserva Federal

de los Estados Unidos lleva a cabo un estudio de

los planes de tarjetas de crédito en los EE.UU. Los

datos siguientes son las tasas de interés cobradas

por los 10 emisores de tarjetas de crédito,

seleccionados al azar para la encuesta de julio de

2005.

Determine el resumen de cinco valores para los

datos que se muestran a continuación.

3-20 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Obtener un resumen de cinco valores

Page 21: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Institución Taza

Pulaski Bank and Trust Company 6.5%

Rainier Pacific Savings Bank 12.0%

Wells Fargo Bank NA 14.4%

Firstbank of Colorado 14.4%

Lafayette Ambassador Bank 14.3%

Infibank 13.0%

United Bank, Inc. 13.3%

First National Bank of The Mid-Cities 13.9%

Bank of Louisiana 9.9%

Bar Harbor Bank and Trust Company 14.5%

Fuente:

http://www.federalreserve.gov/pubs/SHOP/survey.htm

3-21 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Obtener un resumen de cinco valores (cont.)

Page 22: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-22

Diagrama de caja

1. Determinar los extremos inferior y superior del diagrama. a) 𝑄1 − 1.5(𝐼𝑄𝑅) b) 𝑄3 + 1.5(𝐼𝑄𝑅) donde IQR = 𝑄3 − 𝑄1

2. Marcar los extremos encontrados en paso 1. 3. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea

vertical dentro de la caja en M. 3. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1

hasta el mínimo. 4. Cualquier valor menor que el extremo inferior o mayor que

el extremo superior se marca con * 5. Borrar extremos.

Page 23: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

Institución Taza

Pulaski Bank and Trust Company 6.5%

Rainier Pacific Savings Bank 12.0%

Wells Fargo Bank NA 14.4%

Firstbank of Colorado 14.4%

Lafayette Ambassador Bank 14.3%

Infibank 13.0%

United Bank, Inc. 13.3%

First National Bank of The Mid-Cities 13.9%

Bank of Louisiana 9.9%

Bar Harbor Bank and Trust Company 14.5%

Fuente:

http://www.federalreserve.gov/pubs/SHOP/survey.htm

Usando el resumen

de 5 valores:

Mínimo: 6.5%.

Máximo: 14.5%.

𝑄1 = 12.0%.

𝑄2 ó M = 13.6%.

𝑄3 = 14.4%.

3-23 © 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Construir un diagrama de caja y describir la

forma de la distribución de los datos.

Page 24: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-24 © 2010 Pearson Prentice Hall. All rights reserved

𝑄1 = 12.0%. M= 13.6%. 𝑄3 = 14.4% Mín: 6.5% Máx: 14.5%.

Page 25: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44

3-25 © 2010 Pearson Prentice Hall. All rights reserved

Describir la forma de la distribución de los datos usando un diagrama de caja