Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL...
Transcript of Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL...
![Page 1: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/1.jpg)
Capítulo
Resumir datos
numéricamente
(parte II)
© 2010 Pearson Prentice Hall. All rights reserved
3 3
![Page 2: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/2.jpg)
3-2 © 2010 Pearson Prentice Hall. All rights reserved
Si un conjunto de datos tiene una distribución
aproximadamente simétrica se pueden utilizar las
siguientes reglas prácticas para describir el conjunto de
datos. Este conjunto de reglas se conoce como la
Regla Empírica de la Estadística. • Aproximadamente 68% de los datos está a una
desviación estándar de la media. (dentro del intervalo
μ ± 𝜎 ó 𝑥 ± 𝑠) • Aproximadamente 95% de los datos está a dos
desviaciones estándares de la media. (dentro del
intervalo μ ± 2𝜎 ó 𝑥 ± 2𝑠) • Aproximadamente 99.7% de los datos está a dos
desviaciones estándares de la media. (dentro del
intervalo μ ± 3𝜎 ó 𝑥 ± 3𝑠)
La regla empírica
![Page 3: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/3.jpg)
3-3 © 2010 Pearson Prentice Hall. All rights reserved
![Page 4: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/4.jpg)
El siguiente conjunto de datos presenta el
colesterol HDL (total) de los 54 pacientes del
sexo femenino de un médico de familia.
41 48 43 38 35 37 44 44 44
62 75 77 58 82 39 85 55 54
67 69 69 70 65 72 74 74 74
60 60 60 61 62 63 64 64 64
54 54 55 56 56 56 57 58 59
45 47 47 48 48 50 52 52 53
3-4 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Usar la Regla Empírica
![Page 5: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/5.jpg)
(a) Determinar la media y la desviación estádar para la
población
(b) Construir un histograma para comprobar la forma
de los datos
(c) Determinar el porcentage de pacientes que tiene
HDL en suero entre 34 y 69 según la regla empírica.
(d) Determinar el porcentage de pacientes que tiene
verdaderamente el HDL en suero entre 34 y 69.
3-5 © 2010 Pearson Prentice Hall. All rights reserved
![Page 6: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/6.jpg)
Usando EXCEL encontramos que:
3-6 © 2010 Pearson Prentice Hall. All rights reserved
![Page 7: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/7.jpg)
22.3 34.0 45.7 57.4 69.1 80.8 92.5
3-7 © 2010 Pearson Prentice Hall. All rights reserved
![Page 8: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/8.jpg)
El k-ésimo percentil de un conjunto de datos, que se
denota, Pk, es el valor tal que k porciento de las
observaciones es menor o igual al valor.
3-8 © 2010 Pearson Prentice Hall. All rights reserved
Percentiles
![Page 9: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/9.jpg)
El Graduate Record Examination (GRE) es una prueba necesaria para
la admisión a muchas escuelas graduadas de Estados Unidos. La
Escuela Graduada de Salud Pública de la Universidad de Pittsburgh
requiere una puntuación en el GRE no menor que el percentil 70 para
la admisión en su program graduada de Genética Humana (Fuente:
http://www.publichealth.pitt.edu/interior.php?pageID=101.)
Interprete este requisito de admisión.
3-9 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO
![Page 10: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/10.jpg)
Los cuartiles dividen un conjunto de datos en cuartos o 4
partes iguales.
• El 1er cuartil, se denota Q1, separa el 25% inferior de los
datos del 75% superior. Por lo tanto, el 1er cuartil es
equivalente al percentil 25.
• El 2do cuartil, se denota Q2, separa el 50% inferior de los
datos del 50% superior. Por lo tanto, el 2do cuartil es
equivalente a la mediana.
• El 3er cuartil, se denota Q3, separa el 75% inferior de los
datos del 25% superior. Por lo tanto, el 3er cuartil es
equivalente al percentil 75.
3-10 © 2010 Pearson Prentice Hall. All rights reserved
Cuartiles
![Page 11: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/11.jpg)
3-11 © 2010 Pearson Prentice Hall. All rights reserved
Cuartiles - resumen
•Q2 es la mediana del conjunto completo.
•Q1 es la mediana de la mitad inferior del conjunto.
•Q3 es la mediana de la mitad superior del conjunto.
![Page 12: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/12.jpg)
Un grupo de estudiantes recolectó datos sobre la velocidad de
vehículos que viajan por una zona de construcción en una carretera
estatal, donde la velocidad máxima es 25 mph. La velocidad
registrada de 14 vehículos seleccionados al azar, es la siguiente:
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
Determinar e interpretar los cuartiles para la velocidad en la zona de
construcción.
3-12
EJEMPLO Determinar e interpretar los cuartiles
![Page 13: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/13.jpg)
Interpretación:
•
3-13 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Determinar e interpretar los cuartiles (cont.)
![Page 14: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/14.jpg)
3-14 © 2010 Pearson Prentice Hall. All rights reserved
El rango intercuartil, se denota IQR, es el rango del
50% central de los datos. Esto es la diferencia entre Q3 y Q1 .
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Rango intercuartil
![Page 15: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/15.jpg)
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
3-15 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Determinar e interpretar el rango intercuartil
para los datos sobre velocidad en la zona de construcción
![Page 16: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/16.jpg)
Suponer que se toma la velocidad de un 15to automovil que
atraviesa la zona de construcción y que su velocidad es 100 miles
por hora. ¿Qué impacto tiene sobre la media, mediana, desviación
estándar y rango intercuartil?
Con 14 autos Con 15 autos
Media 32.1 mph 36.7 mph
Mediana 32.5 mph 33 mph
Desviación estándar 6.2 mph 18.5 mph
IQR 10 mph 11 mph
3-16 © 2010 Pearson Prentice Hall. All rights reserved
Resumen: ¿Cuál medida debes reportar?
Forma de la distribución
Medida de tendencia central
Medida de dispersión
Simétrica Media Desviación estándar
Sesgado Media Rango intercuartil
![Page 17: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/17.jpg)
3-17 © 2010 Pearson Prentice Hall. All rights reserved
𝑥𝑖 se considera un valor extremo si:
• 𝑥𝑖 < 𝑄1 − 1.5(𝐼𝑄𝑅) ó
• 𝑥𝑖 > 𝑄3 + 1.5(𝐼𝑄𝑅)
donde
𝑄1 − 1.5(𝐼𝑄𝑅) es el límite inferior del conjunto y
𝑄3 + 1.5(𝐼𝑄𝑅) es el límite superior del conjunto
Valores Extremos
![Page 18: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/18.jpg)
Paso 1: Determinar Q1 y Q3
Q1 = 28 mph and Q3 = 38 mph.
Paso 2: Determinar IQR
IQR = 10 mph.
Paso 3: Calcular los límites
límite inferior= Q1 – 1.5(IQR) límite superior= Q3 + 1.5(IQR)
= 28 – 1.5(10) = 38 + 1.5(10)
= 13 mph = 53 mph
Paso 4: Ya que no hay valores menores que 13 mph o mayores
que 53 mph. El conjunto no tiene datos extremos.
3-18
EJEMPLO Determinar valores extremos en el conjunto de
velocidades en la zona de construcción
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
![Page 19: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/19.jpg)
3-19 © 2010 Pearson Prentice Hall. All rights reserved
Cinco valores que resumen un conjunto de datos
son:
Resumen de 5 valores
Mínimo 𝑸𝟏 M 𝑸𝟑 Máximo
Resumen de 5 valores
![Page 20: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/20.jpg)
Cada seis meses, la Junta de la Reserva Federal
de los Estados Unidos lleva a cabo un estudio de
los planes de tarjetas de crédito en los EE.UU. Los
datos siguientes son las tasas de interés cobradas
por los 10 emisores de tarjetas de crédito,
seleccionados al azar para la encuesta de julio de
2005.
Determine el resumen de cinco valores para los
datos que se muestran a continuación.
3-20 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Obtener un resumen de cinco valores
![Page 21: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/21.jpg)
Institución Taza
Pulaski Bank and Trust Company 6.5%
Rainier Pacific Savings Bank 12.0%
Wells Fargo Bank NA 14.4%
Firstbank of Colorado 14.4%
Lafayette Ambassador Bank 14.3%
Infibank 13.0%
United Bank, Inc. 13.3%
First National Bank of The Mid-Cities 13.9%
Bank of Louisiana 9.9%
Bar Harbor Bank and Trust Company 14.5%
Fuente:
http://www.federalreserve.gov/pubs/SHOP/survey.htm
3-21 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Obtener un resumen de cinco valores (cont.)
![Page 22: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/22.jpg)
3-22
Diagrama de caja
1. Determinar los extremos inferior y superior del diagrama. a) 𝑄1 − 1.5(𝐼𝑄𝑅) b) 𝑄3 + 1.5(𝐼𝑄𝑅) donde IQR = 𝑄3 − 𝑄1
2. Marcar los extremos encontrados en paso 1. 3. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea
vertical dentro de la caja en M. 3. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1
hasta el mínimo. 4. Cualquier valor menor que el extremo inferior o mayor que
el extremo superior se marca con * 5. Borrar extremos.
![Page 23: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/23.jpg)
Institución Taza
Pulaski Bank and Trust Company 6.5%
Rainier Pacific Savings Bank 12.0%
Wells Fargo Bank NA 14.4%
Firstbank of Colorado 14.4%
Lafayette Ambassador Bank 14.3%
Infibank 13.0%
United Bank, Inc. 13.3%
First National Bank of The Mid-Cities 13.9%
Bank of Louisiana 9.9%
Bar Harbor Bank and Trust Company 14.5%
Fuente:
http://www.federalreserve.gov/pubs/SHOP/survey.htm
Usando el resumen
de 5 valores:
Mínimo: 6.5%.
Máximo: 14.5%.
𝑄1 = 12.0%.
𝑄2 ó M = 13.6%.
𝑄3 = 14.4%.
3-23 © 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Construir un diagrama de caja y describir la
forma de la distribución de los datos.
![Page 24: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/24.jpg)
3-24 © 2010 Pearson Prentice Hall. All rights reserved
𝑄1 = 12.0%. M= 13.6%. 𝑄3 = 14.4% Mín: 6.5% Máx: 14.5%.
![Page 25: Capítulo 33 - · PDF fileEl siguiente conjunto de datos presenta el colesterol HDL (total) de los 54 pacientes del sexo femenino de un médico de familia. 41 48 43 38 35 37 44 44](https://reader031.fdocuments.in/reader031/viewer/2022030504/5ab16dea7f8b9a1d168ca055/html5/thumbnails/25.jpg)
3-25 © 2010 Pearson Prentice Hall. All rights reserved
Describir la forma de la distribución de los datos usando un diagrama de caja