Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

35
Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA

Transcript of Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Page 1: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística

PROGRAMA DE DOCTORADO EN SALUD PÚBLICA

Page 2: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Contactos

Mirko Zimic Jefe de la Unidad de Bioinformática y Biología Computacional, Facultad de Ciencias, UPCH

3190000 anexo 2604

[email protected]@gmail.com

http://www.upch.edu.pe/facien/dbmbqf/docentes.htm

http://www.abeperu.net/

Page 3: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Summarizing

The ‘randomness’ of a random variable resides on:

- The variability of the initial conditions- The dynamical instability- The perturbation suffered during a

measurement

Page 4: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Important Conclusion:

Determinism and Random Behavior are not actually divorced, but they are connected through the Dynamical Equations. Therefore, Random Behavior is a consequence of determinism under special conditions

Page 5: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Clasificación general:

Categórica Cuantitativa o numérica

Nominal Ordinal Discreta Continua

Page 6: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Las variables continuas

El carácter continuo de una variable lo da la naturaleza intrínseca del observable físico y es independiente de la manera cómo se mida (i.e. del instrumento utilizado) ó de la manera cómo se reporte la medición

Page 7: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Efecto de la manera ‘cómo se mide’ una variable

Imaginemos que medimos la induración del PPD en varios pacientes, y para ello utilizamos una regla milimetrada. Las dimensiones medidas para diferentes personas fueron:5mm, 12mm, 9mm, 32mm, 21mm

Aparentemente estamos frente a una variable discreta, aunque en realidad la induración (longitud) es y debe tratarse de manera continua.

Page 8: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Categorización/discretización:

Las variables continuas pueden ser convertida en variables discretas y hasta en categóricas

En este proceso se pierde información (precisión)

La información debe obtenerse al mayor nivel de precisión posible y luego agruparse si fuera necesario (discretización)

Page 9: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Perfil de la distribución

Describe cómo los Datos están Distribuídos Caracterización del perfil de la

distribución: Simétrica o sesgada

Page 10: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Recordemos las características de una variable continua con distribución normal…

Figure 10.10

66

Page 11: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Dos bases de datos hipotéticas… Es importante tener una imagen visual de la distribución de la variable

La media provee una buena representación de los valores en la base de datos.

Datos de baja variabilidad

Datos con alta variabilidad

La media ya NO provee ahora una buena información de los datos comosucedía anterioremente

Al incrementar datos la distribución cambia..

Page 12: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

El Teorema del Límite Central da validez a los intervalos de confianza

La media de una muestra “grande” de datos de cualquier tipo sigue una distribución normal

Esto aún se cumple para datos binomiales (sexo, prevalencia, sensibilidad, etc)

Qué es una muestra grande? Eso varía según cada tipo de dato (entre otras cosas)

A medida que el tamaño de muestra crece, la distribución de la media muestral se hace más normal

Page 13: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

AN ILLUSTRATION OF THECENTRAL LIMIT THEOREM

13

Page 14: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Continuous Models on the Line

Normal Logistic Cauchy Laplace Student Non-central Student

Page 15: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Normal Distribution

Mean= 0 SD = 0.5, 1, 2

Page 16: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Logistic distribution

Mean=0 SD=0.5, 1

Page 17: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Student distribution

Degrees of freedom= 1,10,100

Page 18: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Laplace distribution

Mean=0

SD=0.5, 1, 5

Page 19: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Continuous Models on the Half Line Exponential Gama Chi-square Non central Chi-square F Non central F Weibull

Page 20: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Exponential distribution

Scale parameter = 0.5, 1, 2

Page 21: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Chi-square distribution

Degrees of freedom = 3, 5, 10,15

Page 22: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

F distribution

Degrees of freedom =

(3,3), (10,10), (30,30)

Page 23: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Continuous Models on a Finite Interval Beta Uniform

Page 24: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Uniform distribution

P = 1/3

Page 25: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Beta distribution

Parameters:

(2,15), (5,15), (15,5)

Page 26: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Discrete Models

Binomial Poisson Negative Binomal Uniform

Page 27: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Binomial distribution

N=10 P= 0.2, 0.5, 0.8

Page 28: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Poisson distribution

Intensity parameter =

1, 3, 7

Page 29: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Negative Binomial

P N

0.5 10

0.4 3

0.4 6

Page 30: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Distribuciones sesgadas

Page 31: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Perfil de la distribución (skewness coefficient)

Describe cómo los Datos están Distribuídos Caracterización del perfil de la

distribución: Simétrica o sesgada

Page 32: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Perfil de la distribución Describe cómo los Datos están Distribuídos Caracterización del perfil de la distribución: Simétrica o sesgada

Sesgada izquierda SimétricaMean = Median = ModeMean Median Mode

Page 33: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Perfil de la distribución

Describe cómo los Datos están Distribuídos Caracterización del perfil de la distribución: Simétrica o sesgada

Sesgada derechaSesgada izquierda SimétricaMedia = Mediana = ModaMedia Mediana Moda Mediana MediaModa

Page 34: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Análisis de OUTLIERS:

Datos sesgados:

Valores que se exceden de 3 rangos intercuartiles por debajo del primer cuartil Q1 o por encima del tercer cuartil (Q3) (percentiles 25 y 75 respectivamente)

Sesgada izquierda Sesgada Positiva

Q1 – 3(Q3 – Q1)Q1 Q3 Q1 Q3 Q3 + 3(Q3 – Q1)

outlier region outlier

region

Page 35: Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA.

Bioestadística Aplicada

Uso de la Teoría de Propagación Errores

Se aplica cuando tenemos una o muy pocas mediciones y deseamos presentar un rango de variabilidad en nuestras conclusiones