Estadística 1

39
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013 INTRODUCCION A LA ESTADISTICA MSc. Washington Rodríguez Nov - 2013 1 © MSc. Washington Rodríguez Nov-2013

description

Contenido de generalidades acerca de: Estadística Descriptiva Probabilidad Distribución de Probabilidad

Transcript of Estadística 1

Page 1: Estadística 1

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

INTRODUCCION A LA

ESTADISTICA

MSc. Washington Rodríguez

Nov - 2013

1

© MSc. Washington Rodríguez Nov-2013

Page 2: Estadística 1

Introducción

La Estadística, es la rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como la toma de decisiones.

Nos permite obtener información referida a grandes grupos de individuos conociendo los datos de sólo unos pocos.

Permite describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos.

La Estadística responde a las necesidades del desarrollo científico y tecnológico de la sociedad

2

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 3: Estadística 1

Aplicaciones de la estadística

Investigación de mercados

Control de Calidad

Análisis de confiabilidad

Cálculo actuarial

Bioestadística

Pronósticos

Análisis de decisión

3

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 4: Estadística 1

La estadística está asociada a la medición de la Incertidumbre

En las operaciones la incertidumbre está presente de muchas formas:

Demanda

Tiempos de entrega de los pedidos

Costos de la materia prima

Costo del dinero

Eficiencia de los empleados

Generalmente ante la incertidumbre sobre el comportamiento futuro de una variable se deben aumentar las medidas de protección de aquello que pueda resultar afectado por los cambios imprevisibles de esta variable.

Por ejemplo en la gestión de inventarios, el responsable logístico deberá aumentar las existencias a medida que la demanda se hace mas imprevisible. En otras palabras, la incertidumbre se paga, ¡es un costo!, y por tanto debe ser bien investigada y medida.

4

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Estadística = Medida de lo desconocido

Page 5: Estadística 1

• Específicamente la Gestión de la Cadena de Suministro (SCM)

tiene como objetivo final la entrega de un producto a un cliente. Esto

quiere decir, que la cadena de suministro incluye las actividades

asociadas desde la obtención de materiales para la transformación

del producto, hasta su colocación en el mercado.

• El flujo en la cadena no solo es de productos, también es de

información, la cual tiene generalmente asociada incertidumbre.

5

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 6: Estadística 1

6

Todos los elementos

objetos de estudio

Subconjunto de la

población

PARAMETROS

ESTIMADORES

MUESTRA

POBLACION

Estadística descriptiva

Estadística inferencial

Estadística descriptiva

Las técnicas estadísticas básicas suelen clasificarse de acuerdo a su

naturaleza en:

•Estadística descriptiva, y

•Estadística inferencial.

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 7: Estadística 1

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

DESCRIPCIÓN DE DATOS

Escalas de medida

7

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 8: Estadística 1

Escalas de medida

• El primer paso para poder hacer cualquier análisis

estadístico es la obtención de los datos. El proceso estadístico por medio del cual se toma datos de una población se denomina muestreo, el conjunto de datos obtenido se denomina muestra.

• La data está conformada por las mediciones de

características de los elementos de la población, dichas características se denominan variables.

• Las variables difieren en "qué tan bien" se pueden medir,

¿cuánta información medible puede proporcionar su escala de medida?

• Específicamente las variables son clasificadas como: (a) nominales, (b) ordinales, (c) de escala

8

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 9: Estadística 1

Variables nominales

Se utilizan nombres para establecer categorías

Ejemplos:

• Género: M y F,

• Color: A, B, N, etc.

• Ciudad: UIO

• Tipo artículo: Bebidas, Cereal

9

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 10: Estadística 1

Variables ordinales

Permiten ordenar los artículos que medimos en términos

del que tiene menos y el que tiene más de la calidad

representada por la variable

Ejemplos:

• Nivel socio-económico

• Rango

• Nivel educativo

• Nivel de incidencia

10

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 11: Estadística 1

Variables de escala

• Permiten ordenar, cuantificar y comparar los artículos

que son medidos, así como identificar diferencias entre

ellos.

Ejemplos:

• Temperatura

• Peso

• Estatura

• Ventas.

11

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 12: Estadística 1

Base de datos

Creación de la base de datos electrónica

• El software estadístico especializado (SPSS, SAS, S-PLUS, R, MINITAB, STATISTICA, etc.) requiere un ordenamiento del archivo de datos a analizar. Este ordenamiento está referido a filas y a columnas

• Cuando hablamos de casos nos referimos a cada uno de los registros obtenidos al investigar, muestrear, entrevistar, etc.

• Con variables indicamos a las características que pueden tener estos datos

12

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 13: Estadística 1

Minitab

13

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 14: Estadística 1

Variables a medir

• Género del entrevistado

• Edad

• Ingresos mensuales Promedio

• Estado civil

• Posee vehículo

• Posee vivienda propia

• Periódico preferido para leer noticias

• Etc

14

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 15: Estadística 1

Medidas

• De tendencia central: Permiten describir la región “media”

hacia adonde se agrupan los datos

Probablemente la estadística descriptiva mas usada es la

media. La media es una medida muy informativa de la

tendencia “central” de la variable si se reporta con sus

intervalos de confianza. Otras son: la moda, la mediana.

• De dispersión: Son una medida de que tan dispersos están

los datos (que tan lejanos están entre ellos).

Desviación típica, varianza, coeficiente de variación, rango.

15

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 16: Estadística 1

Descripción de datos: medidas

• Media: ( o Ӯ) mas usada

• Desviación típica: ( o S ) depende de la magnitud de la variable. No puede tener la misma medida de incertidumbre la venta de un producto cuya venta media sea de 10 unidades mensuales que otro cuya venta media sea de 10.000 unidades mensuales.

• Coeficiente de variación: /, Que tan predecible es una variable en el futuro.

16

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 17: Estadística 1

Continuación..

Algunas conclusiones que se pueden observar de este caso simple:

• El coeficiente de variación es más sensible para detectar la variabilidad de una serie de datos

• Cuánto menor es la venta de un producto, suele ser mayor su incertidumbre ( y por tanto proporcionalmente requerirán más inventario)

• Cuando se agregan datos, la incertidumbre del total agregado disminuye (por tanto es mas fácil pronosticar sobre la demanda de grupos de productos)

17

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 18: Estadística 1

Descripción de datos: gráficas

• Un aspecto importante de la "descripción" de una

variable es la forma de su distribución, que le dice la

frecuencia de valores de rangos diferentes de la

variable.

• HISTOGRAMAS 2D, 3D: representación gráfica de la

distribución de frecuencia de la(s) variable(s)

seleccionada(s)

• Otros gráficos

18

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 19: Estadística 1

Descripción de datos: gráficas

19

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 20: Estadística 1

Análisis de un caso

• Realice un análisis exploratorio de datos con la base de

datos de trabajo.

20

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 21: Estadística 1

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

LA PROBABILIDAD

1. Definiciones

2. Variables aleatorias

1. Discretas

2. Contínuas

21

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 22: Estadística 1

La Probabilidad

• Experimento aleatorio: Es un proceso en el cual el resultado

es incierto, pero se conoce el conjunto de posibles resultados

del mismo (denominado espacio muestral, )

• Evento: cualquier subconjunto del espacio muestral.

• Si el experimento aleatorio se repite n veces, en las mismas

condiciones, la frecuencia con la que un evento A ocurre es el

número de veces que el experimento aleatorio resulta en A.

• La frecuencia relativa de A es la frecuencia con la que ocurre A

sobre el número total de repeticiones.

22

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 23: Estadística 1

Cálculo de la probabilidad

• Cuando un experimento aleatorio tiene un espacio muestral

finito, es a veces posible suponer que cada evento elemental

(conjunto unitario) es igualmente probable, es decir:

• Y en ese caso la probabilidad de que ocurra un evento A se

puede calcular como el número de elementos de A sobre el

número de elementos de

1 2, ,...,

1; 1,2,...,

N

i

w w w

P w i NN

N AP A

N

23

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 24: Estadística 1

Ejemplo

• Considere el lanzamiento de tres dados. Si se elige un

número, encuentre la probabilidad de los siguientes eventos:

• A: Que el número aparezca en los tres dados

• B: Que el número aparezca en dos de los tres dados

• C: Que el número aparezca en uno de los tres dados

• Sugerencia: Utilice una hoja electrónica para encontrar

todos los resultados posibles.

24

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 25: Estadística 1

Técnicas de conteo

¿Cómo contar el número de elementos de un conjunto?

Si el conjunto tiene muchos elementos son útiles las

siguientes técnicas de conteo:

PRINCIPIO DE MULTIPLICACION (El orden es importante)

Si una tarea T1 puede realizarse de n1 maneras distintas,

Si una tarea T2 puede realizarse de n2 maneras distintas, …

… Si una tarea Tk puede realizarse de nk maneras distintas,

Entonces el número de formas en que todas las tareas

pueden ser efectuadas, una tras otra es:

n1·n2· …· nk

25

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 26: Estadística 1

Continuación..

Como contar el número de elementos de un

conjunto?

COMBINACIONES (el orden no es importante)

El número de maneras en que se pueden escoger k

objetos de un grupo de n objetos (es decir el número

de subconjuntos de k elementos seleccionados de un

grupo de n elementos) es:

!

! !

n n

k k n k

26

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 27: Estadística 1

Ejemplo

1. Una heladería tiene cinco sabores de helado: banana,

chocolate, limón, fresa y vainilla. Los clientes

pueden elegir entre dos sabores. ¿Cuántas

posibilidades de combinaciones?

2. Una llave de combinación como el de la figura permite

elegir tres dígitos de entre 9. ¿De cuántas maneras

podemos elegir una combinación segura sin

repetición?

27

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 28: Estadística 1

Variables Aleatorias

Variable aleatoria es la descripción numérica del resultado de un

experimento

28

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Experimento Variable aleatoria (x) Valores posibles

para la variable

aleatoria

Realizar 100 llamadas

de ventas

Cantidad total de

ventas logradas

0,1,2,…,100

Inspeccionar un

contenedor de 100

TVs

Cantidad de TVs

defectuosos

0,1,2,…,100

Abrir un restaurante Cantidad de clientes

que entran en un día

0,1,2,…

Page 29: Estadística 1

Variables Aleatorias

• Es necesario definir una regla que pueda usarse para asignar un valor

numérico a cada resultado experimental. Por ejemplo si consideramos

el experimento de lanzar una moneda.

• Podríamos asignar x = 1 si el resultado es una cara y x = 0 si el

resultado es cruz.

• Matemáticamente se puede representar de la siguiente forma:

𝑋: Ω → ℝ 𝜔 → 𝑋 𝜔

29

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Espacio muestral Ω Variable aleatoria X

Cara 1

Cruz 0

Page 30: Estadística 1

Variables aleatorias discretas

• Supongamos que un concesionario de autos según sus registros

históricos ha vendido como máximo 5 autos en un día. Si

consideramos a x como la variable aleatoria que denota la cantidad

de autos que se venden por día, es razonable suponer que en el

futuro la variable x tomara los valores 0, 1, 2, 3, 4, 5.

• Los valores posibles para la variable aleatoria x son finitos, por

tanto diremos que la variable aleatoria es discreta.

30

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 31: Estadística 1

Distribución de probabilidad

• Según los datos históricos

del concesionario en un año

se laboraron 300 días. La

tabla resume el

comportamiento de la

variable aleatoria x

• El método de la frecuencia

relativa sirve como una

estimación razonable de la

probabilidad para la variable

x.

Volumen de

ventas

Número de días

Sin ventas 54

un automóvil 117

Dos automóviles 72

Tres automóviles 42

Cuatro automoviles 12

Cinco automoviles 3

Total 300

31

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 32: Estadística 1

Distribución de probabilidad

• La función de probabilidad

f(x) se calcula dividiendo la

frecuencia observada para el

total de observaciones.

• La tabla muestra los valores

estimados para la

probabilidad de que x tome

un valor específico.

x Número de días

0 0.18

1 0.39

2 0.24

3 0.14

4 0.04

5 0.01

Total 1

32

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

0 1 2 3 4 5

Page 33: Estadística 1

Propiedades

En la elaboración de una distribución de probabilidad discreta

siempre deben satisfacerse las siguientes propiedades

1. 𝑝(𝑥) ≥ 0 (No existen probabilidades negativas)

2. 𝑝 𝑥 = 1𝑥

La sumatoria de las probabilidades debe ser igual a 1

33

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 34: Estadística 1

Valor esperado y Varianza

Generalmente una vez que tenemos la distribución de probabilidad

necesitamos encontrar la media o valor esperado de la variable

aleatoria y la varianza

El valor esperado es el promedio ponderado de todos los valores

posibles de la variable aleatoria.

1. 𝐸 𝑥 = 𝜇 = 𝑥𝑓(𝑥)

La varianza de una variable aleatoria nos da la medida de la

dispersión de los datos, su expresión matemática es:

𝑉𝑎𝑟 𝑥 = 𝜎2 = (𝑥 − 𝜇)2𝑓(𝑥)

34

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 35: Estadística 1

Ejemplo

Para el caso del concesionario encontrar la media y la varianza para

la variable aleatoria x.

35

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

x f(x) (x-u)^2 f(x)*(x-u)^2

0 0.18 2.25 0.4050

1 0.39 0.25 0.0975

2 0.24 0.25 0.0600

3 0.14 2.25 0.3150

4 0.04 6.25 0.2500

5 0.01 12.25 0.1225

media 1.50

varianza 1.25

Page 36: Estadística 1

Variables aleatorias continuas

Son variables que pueden tomar valores en un intervalo o colección

de intervalos. Son el resultado de mediciones, así por ejemplo:

1. El peso promedio de los niños de primer grado

2. La cantidad real de Coca Cola embotellada en un envase de 3

litros

3. El número de horas de funcionamiento de una lámpara

incandescente

4. El tiempo entre las llegas de un cliente a otro en un cajero

automático durante 1 hora

36

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 37: Estadística 1

37

Distribución de probabilidad

En el caso de variables aleatorias continuas no existen probabilidades

puntuales como en el caso discreto. Aquí se habla de probabilidad de

intervalos y se interpreta como el área bajo la curva. Se representa a la

distribución de probabilidad o función de densidad como f(x):

b

a

P a X b f x dx

f (x)

Page 38: Estadística 1

Propiedades

• Las distribución de probabilidad de variables aleatorias

continuas debe cumplir con las siguientes propiedades :

1. 𝑓 𝑥 ≥ 0

2. 𝑓 𝑥 𝑑 𝑥 = 1+∞

−∞

• La última propiedad implica que el área bajo la curva en

todo el dominio de la variable aleatoria x debe ser igual a 1.

38

© MSc. Washington Rodríguez Curso Propedéutico Nov-2013

Page 39: Estadística 1

Función de distribución acumulada

Variables aleatorias discretas.

F(x)=P(X ≤ x)= 𝑝(𝑥)𝑥−∞

Variables aleatorias continuas

39

F (x)

x © MSc. Washington Rodríguez Curso Propedéutico Nov-2013

𝐹 𝑥 = 𝑓 𝑥 𝑑𝑥𝑥

−∞