© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
INTRODUCCION A LA
ESTADISTICA
MSc. Washington Rodríguez
Nov - 2013
1
© MSc. Washington Rodríguez Nov-2013
Introducción
La Estadística, es la rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como la toma de decisiones.
Nos permite obtener información referida a grandes grupos de individuos conociendo los datos de sólo unos pocos.
Permite describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos.
La Estadística responde a las necesidades del desarrollo científico y tecnológico de la sociedad
2
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Aplicaciones de la estadística
Investigación de mercados
Control de Calidad
Análisis de confiabilidad
Cálculo actuarial
Bioestadística
Pronósticos
Análisis de decisión
3
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
La estadística está asociada a la medición de la Incertidumbre
En las operaciones la incertidumbre está presente de muchas formas:
Demanda
Tiempos de entrega de los pedidos
Costos de la materia prima
Costo del dinero
Eficiencia de los empleados
Generalmente ante la incertidumbre sobre el comportamiento futuro de una variable se deben aumentar las medidas de protección de aquello que pueda resultar afectado por los cambios imprevisibles de esta variable.
Por ejemplo en la gestión de inventarios, el responsable logístico deberá aumentar las existencias a medida que la demanda se hace mas imprevisible. En otras palabras, la incertidumbre se paga, ¡es un costo!, y por tanto debe ser bien investigada y medida.
4
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Estadística = Medida de lo desconocido
• Específicamente la Gestión de la Cadena de Suministro (SCM)
tiene como objetivo final la entrega de un producto a un cliente. Esto
quiere decir, que la cadena de suministro incluye las actividades
asociadas desde la obtención de materiales para la transformación
del producto, hasta su colocación en el mercado.
• El flujo en la cadena no solo es de productos, también es de
información, la cual tiene generalmente asociada incertidumbre.
5
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
6
Todos los elementos
objetos de estudio
Subconjunto de la
población
PARAMETROS
ESTIMADORES
MUESTRA
POBLACION
Estadística descriptiva
Estadística inferencial
Estadística descriptiva
Las técnicas estadísticas básicas suelen clasificarse de acuerdo a su
naturaleza en:
•Estadística descriptiva, y
•Estadística inferencial.
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
DESCRIPCIÓN DE DATOS
Escalas de medida
7
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Escalas de medida
• El primer paso para poder hacer cualquier análisis
estadístico es la obtención de los datos. El proceso estadístico por medio del cual se toma datos de una población se denomina muestreo, el conjunto de datos obtenido se denomina muestra.
• La data está conformada por las mediciones de
características de los elementos de la población, dichas características se denominan variables.
• Las variables difieren en "qué tan bien" se pueden medir,
¿cuánta información medible puede proporcionar su escala de medida?
• Específicamente las variables son clasificadas como: (a) nominales, (b) ordinales, (c) de escala
8
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Variables nominales
Se utilizan nombres para establecer categorías
Ejemplos:
• Género: M y F,
• Color: A, B, N, etc.
• Ciudad: UIO
• Tipo artículo: Bebidas, Cereal
9
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Variables ordinales
Permiten ordenar los artículos que medimos en términos
del que tiene menos y el que tiene más de la calidad
representada por la variable
Ejemplos:
• Nivel socio-económico
• Rango
• Nivel educativo
• Nivel de incidencia
10
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Variables de escala
• Permiten ordenar, cuantificar y comparar los artículos
que son medidos, así como identificar diferencias entre
ellos.
Ejemplos:
• Temperatura
• Peso
• Estatura
• Ventas.
11
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Base de datos
Creación de la base de datos electrónica
• El software estadístico especializado (SPSS, SAS, S-PLUS, R, MINITAB, STATISTICA, etc.) requiere un ordenamiento del archivo de datos a analizar. Este ordenamiento está referido a filas y a columnas
• Cuando hablamos de casos nos referimos a cada uno de los registros obtenidos al investigar, muestrear, entrevistar, etc.
• Con variables indicamos a las características que pueden tener estos datos
12
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Minitab
13
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Variables a medir
• Género del entrevistado
• Edad
• Ingresos mensuales Promedio
• Estado civil
• Posee vehículo
• Posee vivienda propia
• Periódico preferido para leer noticias
• Etc
14
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Medidas
• De tendencia central: Permiten describir la región “media”
hacia adonde se agrupan los datos
Probablemente la estadística descriptiva mas usada es la
media. La media es una medida muy informativa de la
tendencia “central” de la variable si se reporta con sus
intervalos de confianza. Otras son: la moda, la mediana.
• De dispersión: Son una medida de que tan dispersos están
los datos (que tan lejanos están entre ellos).
Desviación típica, varianza, coeficiente de variación, rango.
15
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Descripción de datos: medidas
• Media: ( o Ӯ) mas usada
• Desviación típica: ( o S ) depende de la magnitud de la variable. No puede tener la misma medida de incertidumbre la venta de un producto cuya venta media sea de 10 unidades mensuales que otro cuya venta media sea de 10.000 unidades mensuales.
• Coeficiente de variación: /, Que tan predecible es una variable en el futuro.
16
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Continuación..
Algunas conclusiones que se pueden observar de este caso simple:
• El coeficiente de variación es más sensible para detectar la variabilidad de una serie de datos
• Cuánto menor es la venta de un producto, suele ser mayor su incertidumbre ( y por tanto proporcionalmente requerirán más inventario)
• Cuando se agregan datos, la incertidumbre del total agregado disminuye (por tanto es mas fácil pronosticar sobre la demanda de grupos de productos)
17
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Descripción de datos: gráficas
• Un aspecto importante de la "descripción" de una
variable es la forma de su distribución, que le dice la
frecuencia de valores de rangos diferentes de la
variable.
• HISTOGRAMAS 2D, 3D: representación gráfica de la
distribución de frecuencia de la(s) variable(s)
seleccionada(s)
• Otros gráficos
18
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Descripción de datos: gráficas
19
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Análisis de un caso
• Realice un análisis exploratorio de datos con la base de
datos de trabajo.
20
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
LA PROBABILIDAD
1. Definiciones
2. Variables aleatorias
1. Discretas
2. Contínuas
21
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
La Probabilidad
• Experimento aleatorio: Es un proceso en el cual el resultado
es incierto, pero se conoce el conjunto de posibles resultados
del mismo (denominado espacio muestral, )
• Evento: cualquier subconjunto del espacio muestral.
• Si el experimento aleatorio se repite n veces, en las mismas
condiciones, la frecuencia con la que un evento A ocurre es el
número de veces que el experimento aleatorio resulta en A.
• La frecuencia relativa de A es la frecuencia con la que ocurre A
sobre el número total de repeticiones.
22
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Cálculo de la probabilidad
• Cuando un experimento aleatorio tiene un espacio muestral
finito, es a veces posible suponer que cada evento elemental
(conjunto unitario) es igualmente probable, es decir:
• Y en ese caso la probabilidad de que ocurra un evento A se
puede calcular como el número de elementos de A sobre el
número de elementos de
1 2, ,...,
1; 1,2,...,
N
i
w w w
P w i NN
N AP A
N
23
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Ejemplo
• Considere el lanzamiento de tres dados. Si se elige un
número, encuentre la probabilidad de los siguientes eventos:
• A: Que el número aparezca en los tres dados
• B: Que el número aparezca en dos de los tres dados
• C: Que el número aparezca en uno de los tres dados
• Sugerencia: Utilice una hoja electrónica para encontrar
todos los resultados posibles.
24
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Técnicas de conteo
¿Cómo contar el número de elementos de un conjunto?
Si el conjunto tiene muchos elementos son útiles las
siguientes técnicas de conteo:
PRINCIPIO DE MULTIPLICACION (El orden es importante)
Si una tarea T1 puede realizarse de n1 maneras distintas,
Si una tarea T2 puede realizarse de n2 maneras distintas, …
… Si una tarea Tk puede realizarse de nk maneras distintas,
Entonces el número de formas en que todas las tareas
pueden ser efectuadas, una tras otra es:
n1·n2· …· nk
25
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Continuación..
Como contar el número de elementos de un
conjunto?
COMBINACIONES (el orden no es importante)
El número de maneras en que se pueden escoger k
objetos de un grupo de n objetos (es decir el número
de subconjuntos de k elementos seleccionados de un
grupo de n elementos) es:
!
! !
n n
k k n k
26
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Ejemplo
1. Una heladería tiene cinco sabores de helado: banana,
chocolate, limón, fresa y vainilla. Los clientes
pueden elegir entre dos sabores. ¿Cuántas
posibilidades de combinaciones?
2. Una llave de combinación como el de la figura permite
elegir tres dígitos de entre 9. ¿De cuántas maneras
podemos elegir una combinación segura sin
repetición?
27
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Variables Aleatorias
Variable aleatoria es la descripción numérica del resultado de un
experimento
28
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Experimento Variable aleatoria (x) Valores posibles
para la variable
aleatoria
Realizar 100 llamadas
de ventas
Cantidad total de
ventas logradas
0,1,2,…,100
Inspeccionar un
contenedor de 100
TVs
Cantidad de TVs
defectuosos
0,1,2,…,100
Abrir un restaurante Cantidad de clientes
que entran en un día
0,1,2,…
Variables Aleatorias
• Es necesario definir una regla que pueda usarse para asignar un valor
numérico a cada resultado experimental. Por ejemplo si consideramos
el experimento de lanzar una moneda.
• Podríamos asignar x = 1 si el resultado es una cara y x = 0 si el
resultado es cruz.
• Matemáticamente se puede representar de la siguiente forma:
𝑋: Ω → ℝ 𝜔 → 𝑋 𝜔
29
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Espacio muestral Ω Variable aleatoria X
Cara 1
Cruz 0
Variables aleatorias discretas
• Supongamos que un concesionario de autos según sus registros
históricos ha vendido como máximo 5 autos en un día. Si
consideramos a x como la variable aleatoria que denota la cantidad
de autos que se venden por día, es razonable suponer que en el
futuro la variable x tomara los valores 0, 1, 2, 3, 4, 5.
• Los valores posibles para la variable aleatoria x son finitos, por
tanto diremos que la variable aleatoria es discreta.
30
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Distribución de probabilidad
• Según los datos históricos
del concesionario en un año
se laboraron 300 días. La
tabla resume el
comportamiento de la
variable aleatoria x
• El método de la frecuencia
relativa sirve como una
estimación razonable de la
probabilidad para la variable
x.
Volumen de
ventas
Número de días
Sin ventas 54
un automóvil 117
Dos automóviles 72
Tres automóviles 42
Cuatro automoviles 12
Cinco automoviles 3
Total 300
31
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Distribución de probabilidad
• La función de probabilidad
f(x) se calcula dividiendo la
frecuencia observada para el
total de observaciones.
• La tabla muestra los valores
estimados para la
probabilidad de que x tome
un valor específico.
x Número de días
0 0.18
1 0.39
2 0.24
3 0.14
4 0.04
5 0.01
Total 1
32
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
0 1 2 3 4 5
Propiedades
En la elaboración de una distribución de probabilidad discreta
siempre deben satisfacerse las siguientes propiedades
1. 𝑝(𝑥) ≥ 0 (No existen probabilidades negativas)
2. 𝑝 𝑥 = 1𝑥
La sumatoria de las probabilidades debe ser igual a 1
33
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Valor esperado y Varianza
Generalmente una vez que tenemos la distribución de probabilidad
necesitamos encontrar la media o valor esperado de la variable
aleatoria y la varianza
El valor esperado es el promedio ponderado de todos los valores
posibles de la variable aleatoria.
1. 𝐸 𝑥 = 𝜇 = 𝑥𝑓(𝑥)
La varianza de una variable aleatoria nos da la medida de la
dispersión de los datos, su expresión matemática es:
𝑉𝑎𝑟 𝑥 = 𝜎2 = (𝑥 − 𝜇)2𝑓(𝑥)
34
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Ejemplo
Para el caso del concesionario encontrar la media y la varianza para
la variable aleatoria x.
35
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
x f(x) (x-u)^2 f(x)*(x-u)^2
0 0.18 2.25 0.4050
1 0.39 0.25 0.0975
2 0.24 0.25 0.0600
3 0.14 2.25 0.3150
4 0.04 6.25 0.2500
5 0.01 12.25 0.1225
media 1.50
varianza 1.25
Variables aleatorias continuas
Son variables que pueden tomar valores en un intervalo o colección
de intervalos. Son el resultado de mediciones, así por ejemplo:
1. El peso promedio de los niños de primer grado
2. La cantidad real de Coca Cola embotellada en un envase de 3
litros
3. El número de horas de funcionamiento de una lámpara
incandescente
4. El tiempo entre las llegas de un cliente a otro en un cajero
automático durante 1 hora
36
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
37
Distribución de probabilidad
En el caso de variables aleatorias continuas no existen probabilidades
puntuales como en el caso discreto. Aquí se habla de probabilidad de
intervalos y se interpreta como el área bajo la curva. Se representa a la
distribución de probabilidad o función de densidad como f(x):
b
a
P a X b f x dx
f (x)
Propiedades
• Las distribución de probabilidad de variables aleatorias
continuas debe cumplir con las siguientes propiedades :
1. 𝑓 𝑥 ≥ 0
2. 𝑓 𝑥 𝑑 𝑥 = 1+∞
−∞
• La última propiedad implica que el área bajo la curva en
todo el dominio de la variable aleatoria x debe ser igual a 1.
38
© MSc. Washington Rodríguez Curso Propedéutico Nov-2013
Función de distribución acumulada
Variables aleatorias discretas.
F(x)=P(X ≤ x)= 𝑝(𝑥)𝑥−∞
Variables aleatorias continuas
39
F (x)
x © MSc. Washington Rodríguez Curso Propedéutico Nov-2013
𝐹 𝑥 = 𝑓 𝑥 𝑑𝑥𝑥
−∞
Top Related