Conceptos_basico_de_E1.ppt

40
Lady Mariebelia Elías

Transcript of Conceptos_basico_de_E1.ppt

  • Lady Mariebelia Elas

  • Es una ciencia que estudia fenmenos colectivos, mediante la observacin numrica, anlisis matemtico y la interpretacin lgica de los datos.

  • Estadstica Descriptiva o Deductiva: es la parte de la estadstica que da los procedimientos para transformar los datos del anlisis en un fenmeno colectivo.

    Estadstica Inferencial o Inductiva: es la parte de los mtodos estadsticos que ayuda a conocer algn aspecto de la poblacin mediante el conocimiento de ciertos aspectos de la muestra.

  • Poblacin: coleccin completa de los objetos de investigacin.

    Muestra: subconjunto de la poblacin a estudiar.

    Variables: caractersticas de los objetos de la poblacin a investigar.

  • Poblacin: puede ser finita o infinita.

    Muestra: probabilstica y no probabilstica.Muestra Probabilstica:Muestreo Aleatorio SimpleMuestro Aleatorio EstratificadoMuestreo SistemticoMuestreo no probablistico

  • Tipos de variables: Dependiendo del nmero de caractersticas:Variables unidimensionalesVariables bidimensionalesVariables pluridimensionales o multidimensionales

    Dependiendo del tipo de datos Categricas o cualitativasNumricas o cuantitativas

  • Cualitativa: se hace con base a una determinada cualidad.

    Cuantitativa: Permite diferenciar individuos, sealando que tan grandes son las diferencias observadas.

  • Discretas: es la variable cuyos valores numricos se pueden contar o son finitos en un intervalo cualquiera.

    Continuas: se da cuando los valores numricos que forman la variable en un intervalo cualquiera son infinitos.

  • Formas de clasificar los datos:Nominal: se usa como medidas de identidad. Los datos no pueden acomodarse segn esquema de ordenamiento.

    Ordinal: permite establecer relaciones del tipo mayor que o menor que. Tiene un orden significativo

  • Por intervalos: se mide de manera numrica, y al igual que los datos ordinales si llevan un orden y se pueden determinar magnitudes de diferencias entre los datos que tienen algn significado.

    Razones: se diferencia de la escala por intervalos nicamente porque el cero no es representativo.

  • Fuentes para obtener datos:Fuentes internasFuentes externas

    Tcnicas para recopilar datos:EncuestaEntrevistaCuestionario Observacin

  • Distribucin de frecuencias:Es una representacin de la relacin entre un conjunto de medidas o clases de medidas y la frecuencia de cada una de ellas.

    Al hacer una distribucin de los datos, podemos clasificar la informacin obtenida en forma:Cronolgica o histricaGeogrficaCualitativaCuantitativa

  • Esta nos indica la frecuencia con que aparecen los nmeros, desde el menor del conjunto hasta el mayor o viceversa.

  • n: el tamao de la muestra, es el nmero de observaciones.Xi: la variable; es cada uno de los diferentes valores que se han observado.fi: la frecuencia absoluta o solo frecuencia, es el nmero de veces que se repite la variable Xi.Fa: la frecuencia acumulada; se obtiene acumulando la frecuencia absoluta.fr: frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamao de la muestra.Fra: frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamao de la muestra.

  • Organiza en una distribucin de frecuencias simples y acumuladas la siguiente distribucin.Punteos obtenidos en el primer examen de Estadstica 1.

    5254555352545155535055545254565455555451535453555356565550555452545553555455525451535353535455555456

  • Es un mtodo estadstico que se utiliza para estudiar el comportamiento de un conjunto de datos y consiste en formar grupos de valores consecutivos de la variable y poner cada uno de estos grupos en cada fila.

  • Ordenar los datos de mayor a menor o viceversa.Calcular el rango o recorrido. R=Xmax-XminDeterminar el nmero de clases: k=1+3.3log(n) frmula de SturgesDeterminar el intervalo de clase i=R/kFormar los intervalos (lmites aparentes) de clase agregando i-1 al lmite inferior de cada clase. Formar los lmites realesDeterminar las frecuencias de clase contando el nmero de observaciones.

  • Realice una distribucin de frecuencias de valores agrupados para los resultados obtenidos en el segundo parcial de Estadstica 1.

    344556784567893666894856606578665765636462787787855860767456886777556766768885746889896970

  • Los siguientes datos son los kilmetros por galn que registraron 30 vehculos en un recorrido de 100 km. por la ciudad. (2,1,2,2,10,13)

    31.534.436.035.536.135.032.830.831.834.718.837.134.233.231.035.236.833.733.434.033.924.623.335.329.627.633.630.825.416.4

  • Es la manera de expresar los datos estadsticos, utilizando los medio de representacin que proporciona la Geometra.Componentes de una grfica:Ttulo generalElementos de referencia con expresin de la variable representada sobre cada uno.Fuente de procedencia de los datos representados.La parte ms alta de la grfica debe ser aproximadamente tres cuartos de su ancho total.

  • Barras rectangulares de igual ancho, conservando la misma distancia de separacin entre s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas.Pueden ser verticales o en forma horizontal.

  • Se usan para mostrar como una cantidad total se reparte en un grupo de categoras.Variables cualitativas en porcentajes o cifras absolutas.Nmero de tems no mayor a 5.

  • Eje horizontal: intervalos de clase (lmites reales)Eje vertical: frecuencias Rectngulos unidos cuyos anchos son los de los intervalos de clase.Variables cuantitativas

  • Es un grfico de lneas trazado sobre las marcas de clase.El polgono empieza y termina en el eje horizontal.

  • Eje horizontal: lmites reales superioresEje vertical: frecuencia acumuladaPara el lmite inferior de la primera clase la frecuencia acumulada es cero y para el lmite superior de la ltima clase es igual al total de datos.

  • Sirven para representar las series de tiempo, porque reflejan la direccin del cambio.Eje horizontal: escala de tiempo

  • Muestra pequeos conjunto de datos.Eje horizontal: valores de la variable estudiada.Eje vertical: la frecuencia de aparicin de un valor en el conjunto de datos estudiados.

  • Medidas de tendencia central:Media aritmticaMedia ponderadaMediana Moda

  • Medida de posicin que proporciona una descripcin compacta de cmo estn centrados los datos Sirve de base para medir o evaluar valores extremos

  • Es una medida que toma en cuenta la importancia relativa de las observaciones, por lo que a cada uno de los valores de frecuencia se le asigna un valor de peso, el cual depende de la importancia que el investigador quiera darle.

  • Valor de la observacin que ocupa la posicin central de un conjunto de datos ordenados segn su magnitud.

    Es un valor que deja por debajo de l un nmero de casos igual al que deja por arriba. No presenta el problema de estar influida por los valores extremos, pero no utiliza en su clculo todos los valores de la serie de datos.

  • Es el valor de un conjunto de datos que ocurre ms frecuentemente .

    La moda puede no existir o no ser nica, ya que hay distribuciones que presentan dos o ms mximos relativos, a las cuales se les llama bimodales o multimodales respectivamente.

    Una de sus ventajas es que los datos desproporcionados no la distorsionan

  • Al seleccionar a su personal, una empresa considera que los conocimientos tienen importancia relativa de 50, la puntualidad 30 y la presentacin 20. Cinco solicitantes de empleo obtuvieron las calificaciones que se presentan a continuacin. Determine cul de ellos obtuvo la mejor calificacin global.

  • Nmero del SolicitanteCalificacinPromedio SimpleConocimientos PuntualidadPresentacin(50)(30)(20)110677.667261088.00038988.33349867.667579108.667

  • Medidas de Posicin (fractilos o cuantilos)Los fractilos permiten identificar valores ubicados en diferentes posiciones. Se denomina fractilo a la localizacin del valor que corresponde al final de cada parte en que se ha dividido la distribucin de los datos.CuartilesDeciles Centiles

  • Estudia la distribucin, analizando si los datos se encuentran ms o menos concentrados o ms o menos dispersos. Proporciona informacin extra que permite juzgar la confiabilidad de las medidas de tendencia central, debido a que cuando los datos estn muy dispersos, la posicin central es menos representativa de la serie de datos. La dispersin se puede medir desde tres enfoques: la distancia, la dispersin promedio y la dispersin relativa

  • Nos permiten medir la dispersin en trminos de la diferencia entre dos valores seleccionados del conjunto de datos. Rango: Es fcil de entender y calcular, pero su utilidad es limitada, pues slo toma en cuenta el valor ms grande y el valor ms pequeo y ninguna otra observacin del conjunto de datos.Rango Intercuartlico: Mide qu tan lejos de la mediana se debe ir en cualquiera de las dos direcciones, antes de recorrer una mitad de los valores del conjunto de datos.

  • Rango Interpercentlico: Medida de dispersin que calcula la diferencia en los extremos de la distribucin (percentil 90 y percentil 10)

    *