Dis Perci On
Transcript of Dis Perci On
-
5/24/2018 Dis Perci On
1/256
Apuntes
deTCNICAS CUANTITATIVAS 1
Jos Alberto Hermoso Gutirrez
Dpto. Mtodos Cuantitativos para la Economa y la Empresa
Universidad de Granada
-
5/24/2018 Dis Perci On
2/256
Apuntes de TCNICAS CUANTITATIVAS 1
2013,Jos Alberto Hermoso Gutirrez
Edita e imprime: Copicentro S. L.
ISBN:978-84-15814-40-5
Depsito Legal: GR-1690/2013
Impreso en Espaa. Printed in Spain
Quedan rigurosamente prohibidas, bajo
las sanciones establecidas en las leyes, la
reproduccin o almacenamiento total oparcial de la presente publicacin,
incluyendo el diseo de la portada, as
como la transmisin de la misma por
cualquiera de sus medios tanto si es
elctrico, como qumico, mecnico,
ptico, de grabacin o bien de fotocopia,
sin la autorizacin escrita de los titulares
del copyright
-
5/24/2018 Dis Perci On
3/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 3
-
5/24/2018 Dis Perci On
4/256
4 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
-
5/24/2018 Dis Perci On
5/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 5
1.- Variables estadsticas unidimensionales.
1.1 Variables estadsticas. Tablas estadsticas. Representaciones grficas . . . . . . . . . 7
1.2 Momentos centrados y no centrados . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Medidas de posicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.4 Medidas de dispersin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.6 Medidas de concentracin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.- Variables estadsticas bidimensionales.
2.1 Representaciones numricas en dos columnas y en tablas de contingencia . . . . . . 662.2 Distribuciones marginales y condicionadas. Independencia de variables estadsticas . 68
2.3 Covarianza y coeficiente de correlacin lineal . . . . . . . . . . . . . . . . . . . . . 71
2.4 Recta de regresin de mnimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 77
2.5 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.- Nmeros ndices.
3.1 Tasas de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043.2 ndice elemental. ndice sinttico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.3 ndices de precios, de cantidades y de valor . . . . . . . . . . . . . . . . . . . . . . 114
3.4 Enlace de series de nmeros ndices con distinta base . . . . . . . . . . . . . . . . . 117
3.5 Deflacin de series econmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.6 Dependencia de un ndice general de un grupo de productos . . . . . . . . . . . . . . 121
3.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.- Anlisis descriptivo de series cronolgicas.
4.1 Definicin de una serie cronolgica. Representacin grfica . . . . . . . . . . . . . . 135
4.2 Componentes de una serie cronolgica. Modelos . . . . . . . . . . . . . . . . . . . . 136
4.3 Tendencia secular: ajuste de una recta de mnimos cuadrados y medias mviles . . . 138
4.4 Variacin estacional. Desestacionalizacin . . . . . . . . . . . . . . . . . . . . . . . 143
4.5 Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
-
5/24/2018 Dis Perci On
6/256
6 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
5.- Probabilidad.
5.1 Definicin de probabilidad. Asignacin de probabilidades . . . . . . . . . . . . . . . 172
5.2 Definicin de probabilidad condicionada. Sucesos dependientes e independientes . . 179
5.3 Frmula de la probabilidad total. Frmula de Bayes . . . . . . . . . . . . . . . . . . 182
5.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
6.- Variables aleatorias y distribuciones de probabilidad.
6.1 Concepto de variable aleatoria. Distribucin de probabilidad . . . . . . . . . . . . . 194
6.2 Funcin de distribucin. Variables aleatorias discretas y variables aleatorias continuas 196
6.3 Valor esperado de una variable aleatoria. Momentos . . . . . . . . . . . . . . . . . . 200
6.4 Otras medidas de posicin, dispersin y forma . . . . . . . . . . . . . . . . . . . . . 202
6.5 Variables aleatorias bidimensionales. Independencia de variables aleatorias . . . . . 2066.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
7.- Distribuciones discretas de probabilidad.
7.1 Distribucin Uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
7.2 Distribucin Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
7.3 Distribucin de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
7.4 Distribucin Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2437.5 Distribucin Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
7.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
-
5/24/2018 Dis Perci On
7/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 7
1. VARIABLES ESTADSTICAS
UNIDIMENSIONALES.
1.1 Variables estadsticas. Tablas estadsticas. Representaciones
grficas.
El trmino Estadsticaprocede del latn status debido a que sus primeras aplicaciones tuvieron
que ver con la recogida y cuantificacin de informacin referente al estado: censos de poblacin,
ejrcito, cosechas, impuestos, etc. El trmino estadstica o estadsticas en muchos casos hace
referencia a una cantidad de informacin, por ejemplo estadsticas de precios, estadsticas deproduccin, etc.
La descripcin de esta informacin es el objetivo de laEstadstica Descriptiva. Para llevar a cabo
esta tarea fundamentalmente nos apoyaremos en las representaciones grficas de dichos datos y en
su sntesis mediante medidas que resuman las caractersticas ms relevantes.
Podemos distinguir, fundamentalmente, dos tipos de fenmenos:
Fenmenos causales o determinsticos: Son aquellos que presentan los mismos resultados si
se realizan en idnticas condiciones (por ejemplo las reacciones qumicas).
Fenmenos aleatorios o estadsticos: Son los que no se puede predecir el resultado aunque
sean conocidas las condiciones de realizacin (por ejemplo el lanzamiento de una moneda).
Fenmenos de naturaleza social, econmica,... en los que la incertidumbre de su
comportamiento se debe tambin a la imposibilidad de repetirlos en las mismas condiciones,
son tratados como fenmenos estadsticos.
Se denomina poblacinal conjunto de elementos sobre los que se quiere realizar un estudio. En la
prctica se observa un subconjunto de la poblacin que debe ser representativo y al que llamamos
muestra.
Entre otras muchas razones para restringirnos al estudio de muestras destacamos:
Rapidez. Por ejemplo, las elecciones.
Evitar la destruccin de la poblacin.Como en el control de calidad.
Economa y precisin. El estudio de una poblacin completa puede llevar a cometer muchos
errores, mientras que en una muestra se puede dedicar ms atencin a la calidad de los datos.
-
5/24/2018 Dis Perci On
8/256
8 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Utilizaremos el trmino variable(variable estadstica) para referirnos a la caracterstica en estudio.
Se dice que una variable es cuantitativa cuando sus diversas modalidades pueden ser medidas
numricamente (precios, edad,...). Denominaremos atributos a las variables no numricas (sexo,
profesin,...).Segn los valores que toman las variables estadsticas distinguimos:
Variables discretas: toman valores aislados (nmero de empleados, habitaciones de una
vivienda,...)
Variables continuas: pueden tomar todos los valores de un intervalo (estatura, peso,...)
En la prctica toda variable es discreta debido a la precisin limitada de los aparatos de medida, por
ello distinguiremos entre variables con pocas modalidades (discretas) y variables que toman un
gran nmero de valores distintos (donde se incluyen las variables continuas y otras muchasmagnitudes sociales y econmicas como salarios, poblacin de ciudades,...)
Tablas estadsticas.
Una vez recogidos los datos se procede a su descripcin con la finalidad de obtener el mayor
conocimiento acerca del fenmeno.
El primer paso de esta descripcin consiste en la ordenacin, clasificacin, recuento y
representacin de los datos. Posteriormente se procede a resumirlos en cantidades que midencaractersticas del fenmeno.
EJEMPLO 1.1
Un estudio sobre el tipo de vivienda en construccin en una gran urbe ha aportado los siguientes
datos
TIPO
ColectivaUnifamiliar
5614
total 70
Nmero de
dormitorios12345
71421217
total 70
EJEMPLO 1.2
Para conocer el salario/hora de los trabajadores de un sector se ha observado una muestra de 100.Los datos se han recogido en la siguiente tabla
-
5/24/2018 Dis Perci On
9/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 9
Salario/hora0-10
10-2020-4040-50
25402015
total 100
A estas representaciones numricas se denominan tablas estadsticas.
Estas tablas recogen la siguiente informacin: las modalidades, i , (valores que ha presentado el
fenmeno) de forma individual o agrupadas en intervalos y las frecuencias absolutas de cada
modalidad o intervalo, in , (nmero de veces que se ha observado esa modalidad o valores del
intervalo). El nmero total de observaciones, n , se obtiene sumando todas las frecuencias
absolutas (lo que hemos llamado total en los ejemplos 1.1 y 1.2)
1
k
i
i
n n=
= A las tablas estadsticas se le puede aadir ms informacin, como:
La frecuencia relativa de la modalidad o intervalo i, if , es el cociente de la frecuencia absoluta
sobre el total de observaciones
i
i
n
f n=
A menudo las frecuencias relativas se multiplican por 100 para expresar en tanto por ciento la
medida en que se presenta cada modalidad o intervalo de valores.
La frecuencia absoluta acumuladade la modalidad o intervalo i, iN , es el nmero de veces que se
han observado valores menores o iguales que dicha modalidad o intervalo.
1
i
i j
j
N n=
= Anlogamente se define la frecuencia relativa acumulada, iF, a partir de las frecuencias relativas.
Se denomina distribucin de frecuencias al conjunto de valores que presenta una variable
estadstica junto con sus frecuencias. sta se representa segn el siguiente modelo donde no todas
las columnas son necesarias y su posicin puede cambiarse
-
5/24/2018 Dis Perci On
10/256
10 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
1i iL L i in if iN iF
0 1L L
1 2L L
...
1k kL L
1
2x
...
kx
1n
2n
...
kn
1f
2f
...
kf
1
2N
...
kN
1F
2F
...
kF
n 1
EJEMPLO 1.3
Usando los datos de los ejemplos 1.1 y 1.2.
i in if
ColectivaUnifamiliar
5614
0,800,20
total 70 1
ix in iN if iF
123
45
71421
217
72142
6370
0,100,200,30
0,300,10
0,100,300,60
0,901total 70 1
1i iL L ix in if iN iF
0-1010-2020-4040-50
5153045
25402015
0,250,400,200,15
256585
100
0,250,650,85
1total 100 1
Nota: en variables de tipo continuo cada intervalo de valores o claseest representado por su punto
medio o marca de clase, i .
Cada da ms, debido al uso de los ordenadores(hojas de clculo, programas de estadstica,...), la
representacin numrica de los datos se reduce a escribir en una columna los valores observados sin
ordenarlos, clasificarlos o contarlos (sin frecuencias), tal y como aparece en la siguiente imagen.
i
1
2x
...
nx
-
5/24/2018 Dis Perci On
11/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 11
Representaciones grficas.
Aunque es cierto que una tabla estadstica contiene toda la informacin observada de un fenmeno,
es conveniente en ocasiones traducir toda esa informacin en un grfico que nos permita realizar
una rpida sntesis visual.
Entre las representaciones grficas ms utilizadas estn el diagrama de barras, histograma, y
diagrama de sectores.
DIAGRAMA DE BARRAS
La longitud de la barra nos informa de la frecuencia con que se ha observado cada valor de la
variable.
Nmero dedormitorios in
12345
71421217
HISTOGRAMA
En esta representacin y en la siguiente es el rea de las figuras utilizadas (rectngulos o sectores) laque nos indica con qu frecuencia se observa cada clase o modalidad
1i iL L in ia ih
0-1010-2020-4040-50
25402015
10102010
2,541
1,5
La pirmide de poblacin consiste en dos histogramas colindantes, uno para la edad de los
hombres y otro para la edad de las mujeres. La tpica forma triangular de este grfico le ha dado el
nombre de pirmide de poblacin.
0
5
10
15
20
25
1 2 3 4 5
-
5/24/2018 Dis Perci On
12/256
12 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
DIAGRAMA DE SECTORES
i in if sector
ColectivaUnifamiliar
5614
0,800,20
0,80x360=2880,20x360=72
total 70 1 360
1.2 Momentos centrados y no centrados.
Los momentos son unos valores calculados a partir de la distribucin de frecuencias que resumen la
informacin relativa a alguna propiedad de la variable.
Como veremos ms adelante, la media aritmtica y la varianza son casos particulares de momentos
que resumen el valor global y la dispersin de los valores que presenta la variable estadstica. Otros
momentos sern utilizados para medir ciertas caractersticas relativas a la forma de la distribucin
de frecuencias.
En la prctica utilizaremos momentos de rdenes uno a cuatro.
Colectiva Unifamiliar
-
5/24/2018 Dis Perci On
13/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 13
Momentos no centrados.
Se definen los momentos no centrados (o respecto al origen) como:
1 1
1 k kr rr i i i i
i i
a x n x f n = =
= = (para tablas con frecuencias)
1
1 n rr i
i
a xn =
= (para tablas sin frecuencias)Propiedades:
El momento no centrado 1a se conoce tambin como media (aritmtica) y se suele notar como
.
0 1a = .
Momentos centrados.
Se definen los momentos centrados (o respecto a la media) como:
( ) ( )1 1
1 k kr rr i i i i
i i
m x x n x x f n = =
= = (para tablas con frecuencias)
( )1
1 n rr i
i
m x xn =
= (para tablas sin frecuencias)
Propiedades: El momento centrado 2m se conoce tambin como varianza y se suele notar como
2S .
0 11, 0m m= = .
( )
2 2 22 2
1 1 1 1 1 1 12
2 2k k k k k k k
i i i i i i i i i i i i
i i i i i i i
x n x n x n xx n x n x n x x n
mn n n n n n n
= = = = = = =
= = + = + =
2 2 22 1 2 1 1 1 2 12 2a x xa a a a a a a= + = + =
Anlogamente, desarrollando el correspondiente binomio elevado a r, cualquier momento
centrado puede escribirse en funcin de los momentos no centrados. Sealamos por su
importancia los casos r=2 y r=3.
3 2 43 3 2 1 1 4 4 3 1 2 1 13 2 4 6 3m a a a a m a a a a a a= + = +
Clculo de los momentos.
Para facilitar la obtencin de los momentos, los clculos se disponen en una tabla como sigue:
-
5/24/2018 Dis Perci On
14/256
14 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
EJEMPLO 1.4 (momentos no centrados)
Tabla sin frecuencias.
ix 2i 3i 4i 3 9 27 81
3 9 27 812 4 8 162 4 8 163 9 27 815 25 125 625
18 60 222 900
21 2
1 1
3 43 4
1 1
1 18 1 603 10
6 6
1 222 1 90037 150
6 6
n n
i i
i i
n n
i i
i i
x a x a xn n
a x a xn n
= =
= =
= = = = = = =
= = = = = =
Tabla con frecuencias. Variable discreta.
i in i ix n 2i in 3i in 4i in1 7 7 7 7 72 14 28 56 112 2243 21 63 189 567 17014 21 84 336 1344 53765 7 35 175 875 4375
total n=70 217 763 2905 116832
1 21 1
3 43 4
1 1
1 217 1 7633'1 10 '9
70 70
1 2905 1 1168341'5 166 '9
70 70
k k
i i i i
i i
k k
i i i i
i i
x a x n a x nn n
a x n a x nn n
= =
= =
= = = = = = =
= = = = = =
Tabla con frecuencias. Variable continua.
1i iL L i in i in 2i in 3i in 4i in0-10 5 25 125 625 3125 1562510-20 15 40 600 9000 135000 202500020-40 30 20 600 18000 540000 1620000040-50 45 15 675 30375 1366875 61509375total n=100 2000 58000 2045000 79750000
21 2
1 1
3 43 4
1 1
1 2000 1 5800020 580
100 100
1 2045000 1 7975000020450 797500
100 100
k k
i i i i
i i
k k
i i i i
i i
x a x n a x nn n
a x n a x nn n
= =
= =
= = = = = = =
= = = = = =
-
5/24/2018 Dis Perci On
15/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 15
EJEMPLO 1.5 (momentos centrados)
Tabla sin frecuencias.
ix ix x ( )2ix x ( )3i x ( )4ix x3 0 0 0 0
3 0 0 0 02 -1 1 -1 12 -1 1 -1 13 0 0 0 05 2 4 8 16
total 0 6 6 18
( ) ( )
( ) ( )
2
1 21 1
3 4
3 4
1 1
1 0 1 60 1
6 6
1 6 1 181 3
6 6
n n
i i
i i
n n
i i
i i
m x x m x xn n
m x x m x x
n n
= =
= =
= = = = = =
= = = = = =
Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos
obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as
22 2 2 22 2 1
1
110 3 1
n
i
i
S m a a x xn =
= = = = =
Dado que los clculos para tablas con frecuencias son anlogos para variables discretas y continuas,
incluimos un solo ejemplo de momentos centrados con frecuencias.
Tabla con frecuencias. Variable continua.
1i iL L ix in ( )i x ( )i ix x n ( )2i ix n ( )3i ix n ( )4i ix n 0-10 5 25 -15 -375 5625 -84375 126562510-20 15 40 -5 -200 1000 -5000 2500020-40 30 20 10 200 2000 20000 20000040-50 45 15 25 375 9375 234375 5859375
total n=100 0 18000 165000 7350000( ) ( )
( ) ( )
2
1 21 1
3 4
3 41 1
1 0 1 180000 180
100 100
1 165000 1 73500001650 73500
100 100
k k
i i i i
i i
k k
i i i i
i i
m x x n m x x nn n
m x x n m x x nn n
= =
= =
= = = = = =
= = = = = =
Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos
obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as
22 2 2 2
2 2 1 1
1
580 20 580 400 180
k
i iiS m a a x n xn =
= = = = = =
-
5/24/2018 Dis Perci On
16/256
16 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Clculoscomo los anteriores, dispuestos en forma de tabla, son muy fcilesde hacer con la ayuda
de una hoja de clculo.
1.3 Medidas de posicin.
Las distintas medias, la moda y la mediana tratan de representar mediante un solo valor a un
conjunto de datos y suelen tomar una posicin central respecto de los mismos, motivo por el que son
conocidas como medidas de posicin central.
Media aritmtica.
Es el promedio ms familiar y utilizado en los ms diversos mbitos, aunque no es el nico ni el
ms adecuado en todas las ocasiones. Se define como
1 1
1i i
k k
i i
i i
x x n x fn = =
= = (para tablas con frecuencias)
1
1i
n
i
x xn =
= (para tablas sin frecuencias)Coincide con el momento no centrado 1a x= .
Las calculadoras cientficasnos permiten obtener fcilmente algunos valores estadsticos con la
opcin SD, entre ellos la media aritmtica x .
EJEMPLO 1.6.
ix in i ix n
1234
5
7142121
7
7286384
35total 70 217
1
1 2173,1
70i
k
i
i
x x nn =
= = =
1i iL L ix in i ix n
0-1010-2020-4040-50
5153045
25402015
125600600675
total 100 2000
1
1 200020
100i
k
i
i
x x nn =
= = =
-
5/24/2018 Dis Perci On
17/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 17
Propiedades de la media aritmtica:
Consideramos n observaciones agrupadas en s conjuntos de datos con 1n , 2n , , sn
observaciones cada uno y con medias 1 2, , ..., sx x respectivamente, entonces la media x de
las n observaciones es:
1 1
11
... 1
...s
i
ss
i
is
x n x nx x n
n n n =
+ += =
+ +
Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex
(cambio de escala), por ejemplo cuando decidimos expresar los valores en millones en lugar
de en euros (en $ en lugar de ,). En otras ocasiones se suma o resta una constante a los
valores de la variable, ix c+ (cambio de origen). Si realizamos una o ambas
transformaciones sobre la variable original obtenemos una nueva variable, i iy ex c= + , cuyamedia est relacionada con la media de la variable de partida segn:
y ex c= +
( )1 1 1 1 1 1
1 1 1 1 1 1i i i
k k k k k k
i i i i i i i
i i i i i i
y y n ex c n ex n cn e x n c n ex cn n n n n n= = = = = =
= = + = + = + = +
Media geomtrica.
11
1
...n nni kk
nn
i k
i
G x x x=
= = (para tablas con frecuencias)
11
...n
nni n
i
G x x x=
= = (para tablas sin frecuencias)
La media geomtrica se utiliza para promediar porcentajes, tasas, ndices de precios,... es decir, en
aquellos casos en los que la variable representa variaciones acumulativas. La media geomtrica es
menor que la media aritmtica calculada sobre los mismos datos.
EJEMPLO 1.7.
El valor de la vivienda ha sufrido en los ltimos 5 aos los siguientes incrementos
incremento6%5%
17%20%
14%Obtenga el incremento anual medio del valor de la vivienda en estos cinco aos.
-
5/24/2018 Dis Perci On
18/256
18 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
Una vivienda cuyo valor fuese 0V al comienzo de estos cinco aos alcanzara un valor
1 0 0 0
61,06
100V V V V = + =
al final del primer ao, que se transformara en
2 1 1 1 0
51,05 1,05 1,06
100V V V V V = + = =
despus de transcurridos dos aos.
As sucesivamente, al final de los cinco aos
5 01,14 1,20 1,17 1,05 1,06V V=
55 0
0
1,7814 1,7814V
V V
V
= =
Luego ha habido un incremento del precio de la vivienda en los ltimos cinco aos del 78,14%
(0,7814 por uno).
El incremento medio anual ser aquel valor r (en tanto por uno) tal que si se hubiera observado
durante todo el periodo (ltimos 5 aos) ese incremento constante, el resultado final habra sido el
mismo
0 01,14 1,20 1,17 1,05 1,06 (1 ) (1 ) (1 ) (1 ) (1 )V r r r r r V = + + + + +
por tanto5
5 5
(1 ) 1,14 1,20 1,17 1,05 1,06 1,7814
1 1,14 1,20 1,17 1,05 1,06 1,7814 1,1224
0,1224 en tanto por ciento % 12,24%
r
r
r r
+ = =
+ = = =
= =
1 r+ es la media geomtrica de los valores 1 ir+ , donde ir es el incremento en cada ao
expresado en tanto por uno.
Teniendo en cuenta que 5
0
1,14 1, 20 1,17 1, 05 1, 06 1, 7814V
V = = , otra forma de expresar res
55
0
1V
rV
+ =
O en general para naos
0
1 nnV
rV
+ =
-
5/24/2018 Dis Perci On
19/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 19
Utilizaremos esto ltimo cuando se desconozcan los incrementos anuales (6%, 5%,) pero se
conozcan los valores inicial ( 0V ) y final ( nV ) del bien que se est analizando (como en el ejemplo
1.8)
Lamedia aritmtica no es adecuada en este contextocomo puede verse
( )
0,06 0,05 0,17 0,20 0,140,124
56% 5% 17% 20% 14%
(en tanto por ciento) 12,4% 12,4% 12,24%5
r
r
+ + + += =
+ + + += =
Segn la media aritmtica habra un incremento del valor de la vivienda en los 5 aos de
( )5
1,124 1,794 79, 4%= , que no se corresponde con la realidad del ejemplo (78,14%).
EJEMPLO 1.8.
Una vivienda que en el ao 2000 se compr por 125.000 se ha vendido en el ao 2007 por
500.000. Otra vivienda que se compr en 1995 por 100.000 se vendi en el 2006 por 700.000.
Cul de las viviendas increment ms su valor?
Solucin:
Responderemos apoyndonos en el incremento anual medio observado en el valor de cada vivienda.
72007 77
2000
500.0004 1,219
125.000
V
V= = = incremento anual medio del 21,9% (primera vivienda)
112006 1111
1995
700.0007 1,1935
100.000
V
V= = = incremento anual medio del 19,35% (segunda vivienda)
La primera vivienda experiment un incremento anual medio del 21,9% en su valor mientras que la
segunda experiment un incremento menor, 19,35%.
Media armnica.
1
ki
i i
nH
n
x=
=
(para tablas con frecuencias)
1
1n
i i
nH
x=
=
(para tablas sin frecuencias)
-
5/24/2018 Dis Perci On
20/256
20 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Se utiliza para promediar velocidades, precios por unidad, cambios de divisas,...
La media armnica es menor que la media geomtrica y esta ltima menor que la media aritmtica.
EJEMPLO 1.9.
Si se sube en bicicleta a Sierra Nevada a una velocidad de 10 Km/h y se baja a una velocidad de 60Km/h, a qu velocidad media se ha hecho el recorrido completo de ida y vuelta. Suponga que la
distancia desde la casa del ciclista a Sierra Nevada es de 30 Km.
Solucin:
Si calculamos la media aritmtica, obtenemos10 60
35 /2
x Km h+
= = , que no es la solucin.
Entendiendo por velocidad media aquella velocidad constante a la que si se realizara el recorrido se
tardara lo mismo, claramente 35 Km/h no lo cumple.
30 301,7143
35h
+= mientras que hemos tardado
303
10h= en subir y
300,5
60h= en bajar, en total 3
horas y media.
La solucin sera la media armnica 2
1
2 2 217,1429 /
1 11 0,10 0,016710 60i i
H km h
x=
= = = =++
(Obsrvese que la distancia, 30 Km., no interviene en el clculo)
A esa velocidad media tardaramos 30 30 3,4999917,1429
h+ = , es decir 3,5 h (la diferencia que se
observa es debida a los errores de redondeo), lo que realmente se ha tardado en la subida y bajada.
Nota:
Utilizando el valor de las distancias recorridas, la media se hubiera calculado como
2
1
2 2 601 1 30 301
10 60 10 60i i
H
x=
= = =
+ +
y en general
1
11
distancia total
tiempo total como suma de los tiempos parciales...k
ki
ki i
D DH
ddd
v vv=
= = =
+ +
EJEMPLO 1.10.
Una agencia inmobiliaria ha vendido las siguientes viviendas
-
5/24/2018 Dis Perci On
21/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 21
Precio Superficie 2/precio m240.000180.000420.000
6090
100
4.0002.0004.200
Cual ha sido el precio medio al que ha vendido el metro cuadrado.
Solucin:
ini
i
ni
240.000180.000420.000
6090
100
4.0002.0004.200
840.000 250
2
1
840.000 Precio total3.360/
250 Superficie totalk ii i
nH m
n
x=
= = = =
Todos aquellos datos que representen precios por unidadcomo cambio de divisas (p.e., $/, /$),
precios de alimentacin, combustibles,... (p.e., /Kg, /l), precio de la vivienda por m2(/m2), etc.,
se promedian utilizando la media armnica.
Hay ms tipos de medias, como la media cuadrtica, , que no estudiaremos en esta asignatura.
Moda.
Es el valor que se presenta con ms frecuencia. Se nota Mo. Puede haber varias modas.
Para variables discretas y atributossu clculo es inmediato. En las variables continuasla mayor
o menor frecuencia de las observaciones en un intervalo depende en parte de su amplitud, por lo que
para calcular la moda consideraremos las frecuencias observadas en conjuntos de igual amplitud
(amplitud unidad).
Dentro del intervalo modal (el de mayor frecuencia por unidad de amplitud, mayor altura en el
histograma) hay que seleccionar un punto como moda, para lo cual no hay un nico criterio.
Sealaremos tres criterios diferentes que notaremos como ( ), ( ) ( )o I Mo II y Mo III .
Uno de ellos consiste en tomar el punto medio o marca de clase:
1( )2
i ii
L Lo I x
+= =
Otro criterio sita la moda a una distancia de los extremos del intervalo proporcional a las alturas de
los intervalos anterior y posterior al intervalo modal:
11
1 1
( ) ii ii i
ho II L a
h h
+
+
= +
+
-
5/24/2018 Dis Perci On
22/256
22 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Y el tercero tiene en cuenta un procedimiento grfico para situar la moda dentro del intervalo
modal:
( ) ( )1
11 1
( ) i ii ii i i i
h ho III L a
h h h h
+
= +
+
En las expresiones anteriores 1iL es el extremo inferior del intervalo modal, ia la amplitud del
intervalo modal y ih la altura del intervalo modal ( 1ih la altura del intervalo anterior, 1ih + la altura
del intervalo posterior).
EJEMPLO 1.11.
ix in
1
2345
7
142121770n =
Mo=3
Mo=4
TIPOin
Colectiva
Unifamiliar
56
14total 70
Mo=Colectiva
1i iL L in ia ih
0-1010-20
20-4040-50
25304015
10102010
2,53
21,5100n =
Intervalo modal: 10-20.
Dentro del intervalo modal hay que seleccionar
un punto como moda. Hay diversos criterios:
1 10 20( ) 152 2
i iL LMo I + +
= = =
11
1 1
2( ) 10 10 14,44
2,5 2i
i i
i i
hMo II L a
h h
+
+
= + = + =+ +
( ) ( ) ( ) ( )1
11 1
3 2,5
( ) 10 10 13,333 2,5 3 2i i
i ii i i i
h h
Mo III L ah h h h
+
= + = + = + +
Mediana.
Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el mismo
nmero de datos menores que la mediana como mayores que ella.
Si hay un nmero impar de observaciones, la mediana es el nico valor central
5, 10, 30, 45, 50 Me=30
-
5/24/2018 Dis Perci On
23/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 23
Si hay un nmero par de observaciones, la mediana es el punto medio de los dos valores centrales
5, 10, 30, 45 Me=(10+30)/2=40/2=20
Si tenemos los datos representados en una tabla estadstica la mediana se calcula buscando el valor
que deja por debajo de l una frecuencia acumulada igual a
2
n
EJEMPLO 1.12.
Para variables discretasbuscamos en la columna de frecuencias absolutas acumuladas el valor2
n,
7035
2 2
n = =
i i
ni
N
12345
71414287
721356370
70n =
pudiendo ocurrir que hay un 2in
N = , en cuyo caso la mediana
es: 13 4
3,52 2
i ix xMe ++ +
= = = ,
ix in iN
1
2345
7
1421217
7
21426370
70n =
o bien, como en este otro ejemplo, todos los2in
N . Entonces, se
busca el primer 2in
N > , siendo la modalidad i asociada a esa
frecuencia acumulada el valor que se toma como mediana, 3Me = .
En variables continuasse distinguen las mismas dos posibilidades:
1i iL L in iN
0-1010-2020-4040-50
2030
3515
205085100
100n =
2in
N = . La mediana es el extremo superior del intervalo
donde se alcanza la mitad de las observaciones.
20iMe L= =
1i iL L ia in iN
100-110110-120120-140140-150
10102010
25402015
256585
100
100n =
Todos los2in
N . La mediana est en el intervalo donde
por primera vez2in
N > y se calcula mediante:
-
5/24/2018 Dis Perci On
24/256
24 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
1
1
50 252 110 10 116,2540
i
i i
i
nN
Me L an
= + = + =
que es el resultado de repartir homogneamente las 40 observaciones sobre la amplitud 10 del
intervalo. Segn la tabla, hasta 110 hay una frecuencia acumulada de 25, hasta 120 hay una
frecuencia acumulada de 65 (por tanto 40 observaciones entre 110 y 120), luego el valor Mehasta
el que hay una frecuencia acumulada de 502
n= estar entre 110 y 120. Si las observaciones se
reparten homogneamente en el intervalo, la distancia entre la mediana y el extremo inferior del
intervalo ser proporcional al nmero de observaciones entre dichos valores
120 110 40
110 50 25Me
=
( )
120 11050 25 110
40Me
=
120 11040 =Amplitud entre cada una de las 40 observaciones del intervalo 110-120.
( )50 25 =Nmero de observaciones en el intervalo 110-Me.
Despejando el valor Me se obtiene la anterior expresin para la mediana
10 40 110 50 25 50 25 50 25110 10 110 10
110 50 25 10 40 40 40
MeMe Me
Me
= = = = +
Percentiles.
Estas medidas ( )1 99 1 99,..., ,...,P P o C C dividen a la muestra ordenada en 100 conjuntos con igual
nmero de observaciones,100
n, habiendo por tanto
100
n observaciones menores que P . La
mediana coincide con 50P . Salvo este percentil, el resto de percentiles ocupan una posicin no
central respecto de los datos de la muestra, propiedad por la que reciben la denominacin de
medidas de posicin no central.
Otros casos particulares de percentiles son los denominados cuartiles
( )1 25 2 50 3 75, ,Q P Q P Q P = = = que dividen a la muestra en 4 conjuntos con igual nmero de
observaciones,4
n, y los deciles ( )1 10 2 20 9 90, , ...,D P D P D P= = = que dividen a la muestra en 10
conjuntos con igual nmero de observaciones,
10
n.
-
5/24/2018 Dis Perci On
25/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 25
El clculo de los percentiles es similar al de la mediana, cambiando 502 100
n n= por
100
n
dependiendo del percentil, P , que se quiera calcular.
En las distribuciones de variables discretas no hay consenso sobre la forma de calcular los
percentiles, existiendo en la literatura cientfica nueve mtodos diferentes que conducen aresultados diferentes. Por ello, al calcular cualquier percentil por medio de software o manualmente,
es bsico saber e indicar el mtodo utilizado. Excel no utiliza el mismo mtodo que en estos
apuntes.
EJEMPLO 1.13.
Calcule sobre las siguientes tablas los percentiles 30 y 85
i in iN12345
71414287
721356370
70n =
130 2 330 21 2,5100 2 2
i ix xn P ++ += = = =
8585 59,5 4100
nP= =
1i iL L ia in iN
100-110110-120120-140140-150
10102010
25402015
256585
100100n =
8585 85 140100
nP= =
30 30100
n=
100in
N P est en el intervalo donde por primera vez 100in
N >
se calcula con una expresin similar a la de la mediana, sustituyendo2
n por
100
n , que es el
resultado de repartir homogneamente las observaciones sobre la amplitud del intervalo
1
1100 i
i i
i
n NP L a
n
= +
1
30 1
30 30 25100 110 10 111,2540
i
i i
i
nN
P L an
= + = + =
EJEMPLO 1.14.
Los saldos de las cuentas abiertas por los clientes de una sucursal bancaria se distribuyen de
acuerdo a la siguiente tabla
-
5/24/2018 Dis Perci On
26/256
26 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
SALDOS NUMERO DE CLIENTES0-200
200-1.0001.000-5.000
5.000-30.000
10040030050
Se consideran clientes preferentes al 10% de los clientes con mayores saldos, cul ha de ser el
saldo para que un cliente sea considerado como tal?
Qu porcentaje de clientes tienen un saldo superior a 900?
Solucin:
SALDOS NUMERO DE CLIENTESiN
0-200200-1.000
1.000-5.0005.000-30.000
10040030050
100500800850
850850 90 765100
n= =
1
90 1
90 765 500100 1000 4000 4533,33300
i
i i
i
nN
P L an
= + = + =
Se considerarn clientes preferentes a los que tienen un saldo superior a 4533,33.
1
1
850100
100 100900 200 800 52,94400
i
i i
i
nN
P L an
= + = = + =
El 52,94% de los clientes tienen un saldo inferior a 900, por tanto un 47,06% =(100-52.94)% de
clientes tienen un saldo superior a 900.
Considerando el reparto homogneo de las observaciones en cada intervalo, las anteriores
cuestiones se podran haber resuelto tambin de la siguiente manera
90 9090 90
5000 1000 800 500 4000 300 4000 2651000 3533,33 4533,331000 765 500 1000 265 300P PP P
= = = = =
1000 200 500 100 800 400 400 700100 350 450
900 200 100 700 100 800x x
x x
= = = = =
. Hay 450 clientes
con un saldo inferior a 900 que representan un450
100 52, 94%850
= .
-
5/24/2018 Dis Perci On
27/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 27
1.4 Medidas de dispersin.
Las medidas de dispersincuantifican la variabilidad o esparcimiento de los datos. Cuando esta
dispersin se mide respecto de alguna medida de posicin central (por ejemplo, la media) nos indica
la mayor o menor representatividadde dicha medida.
Recorridos
El recorrido o rangoRse define como la diferencia entre los valores extremos.
R=mximo-mnimo
Es la medida de dispersin ms fcil de calcular pero tiene el inconveniente de que slo utiliza dos
valores (estando sujeta a posibles datos errneos) por lo que no nos da una medida precisa de la
dispersin de todos los datos.
El recorrido intercuartlico IR se define como la diferencia entre el tercer y primer cuartil,
3 1 75 25IR Q Q P P= =
representa la amplitud del intervalo donde se encuentra el 50% de las observaciones centrales de la
muestra. Con esta medida se evita la fuerte influencia que tienen los valores extremos en el
recorridoR.Con la misma idea se pueden definir distintos recorridos utilizando otros percentiles.
Varianza
( )2
2
1
1 ki i
i
S x x nn =
= (para tablas con frecuencias)
( )2
2
1
1 ni
i
S x x
n =
= (para tablas sin frecuencias)La varianza coincide con el momento centrado de orden 2, 2 2S m= .
Mide la dispersin o distancia de los datos, ix , respecto de la media aritmtica, x . Esta medida est
expresada en las unidades de los datos al cuadrado (p.e., 2, hab.2,...) por lo que no tiene una
interpretacin fcil. Con el objeto de tener una medida de dispersin expresada en las mismas
unidades que los datos en estudio, se define la desviacin tpica como la raz cuadrada positiva de la
varianza.
-
5/24/2018 Dis Perci On
28/256
28 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex (cambio de
escala), por ejemplo cuando decidimos expresar los valores en millones en lugar de en euros (en $
en lugar de en ,). En otras ocasiones se suma o resta una constante a los valores de la variable,
ix c+ (cambio de origen). Si realizamos una o ambas transformaciones sobre la variable original
obtenemos una nueva variable, i iy ex c= + , cuya varianza est relacionada con la varianza de la
variable de partida mediante:
2 2 2y xS e S=
(los cambios de origen en los valores de la variable no afectan al valor de la varianza, pero s los
cambios de escala).
( ) ( ) ( ) ( )( )
( ) ( )
22 2 22
1 1 1 1
2 22 2 2 2
1 1
1 1 1 1
1 1
i i i
i i
k k k k
y i i i i i
i i i i
k k
i i x
i i
S y y n ex c ex c n ex ex n e x x nn n n n
e x x n e x x n e S n n
= = = =
= =
= = + = = =
= = =
En general, para cualquier momento centrado se tiene que
( ) ( )rr rm y e m x=
Desviacin tpica.
La medida de dispersin absoluta ms utilizadaes la desviacin tpica, S.2S S=
Las calculadoras cientficas nos permiten obtener fcilmente algunos valores estadsticos con la
opcin SD, entre ellos la desviacin tpica nS = y elevndola al cuadrado obtenemos la varianza
2S .
Los cambios de origenen los valores de la variable no afectan al valor de la desviacin tpica, pero
s los cambios de escalasegn la expresiny xS e S= .
EJEMPLO 1.15.
Calcule el rango, la varianza y la desviacin tpica para la siguiente distribucin de frecuencias.
1i iL L in
0-1010-2020-3030-40
1234
10
-
5/24/2018 Dis Perci On
29/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 29
Solucin:
1i iL L in ix i ix n ( )
2
i x ( )2
i ix x n
0-1010-2020-3030-40
1234
5152535
53075
140
400100
0100
400200
0400
10 250 1000
R=40-0=40
1
1 25025
10
k
i i
i
x x nn =
= = =
( )221
1 1000 10010
k
i i
i
S x x nn =
= = = 2 100 10S S= = =
Desigualdad de Tchebycheff
Esta desigualdad nos permite entender mejor el significado de la desviacin tpicacomo medida
de dispersin.
Dado un conjunto de datos con media y desviacin tpica S, la proporcin de datos en el
intervalo ( ),x kS x kS + es mayor o igual que 21
1k
(k>1).
( ) 21
, 1ip x x kS x kSk
+
Otra forma equivalente de expresar el mismo resultado, haciendo2
22
t tt kS k k
S S
= = = , dice
que la proporcin de datos en el intervalo ( ),x t x t + es mayor o igual que2
21
S
t .
Por ejemplo, para k=2, ( )2 , 2S x S + , tenemos que alejndonos de la media dos desviaciones
tpicas, a la derecha e izquierda, abarcaramos ms del 75% de las observaciones,
2 2
1 11 1 0,75
2k = = .
EJEMPLO 1.16.
Se sabe que el nmero medio de unidades diarias de un determinado producto que vende un
supermercado es 100x= y la desviacin tpica 40S= . Si cada da el supermercado repone hasta
completar 200 unidades del producto en sus estanteras:
Cuntos das al ao la demanda ser mayor que su oferta?
Cunto habra que reponer para asegurar que no va a faltar producto en las estanteras el 95% de
los das?
-
5/24/2018 Dis Perci On
30/256
30 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
200 100x t t+ = = la proporcin de observaciones dentro del intervalo
( ) ( ), 0, 200x t x t + = es mayor o igual que2
2
16001 1 0,84
10000
S
t = = y por tanto fuera de dicho
intervalo (demanda inferior a 0 o superior a 200) la proporcin de observaciones es menor o igual a
0,16=1-0,84 . Es decir, en menos del 16% de los das la demanda es superior a 200 unidades.
22
2 2
1600 16001 1 0,95 32000 178,9 279
0,05
St t x t
t t = = = = = +
Reponiendo hasta completar 279 unidades en las estanteras aseguramos que ms del 95% de los
das no faltar producto en el supermercado.
Variable tipificada
Se define la variable X tipificada como la nueva variable obtenida al realizar el siguiente cambio
X xZ
S
=
Esta nueva variable se caracteriza por tener media cero y desviacin tpica 1.
La tipificacin de variables se puede utilizar para establecer comparacionesentre valores de dos
variables (por ejemplo, las calificaciones de dos alumnos en dos centros diferentes).
EJEMPLO 1.17.
Se quiere comparar los precios de dos viviendas con las mismas caractersticas, una en Madrid y
otra en Granada. El precio medio de las viviendas del tipo considerado es 200.000 en Madrid y
140.000 en Granada, las desviaciones tpicas son respectivamente 20.000 y 15.000. Las dos
viviendas a comparar tienen unos precios de 260.000 (Madrid) y 190.000 (Granada). cul de las
dos viviendas est alcanzando un mayor valor en su mercado?Solucin:
260.000 200.000 60.0003
20.000 20.000
= =
190.000 140.000 50.0003,33
15.000 15.000
= =
3,33 3> por tanto la vivienda de Granada est alcanzando mayor valor en su mercado
que la de Madrid.
Una vivienda con las caractersticas de la de Granada en Madrid tendra un precio de unos 266.600
( )200.000 3,33 20.000 3,33 200.000 266.60020.000x x = = + =
-
5/24/2018 Dis Perci On
31/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 31
Los recorridos, la varianza y la desviacin tpica son medidas de dispersin absoluta que
dependen de la unidad de medida de la variable (y por tanto les afecta el cambio de escala), lo
anterior conlleva que no se puedan comparar estas medidas en dos variables con distinta unidad de
medida. En la prctica para evitar este problema se prefiere trabajar con otras medidas dedispersin, obtenidas de las anteriores, que se denominan medidas de dispersin relativa. Las
medidas de dispersin relativa son adimensionales (no dependen de la unidad de medida de la
variable estadstica y por tanto no les afectan loscambios de escala)
Coeficiente de Variacin.
Es la medida de dispersin relativa ms utilizada. Se define como el cociente de la desviacin
tpica sobre la media aritmtica
SCV =
Esta medida es invariante frente a cambios de escala pero le afecta los cambios de origen.
EJEMPLO 1.18.
La distribucin de los salarios mensuales de 10 trabajadores con igual cualificacin profesional es
Salarios encientos de in
0-1010-2020-3030-40
123410
El horario de trabajo no es nico para todos, siendo 6 el nmero medio de horas trabajadas cada da
y 1 hora la desviacin tpica. Es coherente la distribucin de los salarios con la de las horas
trabajadas?
Razonamiento:
Si todos los empleados trabajan las mismas horas, lo coherente es que reciban el mismo salario (la
variacin del salario sera cero y tambin la del nmero de horas). Quien trabaje ms debe recibir
ms salario y quien trabaje menos debe recibir menos, es decir, debe haber la misma variabilidad en
las horas trabajadas que en los salarios percibidos.
Solucin:
La media y desviacin tpica de los salarios segn hemos calculado en el ejemplo 1.15 sobre estos
mismos datos son:
-
5/24/2018 Dis Perci On
32/256
32 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
1
1 25025
10
k
i i
i
x x nn =
= = = 2 100 10S S= = = 10( ) 0,425
CV salarios = =
Mientras que1
( ) 0,1676
CV horarios = = . La dispersin en los salarios es ms del doble que en las
horas trabajadas, luego no es coherente la distribucin de salarios en relacin con las horas detrabajo.
Otra forma de razonar:
x=horas trabajadas, y=salario
Si y kx= , donde k=salario/hora,debido a la invariabilidad del coeficiente de variacin frente a
cambios de escala x yCV CV = , pero si x yCV CV y kx . Los salarios no son
proporcionales a las horas trabajadas.
EJEMPLO 1.19.
Las subvenciones, en millones de euros, a las pequeas empresas en 2006 y 2007 segn
comunidades autonmicas se recogen en la siguiente tabla
2006 2007
ANDALUCIA 42,95 69,15
ARAGON 5,91 19,25
ASTURIAS 2,23 28,5
BALEARES 1,24 12,5
CANARIAS 3,29 25,8CANTABRIA 7,20 16,25
CASTILLA LA MANCHA 11,02 19,5
CASTILLA LEON 11,15 26,05
CATALUA 25,89 58,2
COMUNIDAD VALENCIANA 17,26 58,35
EXTREMADURA 6,08 41,5
GALICIA 6,75 29
MADRID 8,15 13,55
MURCIA 9,78 25,35
NAVARRA 1,84 15,5
PAIS VASCO 7,88 34,35LA RIOJA 1,38 17,2
Se han mantenido las diferencias entre las subvenciones recibidas en 2006 y 2007? Si han variado,
indique en qu sentido.
-
5/24/2018 Dis Perci On
33/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 33
Solucin:
2006
ix ( )
2
i x2007
iy ( )
2
iy y
ANDALUCIA 42,95 1085,7025 69,15 1532,7225
ARAGON 5,91 16,7281 19,25 115,5625
ASTURIAS 2,23 60,3729 28,5 2,25
BALEARES 1,24 76,7376 12,5 306,25
CANARIAS 3,29 45,0241 25,8 17,64
CANTABRIA 7,20 7,84 16,25 189,0625
CASTILLA LA MANCHA 11,02 1,0404 19,5 110,25
CASTILLA LEON 11,15 1,3225 26,05 15,6025
CATALUA 25,89 252,4921 58,2 795,24
COMUNIDAD VALENCIANA 17,26 52,7076 58,35 803,7225
EXTREMADURA 6,08 15,3664 41,5 132,25
GALICIA 6,75 10,5625 29 1
MADRID 8,15 3,4225 13,55 270,6025
MURCIA 9,78 0,0484 25,35 21,6225
NAVARRA 1,84 66,5856 15,5 210,25PAIS VASCO 7,88 4,4944 34,35 18,9225
LA RIOJA 1,38 74,3044 17,2 163,84
TOTAL 170,00 1774,75 510,00 4706,79
17n= 1
1 17010
17
n
i
i
x xn =
= = = 1
1 51030
17
n
i
i
y yn =
= = =
( )2
2
1
1 1774,75104,40
17
n
x i
i
S x xn =
= = = ( )221
1 4706,79276,87
17
n
y i
i
S y yn =
= = = 2 10,22
x xS S= = 2 16,64
y yS S= =
2006
10,221,022
10xSCV
x= = = 2007
16,640,555
30yS
CVy
= = =
Las diferencias entre las subvenciones recibidas por las distintas comunidades autonmicas han
disminuido en 2007 en relacin al ao anterior.
1.5 Medidas de forma.
Momentos como la media y la varianza nos aportan informacin sobre la posicin y dispersin de
los datos. En este apartado, las denominadas medidas de forma cuantifican caractersticas
observables en la forma de la representacin grfica que nos proporcionan ms informacin sobre el
fenmeno en estudio.
Hay diversas medidas de forma, las ms utilizadas se basan en los momentos.
-
5/24/2018 Dis Perci On
34/256
34 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Coeficiente de asimetra de Fisher.
31 3
mg
S=
Se basa en que en distribuciones simtricas por cada observacin a la derecha de la media hay otra a
igual distancia a la izquierda, por tanto la expresin
( )3
1
0n
i
i
x x=
=
Si la grfica es asimtrica a la izquierda se rompe el anterior equilibrio entre sumandos positivos y
negativos, resultando la suma negativa. Lo mismo ocurre cuando la distribucin de frecuencias es
asimtrica a la derecha, resultando la suma positiva. El signo del denominador de 1g es siempre
positivo, por tanto:
Si la distribucin es simtrica 1 0g =
Si la distribucin es asimtrica a la izquierda 1 0g
El signo de 1 lo aporta 3m , se define dividiendo por3Spara conseguir que el coeficiente sea una
medida adimensional que pueda compararse con la asimetra de otras distribuciones, adems
tambin se consigue as que sea independiente de cambios de origen y escala.
Coeficiente de curtosis (o apuntamiento) de Fisher.
Las medidas de curtosis se utilizan en distribuciones unimodales simtricas o levemente asimtricas
para cuantificar la mayor o menor frecuencia de observaciones en torno a la media. La mayor
frecuencia de observaciones prximas a la media dar lugar a una representacin grfica ms
apuntada, la menor frecuencia de observaciones prximas a la media dar lugar a una representacin
ms aplanada. El perfil de apuntamiento que se toma como referencia es el de la conocida campana
de Gauss ocurva normal.
La medida de apuntamiento ms utilizada es el coeficiente de curtosis de Fisher
42 4
3m
gS
=
Al igual que el coeficiente de asimetra de Fisher es adimensionale independiente de cambios de
origen y escala.
Los valores del coeficiente de curtosis de Fisher se interpretan de la siguiente manera:
Si la distribucin tiene un apuntamiento normal(mesocrtica) 2 0g =
-
5/24/2018 Dis Perci On
35/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 35
Si la distribucin es ms aplanada que la curva normal(platicrtica) 2 0g
1.6 Medidas de concentracin.
Las medidas de concentracin miden la mayor o menor igualdad en el reparto de una cantidad (por
ejemplo, la masa salarial total de una empresa, ). Ante este problema eminentemente econmico,
medidas estadsticas como la media, la varianza, , no son significativas, por lo que es necesario
construir unos indicadores especficos. Debido a la naturaleza de los fenmenos que aqu se
consideran, las variables tomarn slo valores positivos (por ste y otros motivos, no deben hacerse
cambios de origen).
La caracterstica que se va a estudiar puede presentar las siguientes situaciones lmite:
Mxima concentracin:Cuando un solo individuo recibe la cantidad total a repartir y el resto
nada.
Equidistribucin (mnima concentracin): Todos los individuos reciben la misma cantidad.
Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos de
cuantificar con las siguientes medidas de concentracin:
Curva de concentracin de Lorenz.
Ilustraremos la construccin de la curva de Lorenzcon un ejemplo.
EJEMPLO 1.20.
Estudiar la concentracin de los salarios/hora de 25 trabajadores recogidos en la siguiente tabla
1i iL L in
-
5/24/2018 Dis Perci On
36/256
36
Hacemos los siguientes clcul
1iL iL ix
Donde in son los trabajadore
en cada intervalo, acumuland
(representan el nmero de tra
intervalo i)
Por ltimo, ip y iq son los va
p
(representan el porcentaje de
hasta el intervalo i)
La curva de Lorenz es la rep
, a los que se aade el punto (
del punto (0, 0) y termina en
Apuntes de Tcnicas Cuantitativas 1. Jos
os
in i ix n iN iu
25n= 1
73000k
j j
j
x n=
=
en cada intervalo, i ix n es la suma de los s
los anteriores valores obtenemos respectiva
1
i
i j
jN n
== 1
i
i j j
ju x n
==
bajadores y la suma de los salarios de todos
lores iN y iu expresados en porcentajes.
100iiN
n=
1
100ii kj j
j
uq
x n=
=
trabajadores y el porcentaje de los salarios
esentacin grfica de los puntos con coorde
, 0). Como puede verse en el grfico, la cur
l punto (100, 100).
lberto Hermoso Gutirrez.
ip iq
larios de los trabajadores
ente iN y iu .
los trabajadores hasta el
e todos los trabajadores
adas ( ),i ip q , 1,...,i k=
a de Lorenz siempre parte
-
5/24/2018 Dis Perci On
37/256
Apuntes de Tcnicas Cuantitativa
Interpretacin de la curva d
Si hay un reparto equitativo
corresponde un porcentaje iq
iguales a los valores iq y la
cuadrante). Cuanto ms prxi
la curva de Lorenz de la recta
curva de Lorenz de dicha lne
ndice de Gini.
El ndice de Gini cuantifica la
los puntos ( ),i ip q , 1, ...i=
( ), (100 ,100)k kp q = ].
Interpretacin del ndice de
Si hay un reparto equit
Si hay concentracin
0 1, ...,iq i k = =
Luego el ndice de Gini esconcentracin cuanto mayor s
1. Jos Alberto Hermoso Gutirrez.
e Lorenz.
(todos reciben lo mismo), a un porcent
de la cantidad total repartida igual a ip . E
curva de Lorenz coindice con la lnea y
os estemos de esta situacin de reparto equ
y x= , cuanto mayor sea la concentracin d
.
anterior propiedad de la curva de Lorenz ba
, 1k , a la recta y x= . [No se tienen en
( )1 1
1 11 1
1 1
1
k k
i i i
i iG k k
i i
i i
p q q
I
p p
= =
= =
= =
Gini.
ativo (equidistribucin) 1,i ip q i = =
xima (todos reciben nada, salvo uno que re
1 , 100 1k Gq I = =
un valor entre 0 y 1 que mide la concenea y mayor equidistribucin cuanto menor se
37
je ip de trabajadores le
s decir los valores ip son
x= (bisectriz del primer
tativo ms prxima estar
l reparto ms se alejar la
sndose en la distancia de
cuenta los puntos (0,0) y
..., 1 0Gk I =
cibe todo)
tracin, indicando mayora.
-
5/24/2018 Dis Perci On
38/256
38 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
En el ejemplo anterior el ndice de Gini vale253,5
1 0,1769308G
I = = .
(Obsrvese que a la suma de los ip y iq se ha restado 100 puesto que 100kp = y 100kq = no se
incluyen en el clculo del ndice de Gini)
Mediala.
La mediala o valor medial, Ml, es aquel valor tal que la suma de las observacionesmenores que l
es igual a la suma de las observaciones mayores que l.
Se trata pues de una mediana sobre los valores i ix n en lugar de sobre las frecuencias in . Su clculo
se realiza de forma anloga, buscando el valor de la variable asociado a la mitad de la cantidad total
repartida, 12
k
j j
j
x n=
, o equivalentemente asociado a 50%iq = .
Segn lo anterior, en variables continuas (valores agrupados en intervalos) la mediala se obtiene de
( )1 1
1 11
50 50
%i i
i i i i
i i i i
q ql L a L a
n x q q
= + = +
Donde ( )%i in x representa el porcentaje recibido en el reparto por el intervalo i (intervalo donde se
encuentra la mediala), 1iL es el extremo inferior del intervalo medial (intervalo donde por primera
vez 50iq > ) y ia es la amplitud del intervalo donde est la mediala.
La mediala de los datos del ejemplo anterior es:
50 23,32500 1000 3311,55
56, 2 23, 3Ml
= + =
De qu forma nos ayuda la mediala a medir la concentracin? Si hay equidistribucin la
mediana y mediala coinciden, separndose ms cuanto mayor sea la concentracin. Por tanto la
respuesta es
Ml Me =
En el ejemplo anterior12,5 10
2500 1000 2812,58
Me
= + = 499,05M Ml Me = =
-
5/24/2018 Dis Perci On
39/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 39
El valor M , que depende de la unidad de medida de la variable, se suele relativizar en
comparacin con el rango, /R .
En nuestro ejemplo, 6500 500 6000 0,0832M
RR
= = = , que confirma de nuevo lo que
ya conocamos por la curva de Lorenz e ndice de Gini de que la concentracin es dbil.
En el anterior ejemplo hemos visto cmo sobre una variable continua se calculan las medidas de
concentracin, en el siguiente ejemplo lo veremos sobre una variable discreta.
EJEMPLO 1.21.
Dos familias con 4 y 5 hijos respectivamente deciden repartir parte de sus patrimonios entre ellos de
la siguiente forma.
Familia A
Familia B
Cul de los dos repartos es ms equitativo?
Solucin:
De estas tablas pasamos los datos a tablas estadsticas con frecuencias para variables discretas.
Familia A:
i in i in iN iu ip iq
1
11
1
99,9( ) 1 1 0,334
150
k
i
iG k
i
i
q
I A
p
=
=
= = =
Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por
primera vez el valor 50%, 3 356,5 50 ( ) 300000q Ml A x= > = = .
-
5/24/2018 Dis Perci On
40/256
40 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
(Si hay un 1502
i ii
x xq Ml +
+= = , anlogamente a como se hace en el clculo de la
mediana)
Familia B:i in i in iN iu ip iq
1
11
1
73,4( ) 1 1 0,266100
k
i
iG k
i
i
q
I Bp
=
=
= = =
Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por
primera vez el valor 50%, 3 3100 50 ( ) 2000000q Ml B x= > = = .
Comparando ambos ndices de Gini se observa que es ms equitativo el reparto de la familia B
( ) 0,334 ( ) 0, 266G GI A I B= > =
1.7 Ejercicios resueltos.
1. La compaa de telefona mvil Noteoigo est considerando cambiar sus tarifas. Para ello ha
observado la duracin en segundos de 1000 llamadas realizadas por sus abonados:
Duracin de las llamadas Nmero de llamadas0-20
20-6060-9090-180
180-300
15180195405205
Obtenga:
a) Duracin media de las llamadas.
b) Coste medio de las llamadas segn las siguientes tarifas:
b.1) 10 cntimos el establecimiento de llamada, ms 6 cntimos por minuto
(proporcionalmente las fracciones de minuto).
-
5/24/2018 Dis Perci On
41/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 41
b.2) 8 cntimos por minuto (proporcionalmente las fracciones de minuto), sin coste
de establecimiento de llamada.
c) Porcentaje de llamadas que superan los 2 minutos de duracin.
Solucin:
1iL iL i ix n 0 20 10 15 150 15 1,5
20 60 40 180 7200 195 19,560 90 75 195 14625 390 3990 180 135 405 54675 795 79,5
180 300 240 205 49200 1000 1001000 125850
a)1
1 125850125,85
1000i
k
i
i
x n segundosn =
= = =
b) Utilizaremos como afecta a la media un cambio de origen y/o escala:
Y eX c y ex c= + = +
X=duracin de las llamadas en segundos. Y=duracin de las llamadas en minutos.
1Z = coste de la llamada segn la opcin b.1 2Z = coste de la llamada segn la opcin b.2
1 1 125,852,0975
60 60 60Y X y x= = = =
b.1) ( ) ( )1 110 6 10 6 10 6 2,0975 22,585Z Y z y= + = + = + = cntimos.
b.2) 2 28 8 8 2,0975 16,78Z Y z y= = = = cntimos.
c) Calculamos, interpolando, el porcentaje de llamadas que duran menos de 120 segundos, y se lo
restamos a 100%.
90 39120 x180 79,5
180 90 120 9052,5% 100 52,5 47,5%
79,5 39 39x
x
= = =
El 47,5% de las llamadas superan los dos minutos.
2. Se dispone de la siguiente informacin sobre los salarios anuales brutos de los empleados de una
empresa (en miles de euros):
Salarios 0-20 20-60 60-70 70-90n empleados 10 45 30 15
a) Obtenga el coeficiente de variacin de los salarios.
b) Qu salario es superado por el 60% de los empleados?
c) Qu tanto por ciento de empleados tienen un salario superior a 63000 euros?
ix in iN ip
-
5/24/2018 Dis Perci On
42/256
42 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
0-2020-6060-70
70-90
104065
80
104530
15
10018001950
1200
100072000
126750
96000
105585
100
105585
100n=100 5050 295750
a)1
1 15050 50, 5
100
n
i i
i
x x nn =
= = =22 2 2
1
1 29575050,5 407, 25 407,25 20,18
100
n
i i
i
S x n x S n =
= = = = =20,18
0,399650,5
SCV
x= = =
b)
20x
60
104055
60 20 20 1200
20 46,655 10 40 10 4546666 40%
46666 60%
x
x x
euros no son superados por el de los empleados
euros son superados por el de los empleados
= + = =
c)
606370
55x
85
70 60 63 60 3 3055 64
85 55 55 1064% 63000
100 36% 63000
x xx
de los empleados tienen salario inferior a euros
de los empleados tienen salario superior a euros
= = =
=
3. Se tienen datos sobre los beneficios en millones de euros (ya deflactados) obtenidos por las
empresas de tres sectores productivos en los aos 2008 y 2012:
2008 2012
SectorBeneficio medio
(millones de euros)Nmero de
empresasBeneficio medio
(millones de euros)Nmero de
empresasABC
406550
80012001000
356035
7351165900
Calcule para los tres sectores en conjunto:
a) El beneficio medio en 2008 y 2012.b) La disminucin media anual (en %) de los beneficios en el periodo 2008-2012.
Solucin:
a) ( ) ( ) ( )( )1
2008
1 1 16000040 800 65 1200 50 1000 53,33
3000 3000
s
i
i
ix x nn =
= = + + = =
( ) ( ) ( )( )1
2012
1 1 12712535 735 60 1165 35 900 45, 4
2800 2800
s
i
i
ix x nn =
= = + + = =
iL
ip
iL ip
1i iL L i in i in2i ix n i ip
-
5/24/2018 Dis Perci On
43/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 43
b) 445,4
1 0,96 0,04 ( 4%)53,33
r r+ = = = . Se ha producido una disminucin
media anual del 4% en los beneficios del sector.
4. El salario medio, la desviacin tpica de los salarios y el nmero de empleados en tres empresasfiliales de G.E.C.O.S.A. son
Salario medio Desviacin tpica Nmero de empleadosABC
136513001560
105100120
100300170
Se decide subir el salario un 5% en la filial A, un 6% en la filial B y 50 euros a los empleados de la
filial C.
a) En cul de las tres filiales son ms homogneos los salarios antes de la subida?
b) En cul de las tres filiales son ms homogneos los salarios tras la subida?
Solucin:
a) Antes de la subida la homogeneidad de los salarios es la misma en las tres filiales
105 100 1200,0769
1365 1300 1560A B CCV CV CV = = = = = =
b) Despus de la subida la homogeneidad no cambia en las filiales A y B pues el coeficiente de
variacin es invariante frente a cambios de escala.
Y X
y x x
y ex xY eX CV CV
S eS S = = = = =
Sin embargo, si cambia en la filial C al cambiar la media aunque no la desviacin tpica.
Si llamamos X al salario antes de la subida e Y al salario despus de la subida:
Filial A Y=X+0,05X=1,05X
Filial B Y=X+0,06X=1,06X
Filial C Y=X+50
120 1200,0769 0,07451560 50 1610A B C
CV CV CV = = = = =+
Por tanto, despus de la subida la filial C es la de salarios ms homogneos (aunque C tiene
la mayor desviacin tpica, recuerde que para comparar la dispersin de dos variables
estadsticas se ha de usar una medida de dispersin relativa)
5. Sea una distribucin de frecuencias con media 300, varianza 36 y n=5000. Cuntas observaciones
contiene el conjunto ( ,288] [312, ) ?
-
5/24/2018 Dis Perci On
44/256
44 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
La desigualdad de Tchebycheff afirma que la proporcin de datos en el intervalo ( ),kS x kS + es
mayor o igual que2
11
k (k>1).
( ) 21, 1ip x x kS x kSk
+
En nuestro caso: 288=300-12= 2x S 312=300+12= 2x S+
Por tanto, la proporcin de observaciones en el intervalo (288, 312) es mayor o igual que
2 2
1 1 31 1 0,75
2 4k = = = , de modo que en el conjunto ( ,288] [312, ) habr menos de un
25% de las observaciones, es decir, menos de 1250 observaciones25
5000 1250
100
=
.
6. En un fenmeno se han observado 2000 individuos con media 1000 y varianza 100. Cuntas
observaciones, como mnimo, son mayores que 970 y menores que 1030?
Solucin:
De nuevo, de acuerdo a la desigualdad de Tchebycheff :
970=1000-30= 3S , 1030=1000+30= 3S+ , en el intervalo ( )3 , 3S x S + hay una
proporcin de observaciones mayor o igual que2
1 81 0,88893 9
= = . El 88,89% de las 2000
observaciones son 1777,8 , luego como mnimo hay 1778 observaciones entre 970 y 1030.
7. Para asignar los puestos de trabajo en una cadena de montaje se realiza un test a los 90 empleados;
12 de ellos realizarn un trabajo tipo A (los que obtengan mejor puntuacin), otros tantos un
trabajo tipo C (los que saquen puntuacin ms baja), y el resto realizarn labores tipo B. El
resultado del test fue:Puntuacin 0-30 30-50 50-70 70-100 100-120 120-150
in 10 15 20 20 20 5
Cul fue la puntuacin en el test para los que desempearn un trabajo tipo B?
-
5/24/2018 Dis Perci On
45/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 45
Solucin:
1iL iL in iN
0 30 10 10
30 50 15 25
50 70 20 45
70 100 20 65
100 120 20 85
120 150 5 90Si los 12 mejores harn el trabajo A, los 78=90-12 restantes con la puntuacin ms baja no lo harn.
Buscamos 78 en la columna de frecuencias acumuladas, como no aparece interpolaremos entre los
siguientes valores
100 65x 78
120 85
120 100 100113
85 65 78 65
xx
= =
Los que obtengan ms de 113 harn el trabajo A.
Los 12 con puntuacin ms baja harn el trabajo C. Buscamos 12 en la columna de frecuencias
acumuladas e interpolamos entre los valores ms prximos
30 10x 12
50 25
50 30 3032,67
25 10 12 10
xx
= =
Los que obtengan menos de 32,67 puntos harn el trabajo C.
Por tanto harn el trabajo B los que obtengan una puntuacin entre 32,67 y 113 puntos.
8. En la siguiente tabla se recogen los salarios anuales, en miles de euros, de los empleados de dos
empresas del mismo sector
Nmero de empleadossalarios Empresa A Empresa B
5-1515-2525-3535-4545-55
215284510
55
105030
a) Qu empresa constituye un grupo ms homogneo de empleados en cuanto a salarios se
refiere?
b) Qu empresa presenta mayor concentracin en sus salarios?
c) Qu porcentaje de la masa salarial de la empresa A perciben los trabajadores cuyo salario
anual est comprendido entre 22500 y 30000 euros?
d) Qu salario anual percibe un empleado de la empresa B que se encuentra dentro del 25% de
los mejor pagados en dicha empresa?
-
5/24/2018 Dis Perci On
46/256
46 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
Empresa A
1iL iL i in i ix n2i in iN iu ip iq
5 15 10 2 20 200 2 20 2 0,58
15 25 20 15 300 6000 17 320 17 9,25
25 35 30 28 840 25200 45 1160 45 33,53
35 45 40 45 1800 72000 90 2960 90 85,55
45 55 50 10 500 25000 100 3460 100 100,00
100 3460 128400 254 228,90
1
1 346034,6
100
k
i i
i
x x nn =
= = = 22 2 2
1
1 12840034,6 86,84 86,84 9,3188 ( ) 0,2693
100
k
i i
i
SS x n x S CV A
n x=
= = = = = = =
( )
1 1
1 11 1
1 1
118,90( ) 1 1 0,163
154
k k
i i i
i iG k k
i i
i i
p q qI A
p p
= =
= =
= = = =
Empresa B
1iL iL i in i ix n2i ix n iN iu ip iq
5 15 10 5 50 500 5 50 5 1,27
15 25 20 5 100 2000 10 150 10 3,80
25 35 30 10 300 9000 20 450 20 11,39
35 45 40 50 2000 80000 70 2450 70 62,0345 55 50 30 1500 75000 100 3950 100 100,00
100 3950 166500 205 178,48
1
1 395039,5
100
k
i i
i
x x nn =
= = = 22 2 2
1
1 16650039,5 104,75 104,75 10, 2347 ( ) 0, 2591
100
k
i i
i
SS x n x S CV B
n x=
= = = = = = =
( )1 1
1 11 1
1 1
78,48( ) 1 1 0, 2526105
k k
i i i
i iG k k
i i
i i
p q q
I Bp p
= =
= =
= = = =
a) Para ver donde son ms homogneos los salarios estudiamos la variabilidad o dispersin de
esta variable. Para poder comparar la dispersin necesitamos una medida de dispersin
relativa como el coeficiente de variacin. Se observa una dispersin similar en ambas
empresas, si bien algo mayor en la empresa A
( ) 0,2693 ( ) 0,2591CV A CV B= > =
-
5/24/2018 Dis Perci On
47/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 47
Observe que si nos hubiramos apoyado en los valores de las varianzas o de las desviaciones
tpicas la conclusin hubiese sido la opuesta.
b) El ndice de Gini en la empresa A es menor que en la empresa B, luego hay menos
concentracin en los salarios de la empresa A.
( ) 0,163 ( ) 0,2526G GI A I B= < =
c) Buscamos en la tabla de la empresa A el tanto por ciento de masa salarial acumulada
asociada a los valores 22,5 y 30. Como ninguno aparece en la tabla interpolaremos entre los
valores ms prximos:
15 0,5822,5 x25 9,25
25 15 22,5 157,08
9,25 0,58 0,58x
x
= =
25 9,2530 x35 33,53
35 25 30 25 21,3933,53 9,25 9,25
xx
= =
Los trabajadores con un salario inferior a 30000 euros reciben el 21,39% de la masa salarial.
Los que su salario es inferior a 22500 euros reciben el 7,08% de la masa salarial. Por tanto
los que su salario est comprendido entre 22500 y 30000 euros recibirn el 14,31% de la
masa salarial (21,39-7,08=14,31).
d) El salario que es superado por el 25% de los empleados de la empresa B mejor pagados es el
mismo salario que no es alcanzado por el 75% restante. Buscamos en la columna de los ipel valor 75, como no aparece, interpolamos entre los valores ms prximos
45 70x 75
55 100
55 45 4546,667 46667
100 70 75 70
xx euros
= =
9. El sueldo mensual, en euros, correspondiente a los empleados de dos factoras de una misma
empresa es
Sueldomensual
Nmero de empleados.Factora A
Nmero de empleados.Factora B
600-10001000-14001400-20002000-3000
20403010
16203232
a) Qu sueldo corresponde al 60% de los empleados de la empresa?
b) Calcule el sueldo del 25% de los empleados de la factora B con menor salario.
c) Qu sueldo puede ser considerado moda de la factora A?
d) Halle el sueldo medio: de la factora A, de la factora B y de la empresa.
e) En cul de las dos factoras los sueldos son ms homogneos?
-
5/24/2018 Dis Perci On
48/256
48 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
f) En cul de las dos factoras los sueldos tienen una concentracin mayor?
g) Calcule la mediana y la mediala para todos los empleados de la empresa.
h) Qu porcentaje de empleados de la empresa tienen un sueldo superior a 2300 euros?
i) Qu sueldo corresponde al 30% de los empleados de la empresa con mayor sueldo?
j) Calcule el porcentaje de empleados de la empresa, con menor sueldo, que reciben el 43% dela nmina.
k) Cuntos empleados de la empresa, con mayor sueldo, reciben el 25% de la nmina?
Solucin:
Sumando el nmero de empleados en las dos factoras de la empresa obtenemos la distribucin de
frecuencias para todos los empleados de la empresa.
Sueldomensual
Nmero de empleados.Factora A
Nmero de empleados.Factora B
Nmero de empleados.EMPRESA
600-10001000-14001400-20002000-3000
20403010
16203232
36606242
En primer lugar realizamos en las siguientes tablas los clculos necesarios para responder a todos
los apartados:
Factora A
1iL iL ix in i in2i in ia ih iN iu ip iq
600 1000 800 20 16000 12800000 400 0,05 20 16000 20 11,43
1000 1400 1200 40 48000 57600000 400 0,1 60 64000 60 45,711400 2000 1700 30 51000 86700000 600 0,05 90 115000 90 82,14
2000 3000 2500 10 25000 62500000 1000 0,01 100 140000 100 100,00
100 140000 219600000 270 239,29
Factora B
1iL iL ix in i in2i i
x n iN iu ip iq
600 1000 800 16 12800 10240000 16 12800 16 7,48
1000 1400 1200 20 24000 28800000 36 36800 36 21,50
1400 2000 1700 32 54400 92480000 68 91200 68 53,272000 3000 2500 32 80000 200000000 100 171200 100 100,00
100 171200 331520000 220 182,24
Empresa
1iL iL ix in i in2i ix n iN iu ip iq
600 1000 800 36 28800 23040000 36 28800 18 9,25
1000 1400 1200 60 72000 86400000 96 100800 48 32,39
1400 2000 1700 62 105400 179180000 158 206200 79 66,26
2000 3000 2500 42 105000 262500000 200 311200 100 100,00
200 311200 551120000 245 207,90
-
5/24/2018 Dis Perci On
49/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 49
a) Esta pregunta puede tener diferentes interpretaciones: el 60% de los empleados de la
empresa con mayores sueldos, el 60% con menores sueldos, el 60% de los sueldos
intermedios o centrales,
Para su resolucin aqu supondremos el 60% de los empleados con menores sueldos.
60 no aparece en la columna de los ip de la tabla Empresa, por lo que interpolaremos
entre los valores ms prximos a 60 en la tabla.
1400 48x 60
2000 79
2000 1400 14001632,26
79 48 60 48
xeuros
= =
El 60% de los empleados con menores sueldos tienen un salario inferior a 1632,26 .
b) 25 no aparece en la columna de los ip de la tabla Factora B, por lo que interpolaremos
entre los valores ms prximos a 25 en la tabla.
1000 16x 25
1400 36
1400 1000 1000 118036 16 25 16
xeuros
= =
El 25% de los empleados de la factora B con menores salarios tienen un salario por debajo
de 1180 .
c) La moda es el valor ms frecuente de la variable. En variables continuas se sita en el
intervalo de mayor altura (que no siempre coincide con el de mayor frecuencia, aunque s en
este caso). Calculamos las alturas dividiendo la frecuencia absoluta, in , entre la amplitud
del intervalo, ia . Dentro del intervalo de mayor altura ( )0,1 , 1000-1400ih = hay
diferentes criterios para situar la moda, el ms sencillo es el del punto medio del intervalo.
Segn dicho criterio, 1200 euros puede considerarse la moda en la factora A.
d)140000 171200 311200
( ) 1400 ( ) 1712 ( ) 1556100 100 200
x A x B x empresa= = = = = =
e)22 2 2
1
1 219600000( ) 1400 236000 ( ) 236000 485,8
100
k
i i
i
S A x n x S An =
= = = = =
( )( ) 0,347
( )
S ACV A
x A= =
22 2 2
1
1 331520000( ) 1712 384256 ( ) 384256 619,88
100
k
i i
i
S B x n x S Bn =
= = = = =
( )( ) 0,362
( )
S BCV B
x B= =
Hay menos dispersin, por tanto son ms homogneos los sueldos, en la factora A, aunque
como puede observarse las diferencias no son importantes.
-
5/24/2018 Dis Perci On
50/256
50 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
f)
1
11
1
139,29( ) 1 1 0,181
170
k
i
iG k
i
i
q
I A
p
=
=
= = =
1
11
1
82,24( ) 1 1 0,315
120
k
i
iG k
i
i
q
I B
p
=
=
= = =
Hay una mayor concentracin en el reparto de los sueldos en la factora B.
g)1
1
100 962 1400 600 1438,7162
i
i i
i
nN
Me L an
= + = + =
11
1
50 50 32,391400 600 1711,96
66,26 32,39i
i i
i i
qMl L a
q q
= + = + =
h) En la tabla Empresa buscamos el valor 2300. ste no est, interpolamos entre los valores
ms prximos a 2300:
2000 792300 x3000 100
3000 2000 2300 2000 85,3% 100 85,3 14,7%100 79 79
x = = =
Luego el 14,7% de empleados en la empresa tienen un sueldo superior a 2300 .
i) El mismo sueldo que es superado slo por el 30% de los empleados de la empresa con
mayor sueldo no es alcanzado por el 70% restante. Buscamos en la tabla Empresa el
valor 70 en la columna ip e interpolamos entre los valores ms prximos:
1400 48x 70
2000 79
2000 1400 14001825,8
79 48 70 48
xx euros
= =
El 30% de los empleados de la empresa con mayor sueldo tienen un sueldo superior a
1825,8 .
j) Buscamos en la columna iq de la tabla Empresa el valor 43 e interpolamos:
48 32,39x 43
79 66,26
79 48 4857,71%
66,26 32,39 43 32,39
xx
= =
k) Buscamos en la tabla Empresa el porcentaje de empleados, con menor sueldo, que
reciben el 75% de la nmina79 66,26x 75
100 100
100 79 7984,44% 100 84,44 15,56%
100 66,26 75 66, 26
xx
= = =
Por tanto, el 15,56% restante de empleados recibirn el 25% restante de la nmina. El
15,56% de los 200 empleados de la empresa son 31,12 31 empleados.
10. Se conoce el salario medio, la desviacin tpica de los salarios y el nmero de empleados de dos
empresas filiales:
-
5/24/2018 Dis Perci On
51/256
Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 51
Filial Sueldo medio () Desviacin tpica () Nmero de empleadosA 853,4 60 25B 795 52 35
Se decide subir el sueldo un 5% a los empleados de la filial A y subir 138 euros a cada uno de los
de la filial B. Justifique en cul de las dos filiales los sueldos sern ms heterogneos despus de la
subida.Solucin:
Llamemos X=sueldo antes de la subida e Y=sueldo tras la subida.
En la filial A la relacin entre X e Y es un sencillo cambio de escala:
Y=X+0,05X=1,05X
En la filial B la relacin entre X e Y es un cambio de origen
Y=X+138
En la filial A la media y desviacin tpica para la nueva variable Y son:( ) 1,05 ( ) 1,05 853,4 897,12y A x A= = =
( ) 1,05 ( ) 1,05 60 63y xS A S A= = =
En la filial B la media y desviacin tpica para la nueva variable Y son:
( ) ( ) 138 795 138 933y B x B= + = + =
La desviacin tpica de X e Y es la misma en la filial B puesto que los cambios de origen no afectan
a su valor.
Para comparar la variabilidad de los sueldos despus de la subida utilizamos el coeficiente de
variacin
630,0702
897,12ACV = =
520,0557
933BCV = =
Luego, despus de la subida, son ms heterogneos los sueldo en la filial A.
11. En una empresa de embalaje se conoce el nmero de cajas que hacen los 75 empleados de esa
seccin al final de una semana:Nmero de cajas 350-400 400-450 450-500 500-550% de empleados 26,67 22,67 36 14,66
a) Calcule la varianza.
b) Calcule el nmero de cajas que con ms frecuencia hace un empleado.
c) Para incentivar la productividad se decide aumentar el salario 70 euros a la tercera parte de
los empleados que ms cajas hace. Cul ha de ser el nmero mnimo de cajas que debe
hacer un empleado para que le suban el sueldo?
-
5/24/2018 Dis Perci On
52/256
52 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.
Solucin:
1iL iL ix if i if2i ix f ia ih iF ip
350 400 375 0,2667 100,0125 37504,6875 50 0,005334 0,2667 26,67
400 450 425 0,2267 96,3475 40947,6875 50 0,004534 0,4934 49,34
450 500 475 0,36 171 81225 50 0,0072 0,8534 85,34
500 550 525 0,1466 76,965 40406,625 50 0,002932 1 1001 444,325 200084 261,35
a) En este ejemplo nos dan la distribucin de frecuencias en tantos por ciento. Estos tantos por
ciento son las frecuencias relativas multiplicadas por 100.
1 1
1444,325
k k
i i i i
i i
x x n x fn = =
= = = 2 22 2 2 2
1 1
1 1200084 444,325 2659,29
k k
i i i i
i i
S x n x x f xn n= =
= = = =
b) Al ser todos los intervalos de igual amplitud, el intervalo de mayor altura coincide con el de
mayor frecuencia relativa (y absoluta), 450-500. Segn los distintos criterios de obtencin
de la moda obtenemos:
1 450 500( ) 4752 2
i iL LMo I + +
= = =
11
1 1
0,002932( ) 450 50 469,64
0,004534 0,002932i
i i
i i
hMo II L a
h h
+
+
= + = + =+ +
( ) ( ) ( ) ( )1
11 1
0,0072 0,004534( ) 450 50 469, 220, 0072 0, 004534 0, 0072 0, 002932
i ii i
i i i i
h hMo III L a