REPÚBLICA BOLIVARIANA DE VENEZUELA
INSTITUTO UNIVERSITARIO DETECNOLOGÍA
ANTONIO JOSÉ DE SUCRE
AMPLIACIÓN ANACO
ESTADO ANZOÁTEGUI
Autor(a): Samuel Hernández
Anaco, Julio 2014
INTRODUCCION
La correlación trata de establecer la relación o dependencia que existe entre las
dos variables que intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios
de la otra. En caso de que suceda, diremos que las variables están
correlacionadas o que hay correlación entre ellas.
Con este breve concepto abrimos investigación a todo lo que conlleva a la
correlación en lo que refiere a estadística, incluyendo tipos y anécdotas
relacionadas a este tema
CORRELACION
La correlación estadística constituye una técnica estadística que nos indica si dos
variables están relacionadas o no.
Por ejemplo, considerando que las variables son el ingreso de una empresa y el
gasto de esta misma. Se sabe que los aumentos de ingresos y gastos disminuyen
juntos. Por lo tanto, están relacionados en el sentido de que el cambio en
cualquier variable estará acompañado por un cambio en la otra variable. De la
misma manera, los precios y la demanda de un producto son variables
relacionadas; cuando los precios aumentan la demanda tenderá a disminuir y
viceversa.
Si el cambio en una variable está acompañado de un cambio en la otra, entonces
se dice que las variables están correlacionadas. Por lo tanto, podemos decir que el
ingreso de la empresa y gastos de la empresa y el precio y la demanda están
correlacionados.
TIPOS DE CORRELACIÓN
Correlación directa: La correlación directa se da cuando al
aumentar una de las variables la otra aumenta. La recta
correspondiente a la nube de puntos de la distribución es una
recta creciente.
Correlación inversa: La correlación inversa se da cuando al aumentar una
de las variables la otra disminuye. La recta correspondiente a la nube de
puntos de la distribución es una recta decreciente.
Correlación nula: La correlación nula se da cuando no hay
dependencia de ningún tipo entre las variables. En este caso se dice que
las variables son incorreladas y la nube de puntos tiene una forma
redondeada.
RELACIÓN ENTRE LAS VARIABLES
La correlación puede decir algo acerca de la relación entre las variables. Se utiliza
para entender:
Si la relación es positiva o negativa
La fuerza de la relación.
La correlación es una herramienta poderosa que brinda piezas vitales de
información.
En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o
bajan juntos en la misma dirección. Esto se denomina correlación positiva.
En caso del precio y la demanda, el cambio se produce en la dirección opuesta, de
modo que el aumento de uno está acompañado de un descenso en el otro. Esto
se conoce como correlación negativa.
COEFICIENTE DE CORRELACIÓN
La correlación estadística es medida por lo que se denomina coeficiente de
correlación (r). Su valor numérico varía de 1,0 a -1,0. Nos indica la fuerza de la
relación.
En general, r> 0 indica una relación positiva y r <0 indica una relación negativa,
mientras que r = 0 indica que no hay relación (o que las variables son
independientes y no están relacionadas). Aquí, r = 1,0 describe una correlación
positiva perfecta y r = -1,0 describe una correlación negativa perfecta.
Cuanto más cerca estén los coeficientes de +1,0 y -1,0, mayor será la fuerza de la
relación entre las variables.
Como norma general, las siguientes directrices sobre la fuerza de la relación son
útiles (aunque muchos expertos podrían disentir con la elección de los límites).
Valor de r Fuerza de relación
-1,0 A -0,5 o 1,0 a 0,5 Fuerte
-0,5 A -0,3 o 0,3 a 0,5 Moderada
-0,3 A -0,1 o 0,1 a 0,3 Débil
-0,1 A 0,1 Ninguna o muy débil
La correlación es solamente apropiada para examinar la relación entre datos
cuantificables significativos (por ejemplo, la presión atmosférica o la temperatura)
en vez de datos categóricos, tales como el sexo, el color favorito, etc.
PROPIEDADES
El coeficiente de correlación no varía al hacerlo la escala de medición.
Es decir, si expresamos la altura en metros o en centímetros el coeficiente de
correlación no varía.
El signo del coeficiente de correlación es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es directa.
Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
El coeficiente de correlación lineal es un número real comprendido entre
menos −1 y 1.
−1 ≤ r ≤ 1
Si el coeficiente de correlación lineal toma valores cercanos a −1 la
correlación es fuerte e inversa, y será tanto más fuerte cuanto más se
aproxime r a −1.
Si el coeficiente de correlación lineal toma valores cercanos a 1 la
correlación es fuerte y directa, y será tanto más fuerte cuanto más se
aproxime r a 1.
Si el coeficiente de correlación lineal toma valores cercanos a 0, la
correlación es débil.
Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
DESVENTAJAS
Si bien 'r' (coeficiente de correlación) es una herramienta poderosa, debe ser
utilizada con cuidado.
Los coeficientes de correlación más utilizados sólo miden una relación
lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte
relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal
caso, un diagrama de dispersión puede indicar aproximadamente la
existencia o no de una relación no lineal.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría
calcular 'r' entre el número de calzado y la inteligencia de las personas, la
altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo
tanto es llamado correlación de oportunidad o sin sentido.
'R' no debe ser utilizado para decir algo sobre la relación entre causa y
efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir
que las variables X e Y están relacionadas. Sin embargo, el mismo valor de
'r’ no nos dice si X influencia a Y o al revés. La correlación estadística no
debe ser la herramienta principal para estudiar la causalidad, por el
problema con las terceras variables.
DIAGRAMA DE DISPERSIÓN
Un diagrama de dispersión se emplea cuando existe una variable que está bajo el
control del experimentador. Si existe un parámetro que se incrementa o disminuye
de forma sistemática por el experimentador, se le denomina parámetro de control
o variable independiente = eje de x y habitualmente se representa a lo largo del
eje horizontal. La variable medida o dependiente = eje de y usualmente se
representa a lo largo del eje vertical. Si no existe una variable dependiente,
cualquier variable se puede representar en cada eje y el diagrama de dispersión
mostrará el grado de correlación (no causalidad) entre las dos variables.
Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las
variables con un intervalo de confianza determinado. La correlación puede ser
positiva (aumento), negativa (descenso), o nula (las variables no están
correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de
tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación
para la correlación entre las variables puede ser determinada por procedimientos
de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido
como regresión lineal y garantiza una solución correcta en un tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es
su capacidad para mostrar las relaciones no lineales entre las variables. Además,
si los datos son representados por un modelo de mezcla de relaciones simples,
estas relaciones son visualmente evidentes como patrones superpuestos.
El diagrama de dispersión es una de las herramientas básicas de control de
calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de
verificación, los gráficos de control, el diagrama de Ishikawa y el diagrama de flujo.
FUERZA, SENTIDO Y FORMA DE LA CORRELACIÓN
La relación entre dos variables cuantitativas queda representada mediante la línea
de mejor ajuste, trazada a partir de la nube de puntos. Los principales
componentes elementales de una línea de ajuste y, por lo tanto, de una
correlación, son la fuerza, el sentido y la forma:
La fuerza extrema según el caso, mide el grado en que la línea representa
a la nube de puntos: si la nube es estrecha y alargada, se representa por
una línea recta, lo que indica que la relación es fuerte; si la nube de puntos
tiene una tendencia elíptica o circular, la relación es débil.
El sentido mide la variación de los valores de B con respecto a A: si al
crecer los valores de A lo hacen los de B, la relación es directa (pendiente
positiva); si al crecer los valores de A disminuyen los de B, la relación es
inversa (pendiente negativa).
La forma establece el tipo de línea que define el mejor ajuste: la línea
recta, la curva monotónica o la curva no monotónica
CONCLUSIÓN
Después de este gran trabajo de investigación podemos entender de una manera
mas sencilla lo que tiene que ver con el tema de las correlaciones.
Trabajamos con todos sus tipos y sus ventajas y sus diagramas.
Esperamos que el esfuerzo sirva para provecho de terceros.
BIBLIOGRAFIA
http://www.vitutor.com/estadistica/bi/correlacion.html
https://es.wikipedia.org/wiki/Correlaci%C3%B3n
http://www.monografias.com/trabajos84/correlacion/correlacion.shtml
http://es.slideshare.net/GabrielPerezSalazar/correlaciones-estadsticas
http://www.ditutor.com/estadistica_2/correlacion_estadistica.html
https://explorable.com/es/la-correlacion-estadistica