UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE CIENCIAS ECONÓMICAS
INGA. PATRICIA JUAREZ JIMENEZ, 2017
REGRESIÓN Y CORRELACIÓN
Analizaremos cómo ajustar un modelo simple a un conjunto de datos, mediante el análisis de regresión, el cual utiliza el modelo matemático para obtener estimaciones y predicciones de una variable dada en función de valores conocidos de las otras variables. El grado de correlación entre dos variables es fundamental del análisis de correlación
REGRESIÓN:
Es la relación entre sí de dos o más variables. La cual indica que la variable dependiente se produce sobre la base de una variable independiente.
CORRELACIÓN:
Es el relación existente entre las variables de estudio, es decir si una variable dada depende de la otra variable entonces existe una correlación; por el contrario una variable que es independiente de otra variable se dice que no hay correlación o bien que la correlación es nula.
DIAGRAMA DE DISPERSIÓN:
Es la representación gráfica sobre un plano cartesiano de los valores de la variable dependiente e independiente, que es el punto de partida para el análisis de regresión y correlación, así se determina la linealidad o no linealidad
REGRESIÓN LINEAL:
La regresión lineal utiliza un modelo lineal de la forma:
Y = a + bx
Donde las constantes a y b se determinan mediante el sistema de ecuaciones:
∑ Y = a N + b ∑ X
∑ XY = a ∑ X + b ∑ X²
ANÁLISIS DE CORRELACIÓN:
Mide la intensidad con la que se relacionan linealmente las variables entre sí. La correlación no presupone relación funcional alguna, sino tan sólo se emplea para indicar el grado de relación entre las variables. Esta puede ser positiva o negativa.
COEFICIENTE DE CORRELACIÓN:
Es una medición abstracta del grado de relación entre las variables. Una cuantificación del grado en que un modelo teórico se ajusta a los datos reales de dos variables nos indica si es aplicable o no el modelo de regresión.
r = N ∑XY – ( ∑X) ( ∑ Y ) .
√[N ( ∑ X² ) – (∑ X) ² ] [N ( ∑Y² ) – ( ∑ Y ) ² ]
El rango del coeficiente de correlación es – 1 < r < + 1, si las dos variables tienen una relación lineal perfecta y cada una aumenta en forma proporcional respecto a la otra, tendría un coeficiente de correlación a 1, en tal caso se le llama correlación directa. Si su relación lineal es perfecta de modo que cuando una aumenta la otra disminuye en proporción, tendría un coeficiente de correlación igual –1 en tal caso se le llama correlación inversa. El valor 0 significa que no existe correlación entre las variables X & Y, o bien que la correlación es nula.
ERROR TÍPICO DE ESTIMA:
Es análogo a la desviación típica, se obtiene de la relación que existe entre los puntos de un diagrama de dispersión y la curva de ajuste obtenida por el método de mínimos cuadrados.
Para la regresión lineal de Y sobre X, el error típico de estima se calcula con la siguiente fórmula:
S yx = √ [( ∑ Y² – a ∑Y – b ∑ XY) / N ]
NOTA:
Es importante indicar que cuando los valores de a y b son muy pequeños, deberán tomarse por lo menos 5 ó 6 decimales.
COEFICIENTE DE DETERMINACIÓN:
Si los datos se dispersan ampliamente respecto a la ecuación de regresión, el grado de ajuste es bajo. Sin embargo, si los puntos se acumulan muy cerca de la línea de regresión, el ajuste es alto. La medida estadística que se usa para medir el grado de ajuste se llama coeficiente de determinación, el cual se calcula:
r = r²
Ejemplo:
Un grupo de inversionistas que decidieron trabajar en la bolsa de valores lo contrata a usted como asesor financiero para estimar la relación de utilidades y la inversión efectuada en miles de quetzales.
a) Determinar la ecuación de la recta de regresión de Y sobre X.
UTILIDADES INVERSIÓN
X( inversión) Y (utilidad) X² Y² XY
3 57 9 3249 171
4 78 16 6084 312
4 72 16 5184 288
2 33 4 1089 66
5 89 25 7921 445
3 63 9 3969 189
4 73 16 5329 292
5 84 25 7056 420
3 75 9 5625 225
2 48 4 2304 96
35 672 133 47810 2504
Sustituir en las ecuaciones normales:
∑ Y = a N + b ∑ X
∑ XY = a ∑ X + b ∑ X²
672 = a (10) + b 35 (1)
2504 = a 35 + b 133 (2)
133 / 35 = 3.8
Multiplica ecuación (1) por –3.8 y se obtiene una nueva ecuación (3)
-2553.6 = - a 38 – b 133 (3)
2504 = a 35 + b 133 (2)
Resto las dos ecuaciones 3 y 2
-49.6 = - a * 3
Despejo ( a )
16.53 = a
Sustituye en la ecuación (1)
672 = 16.53 (10) + b 35
Se despeja ( b)
(672 – 165.3 ) / 35 = b
14.47 = b
Y = 16.53 + 14.47 X
Si la utilidad es de Q. 7 mil, la inversión tendría que ser:
Y = 16.53 + 14.47 (7)
Y = 117.82
R/ La inversión tendría que ser Q. 117,820.00, para obtener dicha utilidad.
c) Determine el coeficiente de correlación e interprete el resultado
r = N ∑ XY – (∑ X) ( ∑ Y ) .
√[N ( ∑ X² ) – (∑ X) ² ] [N ( ∑ Y² ) – ( ∑ Y ) ² ]
r = 10 (2504) – 35 ( 672 ) .
√ [10(133 -35 ² )] [ 10 ( 47 810 - 672 ² )]
r = 0.911
R/ Su correlación es directa 0.991
Determine el error típico de estima
S yx = √ [( ∑ Y² – a ∑ Y – b ∑ XY) / N ]
S yx = √ [( 47 810 – 16.53 x 672 – 14.48 x 2504) / 10 ] S yx = 6.6627
R/ Esto significa que el valor de Y calculado por el método de mínimos cuadrados puede variar 6.662
e) El coeficiente de determinación es:
r = r² r = 0.911²
r² = 0.829921
El coeficiente de determinación es 0.829921
Si el intervalo de confianza es del 95% determine el intervalo de confianza si la inversión si la utilidad es de 7 mil.
IC = Y + Z S yx
Z = 95/2 = 0.475 Ver tabla curva normal 1.96
117.82 + 1.96 x 6.662 117.82 - 1.96 x 6.662
130.88 104.76
El intervalo de inversión se puede establecer en [104.76, 130.88] por miles de Q, con una confianza del 95%.
Bibliografía
EJERCICIOS PROPUESTOS
Los siguientes datos muestran el comportamiento de nueve auditores de acuerdo a los años de experiencia dentro de la auditoría.
Años de experiencia | 9 | 13 | 5 | 7 | 12 | 6 | 4 | 5 | 3 |
Empresas auditadas | 60 | 68 | 55 | 57 | 64 | 55 | 54 | 54 | 50 |
Realice los siguientes cálculos e interpretarlos :
a) Determine la ecuación de la recta de mínimos cuadrados a partir de la cual se pueda pronosticar el número de empresas auditadas en términos de los años de experiencia.
b) Si los años de experiencias es de 10, cuántas serían las empresas auditadas
c) ¿Cuál sería el coeficiente de correlación? interprételo
d) Calcule el error típico de estima
e) Determine el intervalo de confianza, cuando el nivel de confianza es del 90%..
Seleccionó una muestra de empleados estatales, específicamente del administrativos y se obtuvo información acerca de los ingresos y gastos en quetzales
Ingresos 25 30 40 35 20 45 55
Gastos 20 22 35 30 18 32 29
Con la información anterior calcular lo siguiente:
a. Representar gráficamente las variables
b. Estimar los gastos para un ingreso de Q.50.00
c. Determinar el coeficiente de correlación y su interpretación
d. Determinar el error estándar de regresión.
e. Establecer el intervalo de confianza, cuando el nivel de confianza es 95%