Published using Google Docs
REGRESIÓN Y CORRELACIÓN.doc
Updated automatically every 5 minutes

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

FACULTAD DE CIENCIAS ECONÓMICAS

INGA. PATRICIA JUAREZ JIMENEZ, 2017

REGRESIÓN  Y CORRELACIÓN

        Analizaremos cómo ajustar un modelo simple a un conjunto de datos, mediante el análisis de regresión, el cual utiliza el modelo matemático para obtener estimaciones y  predicciones de una variable dada en función de valores conocidos de las otras variables. El grado de correlación entre dos variables es fundamental del análisis de correlación

REGRESIÓN:

        Es la relación entre sí de dos o más variables. La cual indica que  la variable dependiente se produce sobre la base de una variable independiente.

CORRELACIÓN:

        Es el relación existente entre las variables de estudio, es decir si una variable dada depende de la otra variable entonces existe una correlación; por el contrario una variable que es independiente de otra variable se dice que no hay correlación o bien que la correlación es nula.

DIAGRAMA DE DISPERSIÓN:

        Es la representación gráfica sobre un plano cartesiano de los valores de la variable dependiente e independiente, que es el punto de partida para  el análisis de regresión y correlación, así  se determina la linealidad o no linealidad

REGRESIÓN LINEAL:

        La regresión lineal utiliza un modelo lineal de la forma:

                                        Y = a + bx

Donde las constantes a y b se determinan mediante el sistema de ecuaciones:

                 Y = a N + b  X                                                                                                

                 XY = a  X + b  X²

ANÁLISIS DE CORRELACIÓN:

        Mide la intensidad con la que se relacionan linealmente las variables entre sí. La correlación no presupone relación funcional alguna, sino tan sólo se emplea para indicar el grado de relación entre las variables. Esta puede ser positiva o negativa.

COEFICIENTE DE CORRELACIÓN:

        Es una medición abstracta del grado de relación entre las variables. Una cuantificación del grado en que un modelo teórico se ajusta a los datos reales de dos variables nos indica si es aplicable o no el modelo de regresión.

 

                r =                  N ∑XY –  ( ∑X) (  Y )                .                    

                        √[N (  X² ) – ( X) ² ] [N ( Y² ) – (  Y ) ² ]

        El  rango del coeficiente de correlación es – 1 <  r < + 1, si las dos variables tienen una relación lineal perfecta y cada una aumenta en forma proporcional respecto a la otra, tendría un coeficiente de correlación a 1, en tal caso se le llama correlación directa. Si su relación lineal es perfecta de modo que cuando una aumenta la otra disminuye en proporción, tendría un coeficiente de correlación igual –1 en tal caso se le llama correlación inversa. El valor 0 significa que no existe correlación entre las variables X & Y, o bien que la correlación es nula.

ERROR TÍPICO DE ESTIMA:

        Es análogo a la desviación típica, se obtiene de la relación que existe entre  los puntos de un diagrama de dispersión  y la curva de ajuste obtenida por el método de mínimos cuadrados.

        Para la regresión lineal de Y sobre X, el error típico de estima se calcula con la siguiente fórmula:

S yx =  √ [(  Y²  – a Y – b  XY) / N ]

NOTA:

        Es importante indicar que cuando los valores de a y b son muy pequeños, deberán tomarse por lo menos 5 ó 6 decimales.

COEFICIENTE DE DETERMINACIÓN:

              Si los  datos  se dispersan ampliamente respecto a la ecuación de regresión, el grado de ajuste es bajo. Sin embargo, si los puntos se acumulan muy cerca de la línea de regresión, el ajuste es alto. La medida estadística que se usa para medir el grado de ajuste se llama coeficiente de determinación, el cual se  calcula:

r = r²

Ejemplo:

Un grupo de inversionistas que decidieron trabajar en la bolsa de valores lo contrata a usted como asesor financiero para estimar la relación de utilidades  y la inversión  efectuada en miles de quetzales.

a)        Determinar la ecuación de la recta de regresión de Y sobre   X.

UTILIDADES        INVERSIÓN

X( inversión)      Y (utilidad)                 X²                Y²                XY

        3                        57                9                   3249                171

        4                        78                16                6084                312

        4                        72                16                5184                288        

        2                           33                  4                1089                66

5                        89                25                7921                445

3                        63                9                3969                189

4                        73                16                5329                292

5                        84                25                7056                420

3                        75                9                5625                225

2                        48                4                2304                96

          35                          672                  133                  47810            2504

Sustituir en las ecuaciones normales:

         Y = a N + b  X

                  XY = a  X + b  X²

                672 = a (10) + b 35     (1)    

                   2504 = a 35 + b 133      (2)

133 / 35 = 3.8

Multiplica  ecuación (1) por –3.8 y se obtiene  una nueva ecuación (3)

                -2553.6 = - a 38 – b 133        (3)

                     2504 =   a 35 + b 133        (2)

Resto las dos ecuaciones 3 y 2

                -49.6 = - a * 3

Despejo ( a )

                                 16.53     = a

Sustituye en la ecuación  (1)

                672 = 16.53 (10) + b 35

Se despeja ( b)

                    (672 – 165.3 ) / 35 = b

                        14.47 = b

        Y = 16.53 + 14.47 X

Si la utilidad  es de Q. 7 mil, la inversión  tendría que ser:

Y = 16.53 + 14.47 (7)

        Y = 117.82

R/         La inversión tendría que ser Q. 117,820.00, para obtener dicha utilidad.

c)        Determine el coeficiente de correlación e interprete el resultado

                r =                  N  XY –  ( X) (  Y )                .                    

                        √[N (  X² ) – ( X) ² ] [N (  Y² ) – (  Y ) ² ]

                r =                 10 (2504) – 35 ( 672 )            .

                               √ [10(133 -35 ² )] [ 10 ( 47 810 - 672 ² )]

        r = 0.911

        R/        Su  correlación es directa 0.991

Determine el error típico de estima        

S yx =  √ [(  Y²  – a  Y – b  XY) / N ]

S yx =  √ [( 47 810  – 16.53 x 672 – 14.48 x 2504) / 10 ]        S yx =  6.6627

R/        Esto significa que el valor de Y calculado por el método de mínimos cuadrados puede variar 6.662

e)        El coeficiente de determinación es:

r = r²                                r = 0.911²

                               r²        = 0.829921

El coeficiente de determinación es 0.829921

Si el intervalo de confianza es del 95% determine el intervalo de confianza si  la inversión si la utilidad es de 7 mil.

 IC = Y + Z S yx                                

                Z = 95/2  = 0.475           Ver tabla curva normal    1.96

        117.82 + 1.96 x 6.662                117.82 - 1.96 x 6.662

                            130.88                                        104.76

El intervalo de inversión se puede establecer en [104.76, 130.88] por miles de Q, con una confianza del 95%.

Bibliografía

EJERCICIOS PROPUESTOS

Los siguientes datos muestran el comportamiento de nueve auditores de acuerdo a los años de experiencia dentro de la auditoría.

Años de experiencia

9

13

5

7

12

6

4

5

3

Empresas auditadas

60

68

55

57

64

55

54

54

50

Realice los siguientes cálculos e interpretarlos :

a)        Determine  la ecuación de la recta de mínimos cuadrados a partir de la cual se pueda pronosticar el número de empresas auditadas en términos de los años de experiencia.

b)         Si los años de experiencias es de 10, cuántas serían las empresas auditadas

c)        ¿Cuál sería el coeficiente de correlación?  interprételo

d)        Calcule el error típico de estima

e)        Determine el intervalo de confianza, cuando  el nivel de confianza es del 90%..

Seleccionó  una muestra de empleados estatales, específicamente del  administrativos y se obtuvo información acerca de los ingresos y gastos en quetzales

Ingresos        25        30        40        35        20        45        55

Gastos                    20        22        35        30        18        32        29

Con la información anterior calcular lo siguiente:

a.        Representar gráficamente las  variables

b.        Estimar los gastos para un ingreso de Q.50.00

c.        Determinar el coeficiente de correlación y su interpretación

d.        Determinar el error estándar de regresión.

e.        Establecer el intervalo de confianza, cuando el nivel de confianza es 95%