1 of 26

Econometría 1

Introducción a la modelación Econométrica

2 of 26

Frees, Edward (2010) Regression modeling with actuarial and financial applications

Website : http://research.bus.wisc.edu/RegActuaries

Datasets : http://instruction.bus.wisc.edu/jfrees/jfreesbooks/Regression%20Modeling/BookWebDec2010/data.html

Hill, Carter; Griffiths, William; Lim Guay (2011) Principles of Econometrics

Website : http://principlesofeconometrics.com/

Datasets : http://www.principlesofeconometrics.com/poe4/poe4stata.htm

Referencias Básicas:

Gujarati, Damodar; Porter, Dawn C. (2010) Econometría

Website : http://www.econometrics.com/comdata/gujarati/

Datasets: http://www.econometrics.com/comdata/gujarati/data.html

3 of 26

Blog personal

www.economia-gap.blogspot.mx

Contacto:

israelg.garciapz@udlap.mx

Israel Gerardo García Pérez, Dr. En Economía

Otros sitios de Interés

Institute for Digital Research and Education - UCLA

https://idre.ucla.edu/

http://www.ats.ucla.edu/stat/stata/

4 of 26

Sobre el estudio de la econometría

Thomas R.L (1997).

“…Es la aplicación de la estadística matemática a datos económicos con la finalidad de ofrecer soporte empírico a los modelos construidos desde la economía matemática (teoría económica) y de obtener estimaciones numéricas de estos modelos…”

Wooldridge J.(2006)

“…La econometría se basa en el desarrollo de métodos estadísticos para realizar estimaciones sobre relaciones entre variables:

-testear teorías económicas

- Evaluar e implementar políticas publicas y privadas …”

Gujarati: (2006)

“Literalmente significa medición económica, pero el alcance de la econometría es mas amplio”

-Hallar determinaciones empíricas de leyes (relaciones) económicas

-Validar o refutar planteamientos de posturas teóricas sobre problemas en el área de la economía (salud, antropología, biología)

Frees (2010)

“Regression analysis is a statistical method used to analyze data. As we will see, the distinguishing feature of this method is the ability to make statements about. variables after having controlled for values of known explanatory variables.”

Hill, Griffiths, Lim (2011)

“Econometrics is about how we can use a theory and data from economics, business, actuarial and the social sciences, along with tools from statistics, to answer “How much” questions.”

5 of 26

Objetivos del análisis Econométrico:

Fundamentalmente la econometria tiene tres objetivos.

A. Medir relaciones entre variables y estimar parámetros que nos indiquen el sentido y la magnitud de tales relaciones

B. Probar ideas teóricas sobre el comportamiento entre variables

C. Emplear la cuantificación de las relaciones entre variables para realizar pronosticos o inferencia estadística sobre su comportamiento en el futuro.

Sobre el estudio de la econometría (Definicion)

Teoría Financiera

Teoria Actuarial

Teoria Económica

Modelo teórico

Modelo econométrico

Análisis empírico

Pruebas de hipótesis

Inferencia estadística

6 of 26

Metodología empleada en Econometría.

  1. Establecimiento de una hipótesis:
  2. Especificación de un modelo teórico-matemático
  3. Especificación del modelo estadístico o econométrico
  4. Obtención de los datos vía muestreo
  5. Estimación de los parámetros del modelo econométrico (cuantificación)
  6. Testeo de hipótesis
  7. Realización de pronósticos (forecasting)
  8. Utilización del modelo econométrico para propósitos de política (pública o privada) y toma de decisiones

Sobre el estudio de la econometría (Definicion)

7 of 26

Sobre la estructura de los datos empíricos

que empleamos en ECONOMETRIA

8 of 26

Cross Sectional Data (CS)

Cross Section o cross sectional o corte trasnversal (CS)

Muestra aleatoria de individuos hogares familias o países, etc. o de una variedad de unidades tomadas en un punto en el tiempo (t) .De cada unidad de observación se hace un sondeo de varias variables.

NO hay problema alguno en el caso de que algunas variables sean captadas en diferentes periodos.

El ordenamiento de los CS no importa poner a la obs. i en la posicion 1; la j en la 2; la k en la tres o bien: j en la 1; k en la 2; i en la tres, etc.

Ejemplo

9 of 26

Time Series (TS)

Conjunto de observaciones de una o varias variables a lo largo de un periodo (t; t+1; t+2; … t+k)

NO es una muestra aleatoria; sino sistemáticamente elegida; lo cual requiere un tratamiento especial.

El incorporar tiempo en las variables genera una dependencia entre éstas y el tiempo “ la historia importa”

Existe cierta periodicidad en los datos: Mensual trimestral, cuatrimestral, anual.

La presencia de tiempo genera dos fenómenos que no se presentan en un CS.

Tendencia (trending)

Estacionalidad (seasonality)

Estacionariedad (Stationarity proccess)

10 of 26

Pooled Cross Section (PCS)

Dataset conformado por la combinacion de un cross section y un time series.

Contiene n observaciones {1,2…n} de un solo punto en el tiempo (t) y cada observacion reporta un conjunto de variables.

Adicionalmente incorpora otras m observaciones {n+1; n+2; …n+k} de otro punto distinto del tiempo (t+w) y cada observacion reporta el mismo conjunto de variables.

Dado que existen 2 bloques condistinta temporalidad, es fiundameental incorporar la variable “año” al conjunto de variables compiladas para cada observacion.

Tener un PCS requiere un tratamiento similar a un CS pero adicionalmente se debe de trabajar con el fenomeno de diferencias seculares entre año y año

11 of 26

Panel Data o Logitudinal(PD)

-Lo tenemos cuando para cada miembro i-esimo de una cross section existe una serie de tiempo

-Ejemplo: Podemos colectar para el mismo conjunto de estados de la RM datos sobre:

Tasas impositivas locales

Niveles salariales per cápita

Gasto de gobierno per cápita.

En los años de 1980, 1995 y 1990.

-Aspecto clave:

Para que sea formalmente llamado PD, es necesario que las observaciones o agentes estudiados sean exactamente los mismos en todos los cortes de tiempo. En caso contrario les consideraremos como PCS.

12 of 26

IMPORTANTE:

Notar que en PD no es relevante cual observación o agente va primero.

Notar que el ordenamiento de PD difiere de PCS pues en PD los 1,2…t años para cada i-ésimo agente van juntos.

Este ordenamiento es el preferido para PD debido a que será necesario aplicar transformaciones para cada agente del PD entre año y año.

13 of 26

Análisis Econométrico: Algunos ejemplos

[1] ¿Cómo se relacionan los gastos médicos con la demanda de seguros?

Diversos estudios han planteado una relación positiva entre el monto de gastos médicos y la demanda de seguros en salud

Hip. 1: Personas con malos niveles de salud anticipan utilizar mas servicios médicos que aquellas con buena salud.

Hip. 2: Personas con malos niveles de salud buscan mayores niveles de aseguramiento en salud para compensar sus gastos.

Hip. 3: Personas con malos niveles de salud desean obtener mayor nivel de cobertura médica:

      • Seleccionando un plan de seguro más generoso por parte de un empleador
      • Eligiendo un empleador que ofrezca un mejor plan de aseguramiento en salud.
      • Pagando mas en términos individuales para obtener mas servicios médicos

[2] Precios y Selección adversa:

Las compañías aseguradoras no utilizan el mismo precio para todos sus asegurados .

¿Cómo afecta el hecho de fumar en los costos de un seguro de vida o de gastos médicos mayores?

14 of 26

[3] Estrategias de mercado.

Administradores de una institución que realizan sorteos anualmente, desean focalizar sus ventas en zonas geográficas (pensemos en Zonas Postales -ZP-) densamente pobladas.

¿Cómo influye la densidad poblacional en el volumen de ventas de boletos del sorteo?

Ventas de Boletos por ZP = f (Habitantes en cada ZP )

En el modelo teórico, asumimos una relación lineal entre ambas variables.

Variable Y

Variable X

-Dependiente

-Explicada

-Regresando

-Endógena

-Respuesta

-Independiente

-Explicativa

-Regresora

-Exógena

-Impulso

[4] Modelo de gasto en alimentos en lo hogares

¿Cómo se comporta el gasto en alimentación de las familias ante variaciones en el ingreso?

Gasto en alimentación semanal del hogar = f (ingreso semanal del hogar)

15 of 26

Análisis Econométrico: Conceptos básicos

[2] Modelo de regresión Simple

[1] El modelo econométrico: Componente Sistemático vs. Aleatorio

Parámetros poblaciones: Intercepto y pendiente

Analizando el componente sistematico:

El componente sistemático es conocido como la media condicional de y:

[Ec.1]

16 of 26

Reagrupando tenemos:

El componente aleatorio (error aleatorio) se define como:

[Ec.2]

Componente Componente

sistemático Aleatorio

[Ec.3]

Lo que definimos como Modelo Econométrico Poblacional:

Incorporando el error aleatorio:

El término de error es la diferencia entre “y” y su media condicional:

17 of 26

La media condicional del término de error es nula:

Como las variables aleatorias {y,e} solo difieren por una constante , sus varianzas deben ser idénticas e iguales a σ2

Por lo que hay 2 supuestos impicitos en las v.a. {y,e}:

  1. E[y|x]= β12x

E[e|x]= 0

2) Var(e)=Var(y)= σ2 Varianza constante de v.a. {y,e}

Media nula del error

18 of 26

Supuestos Básicos del Modelo de Regresión Lineal Simple (MRLS)

MRLS1: El valor de y para cada valor de x está dado por:

MRLS2: El valor esperado del termino de error es:

Que es equivalente a:

MRLS3: La varianza del termino de error e, es:

Las variables aleatorias {y, e} poseen la mismas varianza porque solo difieren por una constante.

MRLS4: La covarianza entre cualquier par de errores aleatorios ei,ej es:

La versión mas fuerte de este supuesto establece que los errores aleatorios con estadísticamente independientes, en cuyo caso los valores de la variable dependiente y también son estadísticamente independientes.

MRLS5: La variable x no es aleatoria y al menos debe presentar 2 valores distintos

MRLS6: Los valores de la v.a. {e} están distribuidas normalmente alrededor de su media si es que los valores de la v.a. {y} lo están

(y viceversa)

e N(0, σ2)

y N(β1+ β2x, σ2)

~

~

19 of 26

Con valores de y, x dados; es posible obtener el componente sistemático que se representa gráficamente por

.

.

.

.

y4

y1

y2

y3

x1

x2

x3

x4

x

y

E(y|x) = β1 + β2x

Nuestro objetivo es estimar la ubicación de la línea media de la variable dependiente y, condicional a cada valor de x.

Dicha línea representa la media poblacional o el comportamiento poblacional promedio de y.

20 of 26

Por su parte, los errores poblacionales se representan gráficamente como :

.

.

.

.

y4

y1

y2

y3

x1

x2

x3

x4

}

}

{

{

e1

e2

e3

e4

x

y

E(y|x) = β1 + β2x

Cada error poblacional (ei) representa la diferencia entre la media condicional poblacional de y (el comportamiento promedio poblacional de y) y los verdaderos valores observados de y, nuestra variable dependiente.

Problema: (i) - ¡No tenemos acceso al universo! (población)

(ii) - Hay tantas líneas como parámetros beta considerados.

21 of 26

Población

Muestra

Parámetros poblacionales: {β1, β2}

Estimadores {b1, b2 } (ó )

Para resolver el problema (i), es factible considerar una muestra aleatoria de {y, x} que permita analizar la relación que prevalece entre estas variables en la población

y4

y1

y2

y3

x1

x2

x3

x4

x

y

y = b0 + b1x

e1

^

e2

^

e3

^

e4

^

^

22 of 26

El principio de Mínimos Cuadrados Ordinarios (MCO)

Este principio nos permite resolver el problema (ii).

Objetivo: elegir valores b0 b1 tales que minimicen la suma de los residuales cuadrados

Función objetivo:

b2

b1

b2

b1

*

*

Podemos hallar el valor mínimo aplicando las CPO a la función objetivo:

Diferenciando y resolviendo para b1, b2, tenemos los valores b*1 b*2

23 of 26

La estimación por MCO para b1 , b2 nos lleva a:

b2

b1

b2

b1

*

*

24 of 26

Ejemplo: Un modelo econométrico que analice la relación entre el rendimiento de gasolina (-MPG-) y el desplazamiento del motor en pulgadas cúbicas (-ED- indicador de su tamaño y potencia)

Donde: MPG Millas por galón de gas.

ED: Desplazamiento del motor

(pulgadas cubicas)

25 of 26

Los estimadores b1 b2 del modelo anterior, los obtenemos mediante MCO

Descriptive Statistics: ED_inc3, mpg

Variable N Mean StDev Variance

ED_inc3 21 238.9 109.1 11907.6

mpg 21 29.55 5.71 32.57

Covariances: ED_inc3, mpg

ED_inc3 mpg

ED_inc3 11907.590

mpg -478.880 32.571

b1 = 29.55 – (238.9*-0.0422) = 39.157

b2 = (-478.880/ 11907.59) = -0.04022

26 of 26

Regression Analysis: mpg versus ED_inc3

-------------------------------------------------

The regression equation is

mpg = 39.16 - 0.04022 ED_inc3

S = 3.74332 R-Sq = 59.1% R-Sq(adj) = 57.0%

--------------------------------------------------

Analysis of Variance

Source DF SS MS F P

Regression 1 385.177 385.177 27.49 0.000

Error 19 266.236 14.012

Total 20 651.412