Inferencia causal -...

33
1 Inferencia causal Francisco Gallego PUC Chile y J-PAL Santiago, 9 de abril de 2013

Transcript of Inferencia causal -...

1

Inferencia causal Francisco Gallego PUC Chile y J-PAL Santiago, 9 de abril de 2013

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

2

1. Motivación

• Las preguntas empíricas más difíciles en ciencias sociales y en políticas públicas involucran relaciones causa-efecto del tipo:

– ¿Mejora la descentralización de las escuelas la calidad de la

educación? – ¿Un año de capacitación causa mayores ingresos? Y, más

importante quizás, ¿qué tipo de capacitación causa mayores aumentos de ingresos?

– ¿Mejoran las transferencias condicionadas los resultados de salud y educación de los niños? O, ¿lo hacen porque condicionan o porque entregan dinero adicional?

3

• Responder estas preguntas es importante porque:

– Ayudan a responder preocupaciones de política • ¿Logran los programas reducir la pobreza? ¿Podrían

reducirla más rápido con los mismos recursos?

– Problemas que enfrentan los tomadores de decisiones

– Consideraciones teóricas de estudio en ciencias sociales

4

1. Motivación

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual

5

2. ¿Cómo responder las preguntas?: Evaluación de Impacto

El impacto de un programa es la diferencia entre:

1. Los resultados que los participantes del programa obtienen un tiempo después de participar en el programa y

2. Los resultados que esos mismos participantes hubieran obtenido en ese mismo momento si no hubiesen participado en el programa.

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

7

2.1. Evaluación de impacto

2.1.2. Impacto: ¿Qué es?

Tiempo

Resu

ltado

prim

ario

Impacto

Intervención

Tiempo

Intervención

2.1.3. ¿Cómo Evaluar Impacto?

Impacto

Resu

ltado

prim

ario

Tiempo

Intervención

Impacto

Resu

ltado

prim

ario

2.1.3. ¿Cómo Evaluar Impacto?

• El contrafactual representa el estado del mundo que participantes del programa habrían experimentado en la ausencia del programa

• Problema: No se puede observar el contrafactual • Solución: Tenemos que “replicar” o “construir” el

contrafactual

2.2. Contrafactual

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal

12

3.1. Análisis estadístico estándar

• Herramientas: probabilidad y otras técnicas de estimación

• Objetivo: inferir parámetros de una distribución a partir de muestras de esta distribución

• Uso: Con la ayuda de los parámetros, uno puede: – Inferir asociación entre variables, – Estimar probabilidad de ocurrencia de eventos pasados o

futuros – Actualizar pro;

• Condición: las condiciones experimentales no pueden cambiarse

13

3.2. Análisis causal

• Va un paso más allá que el análisis estadístico estándar

• Objetivo: inferir aspectos del proceso de generación de datos

• Uso: Con la ayuda de tales aspectos, se puede: – Deducir la probabilidad de ocurrencia si el contexto no

cambia (análisis “estático”) – Predecir como cambian las variables si cambia el contexto

(análisis “dinámico”)

14

• La idea de dinámica de los eventos cuando cambian las condiciones incluye: – Predecir los efectos de intervenciones – Predecir los efectos de cambios espontáneos – Identificar las causas de los eventos

• Distinción entre causalidad y correlación – Nuevo lenguaje – Causalidad es la clave para decisiones de políticas

• ¿Si hacemos XXX, lograremos YYYY? No basta con saber que XXX está asociado con YYY…

15

3.2. Análisis causal

3.2.1. Modelo Causal de Neyman (1923), Rubin (1974)

• Modelo de resultados potenciales • Definamos a la población por la letra U.

– Cada unidad en U se denota u.

• Para cada u ϵ U: – Y(u): variable de respuesta – A: atributo de las unidades en U.

• Idea: exponer a cada unidad a la acción de una causa • Rubin asume que las causas son acciones que,

hipotéticamente, podrían ser tratamientos

16

3.2.2. Modelo Causal y tratamientos

• Supongamos, por simplicidad que hay sólo 2 causas o niveles de tratamiento.

• Sea D una variable que indica la causa a la que cada unidad en U es expuesta:

• En un estudio controlado, D es construido por el experimentador/evaluador

• En un estudio no controlado, D es determinado por factores que van más allá del experimentador/evaluador

17

= control al expuesta es unidad la si0

to tratamienal expuesta es unidad la si1uu

D

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

18

4.1. Modelo Causal y tratamientos

• Y son afectados potencialmente por t o c. • O sea puede haber 2 variables de respuesta para el

mismo u: – Y1(u): valor de la respuesta si la unidad u fuera expuesta al

tratamiento. – Y0(u) : valor de la respuesta si la unidad u fuera expuesta al

control.

• Entonces, el resultado de cada individuo puede ser escrito como (si es que no hay externalidades):

19

( ) )(1)()( 01 uYDuDYuY −+=

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

• ¿Cómo se traduce esto al lenguaje del modelo causal de Rubin?

20

4.2. Evaluación de Impacto y modelo causal

4.3. Modelo Causal y evaluación de impacto

• Para cada unidad u, el tratamiento causa: • Problema Fundamental de Inferencia Causal:

– Para el mismo u, no se puede observar Y1(u) y Y0(u)

• O sea no tenemos el contrafactual para cada u – Un individuo no puede estar al mismo tiempo recibiendo y

no recibiendo el tratamiento…

• ¿Qué hacemos?

21

)()( 01 uYuYu −=δ

• ¿Y el efecto causal en promedio? • El efecto tratamiento promedio (ATE) sobre U (o una sub-

población de U es):

• O sea la solución estadística reemplaza el efecto causal a nivel de cada unidad por el efecto causal promedio en una población de U unidades.

22

[ ][ ] [ ]

δ=

−=

−=−=

01

01

01

)()()()(

YY

uYEuYEuYuYEATE

UU

UU

4.3. Modelo Causal y evaluación de impacto

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

23

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

4.3. Modelo Causal y evaluación de impacto

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

24

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

4.3. Modelo Causal y evaluación de impacto

• Entonces consideremos estimar:

• Usando el siguiente estimador: • (1) está definida para la población • (2) se estima usando una muestra de la población

25

[ ](1)

)()(

01

01

YY

uYuYEATE UU

−=

−=

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

δ̂

4.3. Modelo Causal y evaluación de impacto

• Sea π la proporción de la población asignada al grupo tratamiento

• Entonces ATE se puede descomponer como:

26

{ } ( ) { }

[ ] ( )[ ][ ] ( )[ ]{ }

[ ] ( )[ ]{ }0|11|

0|11|

0|11|

1

00

11

0101

01

=−+=

−=−+==

=−−+=−=

−+= ==

DYDY

DYDY

DYYDYYDD

ππ

ππ

ππ

δπδπδ

4.3. Modelo Causal y evaluación de impacto

• Supongamos que:

• Entonces:

• Lo que se puede estimar de modo consistente por:

27

[ ] [ ][ ] [ ]0|1|

y 0|1|

00

11

===

===

DYDY

DYDY

[ ] ( )[ ]{ }[ ] ( )[ ]{ }

[ ] [ ]0|1|

0|11|

0|11|

01

00

11

=−==

=−+=

−=−+==

DYDY

DYDY

DYDY

ππ

ππδ

[ ] [ ] (2) 1|ˆ1|ˆˆ01 =−== DYDYδ

4.3. Modelo Causal y evaluación de impacto

• ¿Tienen sentido

• O sea: – El resultado promedio:

• Bajo el tratamiento no difiere en entre los grupos de tratamiento y control • Bajo el control no difiere en entre los grupos de tratamiento y control

• Para satisfacer estas condiciones es suficiente que la asignación del tratamiento D no esté correlacionada con los resultados potenciales de Y1(u) y Y0(u)

• La forma principal de lograr esta no-correlación es a través de la asignación aleatoria del tratamiento. – En la siguiente clase hablaremos de esto con más detalle.

28

[ ] [ ][ ] [ ]0|1|

y 0|1|

00

11

===

===

DYDY

DYDY

4.3. Modelo Causal y evaluación de impacto

• En muchos casos simplemente no hay información disponible sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento – …y viceversa, como los del grupo tratamiento hubieran reaccionado si

hubiesen recibido el control…

• Ésta es la base para comprender los sesgos del estimador (2). • De hecho usando un poco de álgebra, se puede demostrar

que:

29

[ ] [ ]{ }( ) { } { }[ ]

to tratamienefecto de idadHeterogene

01

ientosin tratam Diferencia

00

1

0|1|ˆ

== −−+

=−=+=

DD

DYDY

δδπ

δδ

4.3. Modelo Causal y evaluación de impacto

• Dos grandes fuentes de sesgo de selección: 1. Sesgo de selección 2. Heterogeneidad en los efectos del tratamiento

• La mayoría de los métodos disponibles se enfocan en 1.,

asumiendo que los efectos tratamiento son homogéneos en la población (o redefiniendo los parámetros de interés en la población)

[ ] [ ]{ } ( ) { } { }[ ]

nto tratamieefecto de idadHeterogene

01

mientosin trata Diferencia

00 10|1|ˆ== −−+=−=+= DDDYDY δδπδδ

4.3. Modelo Causal y evaluación de impacto

4.4. Otros parámetros de interés

• ATE no siempre es el parámetro de interés de política pública. • En ocasiones, por ejemplo, interesa más el efecto tratamiento

promedio para la persona bajo intervención, o sea:

• Notar que la diferencia entre ATE y TOT sólo tiene sentido si hay heterogeneidad en los efectos tratamiento en la población U (si no, todos son iguales…)

31

[ ][ ] [ ]1|)(1|)(

1|)()(

01

01

=−===−=

DuYEDuYEDuYuYETOT

• ¿Cuándo nuestro estimador (2) estima consistentemente TOT?

• Como es evidente, este estimador lo hace bien si:

32

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

[ ] [ ] 0|1| 00 === DYDY

4.4. Otros parámetros de interés

• En algunas situaciones de políticas pública interesa conocer el efecto promedio de ofrecer el programa (ITT)

– ¿“Qué le ocurrió al niño promedio que está en una escuela tratada en

esta población?” – “¿Qué le ocurrió a la persona promedio que recibió una oferta del

tratamiento?”

• Suponga que la intención de tratar ¿Es este el número adecuado a buscar?, ¿Es el efecto del tratamiento?

• La lógica es exactamente la misma que en los estimadores

previos pero en este caso D=1 refleja la oferta del tratamiento y no que las personas hayan sido efectivamente tratadas.

33

4.4. Otros parámetros de interés