Instrumental Variables: Weak Instruments & LATE

50 cards

This note provides a review of instrumental variables (IV), focusing on weak instruments and heterogeneous treatment effects. It covers the basic assumptions and mechanics of IV estimation, potential issues like weak instruments and their impact on bias and precision, and the interpretation of IV estimates as Local Average Treatment Effects (LATE). The note also discusses methods for identifying and testing IV assumptions, along with examples and applications.

50 cards

Review

Spaced repetition shows you each card at the optimal time for long-term memorization, with increasingly spaced reviews.

Question

Quel est le but principal des variables instrumentales (VI) ?

Answer

Traiter les problèmes d'endogénéité, où une variable explicative est corrélée avec le terme d'erreur, en utilisant une source de variation exogène.

Question

Quand le traitement T est-il considéré comme endogène ?

Answer

Lorsque le traitement T est corrélé avec des facteurs inobservables affectant le résultat Y, soit cov(ε, T) ≠ 0.

Question

Quelle est l'idée de base derrière l'utilisation d'un instrument Z ?

Answer

Utiliser une source de variation exogène (Z) qui influence le traitement T, mais n'affecte pas directement le résultat Y.

Question

Quelle est l'hypothèse de pertinence d'un instrument ?

Answer

L'instrument Z doit être corrélé au traitement T. Mathématiquement, cov(T, Z) ≠ 0.

Question

Quelle est l'hypothèse d'exogénéité (ou d'exclusion) d'un instrument ?

Answer

L'instrument Z ne doit pas être corrélé aux inobservables affectant Y. Mathématiquement, cov(Z, ε) = 0.

Question

Donnez la formule de l'estimateur VI simple.

Answer

β̂_VI = cov(Y, Z) / cov(T, Z). C'est le ratio de l'effet de Z sur Y à l'effet de Z sur T.

Question

Qu'est-ce que le modèle en deux étapes (DMCO / 2SLS) ?

Answer

1. Prédire T avec Z (première étape). 2. Utiliser les valeurs prédites de T (T̂) pour estimer l'effet sur Y (deuxième étape).

Question

Qu'est-ce que la forme réduite dans un modèle VI ?

Answer

C'est l'équation qui exprime le résultat Y directement en fonction de l'instrument Z, capturant l'effet total de Z sur Y.

Question

Comment l'estimateur VI est-il lié à la première étape et à la forme réduite ?

Answer

L'estimateur VI est le coefficient de la forme réduite divisé par le coefficient de la première étape (β̂_VI = θ / π).

Question

Qu'est-ce que l'estimateur de Wald ?

Answer

C'est un cas spécial de l'estimateur VI utilisé lorsque l'instrument est binaire, calculé comme le ratio des différences de moyennes.

Question

Qu'est-ce qu'un instrument faible ?

Answer

Un instrument ayant une faible corrélation avec la variable de traitement endogène, ce qui le rend peu pertinent.

Question

Quel est le principal problème des instruments faibles ?

Answer

Ils produisent des estimateurs VI imprécis (grande variance) et potentiellement plus biaisés que les MCO, même avec de grands échantillons.

Question

Comment la variance de l'estimateur DMCO se compare-t-elle à celle des MCO ?

Answer

Elle est toujours plus grande. Le ratio des variances est inversement proportionnel au R² de la première étape: [R²_T,Z]^-1.

Question

Quelle est la règle empirique de Staiger & Stock (1997) pour les instruments faibles ?

Answer

Une statistique F > 10 pour la significativité des instruments dans la régression de la première étape est nécessaire pour écarter les instruments faibles.

Question

Comment un instrument faible affecte-t-il le biais de l'estimateur VI en échantillon fini ?

Answer

Le biais de l'estimateur VI est inversement proportionnel à la statistique F de la première étape, le rendant important si l'instrument est faible.

Question

Est-ce que l'hypothèse d'exogénéité est testable ?

Answer

Non, elle n'est pas formellement testable avec un seul instrument. Elle doit être justifiée de manière convaincante par la théorie ou le design de l'étude.

Question

Qu'est-ce qu'un test de sur-identification (Sargan ou Hansen) ?

Answer

Un test utilisé quand il y a plus d'instruments que de variables endogènes pour vérifier si les instruments additionnels sont valides.

Question

Qu'est-ce que l'Effet Local Moyen du Traitement (LATE) ?

Answer

C'est l'effet causal estimé par la VI, qui s'applique uniquement à la sous-population dont le statut de traitement est modifié par l'instrument.

Question

À quel groupe s'applique le LATE ?

Answer

Le LATE est l'effet moyen du traitement uniquement pour les 'compliers'.

Question

Définir les 'compliers' dans le contexte VI.

Answer

Les individus qui reçoivent le traitement si on les y encourage (T(1)=1) et ne le reçoivent pas sinon (T(0)=0).

Question

Définir les 'always-takers'.

Answer

Les individus qui reçoivent toujours le traitement, que l'instrument soit présent ou non (T(0)=1, T(1)=1).

Question

Définir les 'never-takers'.

Answer

Les individus qui ne reçoivent jamais le traitement, que l'instrument soit présent ou non (T(0)=0, T(1)=0).

Question

Définir les 'defiers'.

Answer

Les individus qui font le contraire de ce que l'instrument encourage (T(0)=1, T(1)=0).

Question

Quelle est l'hypothèse de monotonicité dans le modèle LATE ?

Answer

L'instrument ne pousse aucun individu à faire le contraire de l'encouragement. Cela signifie qu'il n'y a pas de 'defiers'.

Question

Que représente la première étape de l'estimateur de Wald en termes de LATE ?

Answer

Elle estime la proportion de 'compliers' dans la population.

Question

Pourquoi le LATE peut-il différer de l'ATE (Effet Moyen du Traitement) ?

Answer

Parce que l'effet du traitement pour les 'compliers' peut être différent de l'effet moyen pour l'ensemble de la population.

Question

Peut-on identifier empiriquement qui est un 'complier' ?

Answer

Non, on ne peut pas identifier les individus 'compliers', mais on peut estimer leur part dans la population.

Question

Quand les estimations par VI n'ont-elles aucune interprétation causale ?

Answer

Si les effets du traitement sont hétérogènes et qu'il existe des 'defiers'.

Question

Que se passe-t-il si on utilise différents instruments pour estimer le même effet ?

Answer

Ils peuvent identifier différents LATEs, car chaque instrument peut affecter une sous-population de 'compliers' différente.

Question

Quel est le problème de validité externe du LATE ?

Answer

Les résultats ne s'appliquent qu'aux 'compliers' et ne peuvent pas être généralisés à toute la population, surtout si les 'compliers' sont peu nombreux.

Question

Quelle est la source la plus crédible pour un instrument 'idéal' ?

Answer

Les essais contrôlés randomisés (ECR) avec un design d'encouragement, où l'encouragement est assigné de manière aléatoire.

Question

Citez un exemple d'instrument issu d'une quasi-expérience.

Answer

Le trimestre de naissance pour estimer l'effet de l'éducation sur le salaire (Angrist & Krueger, 1991).

Question

Pourquoi la méthode VI n'est-elle pas toujours utilisée ?

Answer

Parce que trouver un instrument à la fois pertinent (non faible) et véritablement exogène (crédible) est extrêmement difficile.

Question

Quel est le biais de l'estimateur MCO en cas d'endogénéité ?

Answer

Le biais est donné par la formule cov(ε, T) / V(T), qui est non nul si le traitement est endogène.

Question

Comment s'écrit la variance asymptotique de l'estimateur DMCO, Avar(β̂_2SLS) ?

Answer

Avar(β̂_2SLS) = Avar(β̂_MCO) × [R²_T,Z]^-1. Elle est toujours supérieure à la variance des MCO.

Question

Que signifie un modèle juste identifié en VI ?

Answer

Le nombre d'instruments est exactement égal au nombre de variables endogènes. Aucun test de sur-identification n'est possible.

Question

Que signifie un modèle sur-identifié en VI ?

Answer

Il y a plus d'instruments que de variables endogènes, ce qui permet de tester la validité des instruments additionnels.

Question

Qu'est-ce que l'effet 'intention-to-treat' (ITT) ?

Answer

L'effet de l'assignation à l'instrument sur le résultat, sans tenir compte de la prise réelle du traitement. C'est le numérateur de l'estimateur VI.

Question

Comment le LATE est-il lié à l'ITT ?

Answer

LATE est l'effet ITT divisé par la proportion de 'compliers'. Il 'redresse' l'ITT pour obtenir l'effet sur ceux qui ont réagi à l'instrument.

Question

Comment peut-on estimer la part des 'always-takers' (π_a) ?

Answer

En calculant la probabilité de recevoir le traitement quand l'instrument est absent: π_a = P(T=1 | Z=0).

Question

Comment peut-on estimer la part des 'never-takers' (π_n) ?

Answer

En calculant la probabilité de ne pas recevoir le traitement quand l'instrument est présent: π_n = P(T=0 | Z=1).

Question

Quelle est la première étape dans la mise en œuvre d'une estimation par VI ?

Answer

Trouver un bon instrument: une variable exogène qui affecte fortement la probabilité de traitement mais pas directement le résultat.

Question

Quel est le lien entre le biais d'un instrument faible et l'estimateur MCO ?

Answer

En échantillon fini, l'estimateur VI est biaisé dans la direction de l'estimateur MCO, et ce biais est plus grand lorsque l'instrument est faible.

Question

Quel est l'impact de plusieurs instruments faibles ?

Answer

Ils peuvent aggraver le problème du biais de l'estimateur VI, même s'ils améliorent légèrement le R² de la première étape.

Question

Dans Y = Tβ + ε, l'estimateur VI élimine quel biais ?

Answer

Il vise à éliminer le biais d'endogénéité, qui provient de la corrélation entre la variable de traitement T et le terme d'erreur ε.

Question

Pourquoi doit-on utiliser des erreurs-types robustes avec les DMCO ?

Answer

Pour corriger les erreurs-types estimées à la deuxième étape, car elles ne tiennent pas compte de l'incertitude de la prédiction T̂ de la première étape.

Question

Quel est le risque si un instrument est 'un peu' endogène et faible ?

Answer

L'estimateur VI peut être encore plus biaisé (moins convergent) que l'estimateur MCO qu'il est censé corriger.

Question

Dans quel article Angrist, Imbens & Rubin (1996) ont-ils formalisé le LATE ?

Answer

Dans leur article 'Identification of causal effects using instrumental variables' publié dans le JASA.

Question

Quel instrument Duflo (2001) utilise-t-elle pour les rendements de l'éducation ?

Answer

Un programme massif de construction d'écoles en Indonésie, qui a généré une variation exogène de l'accès à l'éducation.

Question

Comment l'écart entre les estimations MCO et VI doit-il être interprété ?

Answer

Comme une combinaison de la correction du biais d'endogénéité et d'un changement dans la population étudiée (ATE vs LATE).

Rappels sur les Variables Instrumentales (VI)

Introduction aux Variables Instrumentales (VI)

L'utilisation des VI pour l'endogénéité en économétrie est très ancienne (Wright, 1928).

Les VI sont un outil crucial lorsque le traitement est endogène, souvent dû à l'auto-sélection.
Idée de base: Utiliser une variation exogène qui affecte le traitement mais pas directement le résultat .
Souvent désignées comme "expériences naturelles" ou "quasi-expériences".

Hypothèses fondamentales pour l'identification des effets causaux:

Indépendance: (L'instrument n'affecte pas l'issue potentielle directement).
Pertinence: (L'instrument est corrélé au traitement).

Pourquoi les VI sont nécessaires:

Lorsque est endogène (), l'estimateur MCO est biaisé.
Le biais des MCO est . L'objectif des VI est de l'éliminer.

Fonctionnement des Variables Instrumentales

L'intuition des VI est d'isoler la variabilité du traitement induite par une variable exogène .

Quand varie, la probabilité de traitement change, et certains individus modifient leur statut de traitement.
On mesure le changement des résultats lié à ce changement de statut de traitement.
Ce changement est censé être indépendant des facteurs inobservables, permettant d'attribuer le changement aux effets du traitement.

Modèle en deux étapes:

Première étape: Modélisation de la sélection dans le traitement:
Deuxième étape: Utilisation des variations exogènes de pour estimer l'effet causal.

Les trois hypothèses clés pour un instrument valide:

Hypothèse 1 (Pertinence): est corrélé au traitement .
- .
- affecte la probabilité de traitement.
Hypothèse 2 (Exogénéité): est indépendant des inobservables .
- (Z est exogène dans l'équation de traitement).
- (Z n'influence pas directement le résultat).
Hypothèse 3 (Exclusion): n'est pas une fonction déterministe de (variables de contrôle).
- Les variables peuvent être incluses dans le modèle, mais doit apporter une source de variation exclusive.

Estimateur VI:

Si les hypothèses (1) et (2) tiennent, l'estimateur VI est:

permet d'identifier l'effet causal de sur en éliminant le biais.

Forme réduite du modèle:

À partir du système:

La forme réduite est , où .

a un effet indirect sur via . Pour trouver , on divise par .

Estimateur de Wald (pour Z binaire):

Si est une variable binaire (0 ou 1):

Utilise le changement exogène dans la probabilité de traitement pour estimer l'effet causal.

Modèle général en deux étapes (avec covariables ):

Méthode des Doubles Moindres Carrés Ordinaires (DMCO ou 2SLS):
1. Estimer la première étape: .
2. Estimer la deuxième étape en remplaçant par .
3. Attention aux erreurs standards (utiliser logiciels spécialisés).

Instruments Crédibles et Exemples

Un instrument crédible affecte mais pas directement .

Sources d'instruments crédibles:

Expériences contrôlées (ECR):
- Des ECR avec un design d'encouragement créent des instruments "idéaux".
- est une incitation au traitement ().
- est assigné aléatoirement ().
Quasi-expériences: Variations exogènes dans l'environnement des individus.
- Aléas naturels:
  - Ex: Trimestre de naissance (Angrist & Krueger, 1991) pour l'impact de l'éducation sur les salaires.
  - Ex: Variation des précipitations (Chort & Senne, 2018) pour l'impact de la migration sur les revenus.
  - Ex: Sexe des enfants (Angrist & Evans, 1998) pour l'impact de la fertilité sur l'offre de travail des femmes.
  - Tableaux de Wald Estimates montrent l'impact de la taille de la famille sur le travail des femmes.
- Règles ou lois institutionnelles:
  - Ex: Date de naissance pour la loterie de la conscription militaire (Angrist, 1990) pour l'impact de l'expérience sur les salaires.
  - Ex: Construction d'écoles (Duflo, 2001) pour l'impact de l'éducation.

Limites de la Méthode VI

Pourquoi les VI ne sont pas utilisées systématiquement?

L'exogénéité doit être très convaincante (les instruments crédibles imitent des expériences).
Les instruments ne découlent souvent pas d'un modèle théorique explicite, posant des problèmes d'interprétation.
Les instruments peuvent être anecdotiques et peu reproductibles.
Un instrument crédible peut être un instrument faible (explique peu la variation du traitement).
Si l'effet du traitement est hétérogène, la VI estime uniquement un Effet Local Moyen du Traitement (LATE).

Tests des Hypothèses des VI

Hypothèse 2 (Exogénéité):

Avec un instrument (modèle juste identifié), l'exogénéité est non testable.
Avec plusieurs instruments (modèle sur-identifié), on peut réaliser des tests de sur-identification (test de Sargan pour homoscédasticité, test J de Hansen pour hétéroscédasticité).
- Ces tests vérifient seulement la cohérence globale et ne prouvent pas l'exogénéité pour chaque instrument.
Conclusion: L'hypothèse 2 est rigoureusement non testable. Il faut être très convaincant sur l'exogénéité.

Hypothèse 3 (Exclusion):

Relativement facile à justifier empiriquement.
Vérification: Régression des instruments sur les variables . Si le est proche de 1, il y a un problème. S'il est proche de 0, il n'y a probablement pas de relation déterministe.

Hypothèse 1 (Pertinence):

Examiner la première étape attentivement.
C'est ici que les problèmes d'instruments faibles apparaissent.

Instruments Faibles

Qu'est-ce qu'un instrument faible?

Un instrument qui a un pouvoir explicatif limité sur le traitement endogène .
- Faible ou faible F-stat de la première étape.
- Peut arriver même si est exogène.

Pourquoi un instrument faible est-il un problème?

Les estimateurs IV sont imprécis et peuvent être plus biaisés que les MCO.
Les propriétés asymptotiques (convergence) des IV ne sont pas valides avec des instruments faibles, même pour de grands échantillons.

Trois problèmes principaux des instruments faibles:

L'estimateur VI est beaucoup plus imprécis que les MCO.
- .
- Une variance des DMCO (2SLS) beaucoup plus grande que celle des MCO si est faible.
Si n'est pas strictement exogène, n'est pas convergent et peut être plus biaisé que .
- Le biais relatif .
- Même un léger problème d'exogénéité peut rendre plus biaisé si est faible.
Si est strictement exogène, est convergent mais biaisé en échantillons de taille finie vers les MCO.
- Le biais est inversement proportionnel à la statistique F de la première étape.
- Règle empirique de Staiger & Stock (1997): pour écarter les instruments faibles.

Effets Hétérogènes du Traitement et LATE

Réponse individuelle à l'instrument ( binaire):

Fonction de réponse individuelle: attribue une valeur du traitement à l'instrument.
Quatre populations instrumentales:
- Compliers: et (changent de traitement avec ).
- Never-takers: et (ne sont jamais traités).
- Always-takers: et (sont toujours traités).
- Defiers: et (agissent à l'encontre de l'instrument).

Angrist, Imbens & Rubin (1996) ont montré que les VI estiment uniquement l'effet du traitement pour les 'compliers'. Cet estimateur est un Effet Local Moyen du Traitement (LATE).

Hypothèses supplémentaires pour le LATE:

Indépendance de l'instrument:
- (Z est indépendant des résultats potentiels).
- (Z est indépendant des types d'individus, réparti aléatoirement entre les populations).
Monotonicité:
- (Pas de 'defiers').
- La réponse des individus va toujours dans la même direction; l'instrument n'incite jamais à l'inverse.

Interprétation du LATE:

Sous l'hypothèse de monotonie, seuls les 'compliers' contribuent à l'estimation.
L'estimateur de Wald devient: .
Le LATE est un effet "intention-to-treat" (ITT) ajusté par la proportion de compliers.
Problème: Si l'hétérogénéité des effets est liée à la réponse à l'instrument, alors (Average Treatment Effect).
On ne peut jamais savoir qui est un 'complier' car on n'observe qu'une seule valeur pour chaque individu.
On peut estimer la part des 'compliers': .

Implications pour l'interprétation des VI:

Pas d'interprétation si effets hétérogènes et des 'defiers' sont présents.
Le LATE est un effet local (problème de validité externe si peu de 'compliers').
Différents instruments peuvent identifier des LATEs différents (sur différentes sous-populations de 'compliers').
Les DMCO avec plusieurs instruments est une somme pondérée des LATEs.
L'écart entre MCO et VI combine correction de biais et changement de population estimée.

Étapes de mise en œuvre des estimations par VI:

Trouver un bon instrument: Exogène et affectant le traitement, pas le résultat.
Vérifier l'exogénéité: Strictement non testable, donc soyez rigoureux (et convaincant).
Vérifier la pertinence: Examiner la première étape et la F-stat (doit être ).
Estimer la seconde étape: Utiliser DMCO (2SLS) avec des logiciels adaptés pour les erreurs standards.
Interpréter les résultats: Comme un LATE. Discuter la validité externe si peu de 'compliers'.

Start a quiz

Test your knowledge with interactive questions