Instrumental Variables: Weak Instruments & LATE
50 cardsThis note provides a review of instrumental variables (IV), focusing on weak instruments and heterogeneous treatment effects. It covers the basic assumptions and mechanics of IV estimation, potential issues like weak instruments and their impact on bias and precision, and the interpretation of IV estimates as Local Average Treatment Effects (LATE). The note also discusses methods for identifying and testing IV assumptions, along with examples and applications.
50 cards
Rappels sur les Variables Instrumentales (VI)
Introduction aux Variables Instrumentales (VI)
L'utilisation des VI pour l'endogénéité en économétrie est très ancienne (Wright, 1928).
Les VI sont un outil crucial lorsque le traitement est endogène, souvent dû à l'auto-sélection.
Idée de base: Utiliser une variation exogène qui affecte le traitement mais pas directement le résultat .
Souvent désignées comme "expériences naturelles" ou "quasi-expériences".
Hypothèses fondamentales pour l'identification des effets causaux:
Indépendance: (L'instrument n'affecte pas l'issue potentielle directement).
Pertinence: (L'instrument est corrélé au traitement).
Pourquoi les VI sont nécessaires:
Lorsque est endogène (), l'estimateur MCO est biaisé.
Le biais des MCO est . L'objectif des VI est de l'éliminer.
Fonctionnement des Variables Instrumentales
L'intuition des VI est d'isoler la variabilité du traitement induite par une variable exogène .
Quand varie, la probabilité de traitement change, et certains individus modifient leur statut de traitement.
On mesure le changement des résultats lié à ce changement de statut de traitement.
Ce changement est censé être indépendant des facteurs inobservables, permettant d'attribuer le changement aux effets du traitement.
Modèle en deux étapes:
Première étape: Modélisation de la sélection dans le traitement:
Deuxième étape: Utilisation des variations exogènes de pour estimer l'effet causal.
Les trois hypothèses clés pour un instrument valide:
Hypothèse 1 (Pertinence): est corrélé au traitement .
.
affecte la probabilité de traitement.
Hypothèse 2 (Exogénéité): est indépendant des inobservables .
(Z est exogène dans l'équation de traitement).
(Z n'influence pas directement le résultat).
Hypothèse 3 (Exclusion): n'est pas une fonction déterministe de (variables de contrôle).
Les variables peuvent être incluses dans le modèle, mais doit apporter une source de variation exclusive.
Estimateur VI:
Si les hypothèses (1) et (2) tiennent, l'estimateur VI est:
permet d'identifier l'effet causal de sur en éliminant le biais.
Forme réduite du modèle:
À partir du système:
La forme réduite est , où .
a un effet indirect sur via . Pour trouver , on divise par .
Estimateur de Wald (pour Z binaire):
Si est une variable binaire (0 ou 1):
Utilise le changement exogène dans la probabilité de traitement pour estimer l'effet causal.
Modèle général en deux étapes (avec covariables ):
Méthode des Doubles Moindres Carrés Ordinaires (DMCO ou 2SLS):
Estimer la première étape: .
Estimer la deuxième étape en remplaçant par .
Attention aux erreurs standards (utiliser logiciels spécialisés).
Instruments Crédibles et Exemples
Un instrument crédible affecte mais pas directement .
Sources d'instruments crédibles:
Expériences contrôlées (ECR):
Des ECR avec un design d'encouragement créent des instruments "idéaux".
est une incitation au traitement ().
est assigné aléatoirement ().
Quasi-expériences: Variations exogènes dans l'environnement des individus.
Aléas naturels:
Ex: Trimestre de naissance (Angrist & Krueger, 1991) pour l'impact de l'éducation sur les salaires.
Ex: Variation des précipitations (Chort & Senne, 2018) pour l'impact de la migration sur les revenus.
Ex: Sexe des enfants (Angrist & Evans, 1998) pour l'impact de la fertilité sur l'offre de travail des femmes.
Tableaux de Wald Estimates montrent l'impact de la taille de la famille sur le travail des femmes.
Règles ou lois institutionnelles:
Ex: Date de naissance pour la loterie de la conscription militaire (Angrist, 1990) pour l'impact de l'expérience sur les salaires.
Ex: Construction d'écoles (Duflo, 2001) pour l'impact de l'éducation.
Limites de la Méthode VI
Pourquoi les VI ne sont pas utilisées systématiquement?
L'exogénéité doit être très convaincante (les instruments crédibles imitent des expériences).
Les instruments ne découlent souvent pas d'un modèle théorique explicite, posant des problèmes d'interprétation.
Les instruments peuvent être anecdotiques et peu reproductibles.
Un instrument crédible peut être un instrument faible (explique peu la variation du traitement).
Si l'effet du traitement est hétérogène, la VI estime uniquement un Effet Local Moyen du Traitement (LATE).
Tests des Hypothèses des VI
Hypothèse 2 (Exogénéité):
Avec un instrument (modèle juste identifié), l'exogénéité est non testable.
Avec plusieurs instruments (modèle sur-identifié), on peut réaliser des tests de sur-identification (test de Sargan pour homoscédasticité, test J de Hansen pour hétéroscédasticité).
Ces tests vérifient seulement la cohérence globale et ne prouvent pas l'exogénéité pour chaque instrument.
Conclusion: L'hypothèse 2 est rigoureusement non testable. Il faut être très convaincant sur l'exogénéité.
Hypothèse 3 (Exclusion):
Relativement facile à justifier empiriquement.
Vérification: Régression des instruments sur les variables . Si le est proche de 1, il y a un problème. S'il est proche de 0, il n'y a probablement pas de relation déterministe.
Hypothèse 1 (Pertinence):
Examiner la première étape attentivement.
C'est ici que les problèmes d'instruments faibles apparaissent.
Instruments Faibles
Qu'est-ce qu'un instrument faible?
Un instrument qui a un pouvoir explicatif limité sur le traitement endogène .
Faible ou faible F-stat de la première étape.
Peut arriver même si est exogène.
Pourquoi un instrument faible est-il un problème?
Les estimateurs IV sont imprécis et peuvent être plus biaisés que les MCO.
Les propriétés asymptotiques (convergence) des IV ne sont pas valides avec des instruments faibles, même pour de grands échantillons.
Trois problèmes principaux des instruments faibles:
L'estimateur VI est beaucoup plus imprécis que les MCO.
.
Une variance des DMCO (2SLS) beaucoup plus grande que celle des MCO si est faible.
Si n'est pas strictement exogène, n'est pas convergent et peut être plus biaisé que .
Le biais relatif .
Même un léger problème d'exogénéité peut rendre plus biaisé si est faible.
Si est strictement exogène, est convergent mais biaisé en échantillons de taille finie vers les MCO.
Le biais est inversement proportionnel à la statistique F de la première étape.
Règle empirique de Staiger & Stock (1997): pour écarter les instruments faibles.
Effets Hétérogènes du Traitement et LATE
Réponse individuelle à l'instrument ( binaire):
Fonction de réponse individuelle: attribue une valeur du traitement à l'instrument.
Quatre populations instrumentales:
Compliers: et (changent de traitement avec ).
Never-takers: et (ne sont jamais traités).
Always-takers: et (sont toujours traités).
Defiers: et (agissent à l'encontre de l'instrument).
Angrist, Imbens & Rubin (1996) ont montré que les VI estiment uniquement l'effet du traitement pour les 'compliers'. Cet estimateur est un Effet Local Moyen du Traitement (LATE).
Hypothèses supplémentaires pour le LATE:
Indépendance de l'instrument:
(Z est indépendant des résultats potentiels).
(Z est indépendant des types d'individus, réparti aléatoirement entre les populations).
Monotonicité:
(Pas de 'defiers').
La réponse des individus va toujours dans la même direction; l'instrument n'incite jamais à l'inverse.
Interprétation du LATE:
Sous l'hypothèse de monotonie, seuls les 'compliers' contribuent à l'estimation.
L'estimateur de Wald devient: .
Le LATE est un effet "intention-to-treat" (ITT) ajusté par la proportion de compliers.
Problème: Si l'hétérogénéité des effets est liée à la réponse à l'instrument, alors (Average Treatment Effect).
On ne peut jamais savoir qui est un 'complier' car on n'observe qu'une seule valeur pour chaque individu.
On peut estimer la part des 'compliers': .
Implications pour l'interprétation des VI:
Pas d'interprétation si effets hétérogènes et des 'defiers' sont présents.
Le LATE est un effet local (problème de validité externe si peu de 'compliers').
Différents instruments peuvent identifier des LATEs différents (sur différentes sous-populations de 'compliers').
Les DMCO avec plusieurs instruments est une somme pondérée des LATEs.
L'écart entre MCO et VI combine correction de biais et changement de population estimée.
Étapes de mise en œuvre des estimations par VI:
Trouver un bon instrument: Exogène et affectant le traitement, pas le résultat.
Vérifier l'exogénéité: Strictement non testable, donc soyez rigoureux (et convaincant).
Vérifier la pertinence: Examiner la première étape et la F-stat (doit être ).
Estimer la seconde étape: Utiliser DMCO (2SLS) avec des logiciels adaptés pour les erreurs standards.
Interpréter les résultats: Comme un LATE. Discuter la validité externe si peu de 'compliers'.
Start a quiz
Test your knowledge with interactive questions