Instrumental Variables: Weak Instruments & LATE

50 cards

This note provides a review of instrumental variables (IV), focusing on weak instruments and heterogeneous treatment effects. It covers the basic assumptions and mechanics of IV estimation, potential issues like weak instruments and their impact on bias and precision, and the interpretation of IV estimates as Local Average Treatment Effects (LATE). The note also discusses methods for identifying and testing IV assumptions, along with examples and applications.

50 cards

Review
Spaced repetition shows you each card at the optimal time for long-term memorization, with increasingly spaced reviews.
Question
Quel est le but principal des variables instrumentales (VI) ?
Answer
Traiter les problèmes d'endogénéité, où une variable explicative est corrélée avec le terme d'erreur, en utilisant une source de variation exogène.
Question
Quand le traitement T est-il considéré comme endogène ?
Answer
Lorsque le traitement T est corrélé avec des facteurs inobservables affectant le résultat Y, soit cov(ε, T) ≠ 0.
Question
Quelle est l'idée de base derrière l'utilisation d'un instrument Z ?
Answer
Utiliser une source de variation exogène (Z) qui influence le traitement T, mais n'affecte pas directement le résultat Y.
Question
Quelle est l'hypothèse de pertinence d'un instrument ?
Answer
L'instrument Z doit être corrélé au traitement T. Mathématiquement, cov(T, Z) ≠ 0.
Question
Quelle est l'hypothèse d'exogénéité (ou d'exclusion) d'un instrument ?
Answer
L'instrument Z ne doit pas être corrélé aux inobservables affectant Y. Mathématiquement, cov(Z, ε) = 0.
Question
Donnez la formule de l'estimateur VI simple.
Answer
β̂VI = cov(Y, Z) / cov(T, Z). C'est le ratio de l'effet de Z sur Y à l'effet de Z sur T.
Question
Qu'est-ce que le modèle en deux étapes (DMCO / 2SLS) ?
Answer
1. Prédire T avec Z (première étape). 2. Utiliser les valeurs prédites de T () pour estimer l'effet sur Y (deuxième étape).
Question
Qu'est-ce que la forme réduite dans un modèle VI ?
Answer
C'est l'équation qui exprime le résultat Y directement en fonction de l'instrument Z, capturant l'effet total de Z sur Y.
Question
Comment l'estimateur VI est-il lié à la première étape et à la forme réduite ?
Answer
L'estimateur VI est le coefficient de la forme réduite divisé par le coefficient de la première étape (β̂VI = θ / π).
Question
Qu'est-ce que l'estimateur de Wald ?
Answer
C'est un cas spécial de l'estimateur VI utilisé lorsque l'instrument est binaire, calculé comme le ratio des différences de moyennes.
Question
Qu'est-ce qu'un instrument faible ?
Answer
Un instrument ayant une faible corrélation avec la variable de traitement endogène, ce qui le rend peu pertinent.
Question
Quel est le principal problème des instruments faibles ?
Answer
Ils produisent des estimateurs VI imprécis (grande variance) et potentiellement plus biaisés que les MCO, même avec de grands échantillons.
Question
Comment la variance de l'estimateur DMCO se compare-t-elle à celle des MCO ?
Answer
Elle est toujours plus grande. Le ratio des variances est inversement proportionnel au de la première étape: [R²T,Z]-1.
Question
Quelle est la règle empirique de Staiger & Stock (1997) pour les instruments faibles ?
Answer
Une statistique F > 10 pour la significativité des instruments dans la régression de la première étape est nécessaire pour écarter les instruments faibles.
Question
Comment un instrument faible affecte-t-il le biais de l'estimateur VI en échantillon fini ?
Answer
Le biais de l'estimateur VI est inversement proportionnel à la statistique F de la première étape, le rendant important si l'instrument est faible.
Question
Est-ce que l'hypothèse d'exogénéité est testable ?
Answer
Non, elle n'est pas formellement testable avec un seul instrument. Elle doit être justifiée de manière convaincante par la théorie ou le design de l'étude.
Question
Qu'est-ce qu'un test de sur-identification (Sargan ou Hansen) ?
Answer
Un test utilisé quand il y a plus d'instruments que de variables endogènes pour vérifier si les instruments additionnels sont valides.
Question
Qu'est-ce que l'Effet Local Moyen du Traitement (LATE) ?
Answer
C'est l'effet causal estimé par la VI, qui s'applique uniquement à la sous-population dont le statut de traitement est modifié par l'instrument.
Question
À quel groupe s'applique le LATE ?
Answer
Le LATE est l'effet moyen du traitement uniquement pour les 'compliers'.
Question
Définir les 'compliers' dans le contexte VI.
Answer
Les individus qui reçoivent le traitement si on les y encourage (T(1)=1) et ne le reçoivent pas sinon (T(0)=0).
Question
Définir les 'always-takers'.
Answer
Les individus qui reçoivent toujours le traitement, que l'instrument soit présent ou non (T(0)=1, T(1)=1).
Question
Définir les 'never-takers'.
Answer
Les individus qui ne reçoivent jamais le traitement, que l'instrument soit présent ou non (T(0)=0, T(1)=0).
Question
Définir les 'defiers'.
Answer
Les individus qui font le contraire de ce que l'instrument encourage (T(0)=1, T(1)=0).
Question
Quelle est l'hypothèse de monotonicité dans le modèle LATE ?
Answer
L'instrument ne pousse aucun individu à faire le contraire de l'encouragement. Cela signifie qu'il n'y a pas de 'defiers'.
Question
Que représente la première étape de l'estimateur de Wald en termes de LATE ?
Answer
Elle estime la proportion de 'compliers' dans la population.
Question
Pourquoi le LATE peut-il différer de l'ATE (Effet Moyen du Traitement) ?
Answer
Parce que l'effet du traitement pour les 'compliers' peut être différent de l'effet moyen pour l'ensemble de la population.
Question
Peut-on identifier empiriquement qui est un 'complier' ?
Answer
Non, on ne peut pas identifier les individus 'compliers', mais on peut estimer leur part dans la population.
Question
Quand les estimations par VI n'ont-elles aucune interprétation causale ?
Answer
Si les effets du traitement sont hétérogènes et qu'il existe des 'defiers'.
Question
Que se passe-t-il si on utilise différents instruments pour estimer le même effet ?
Answer
Ils peuvent identifier différents LATEs, car chaque instrument peut affecter une sous-population de 'compliers' différente.
Question
Quel est le problème de validité externe du LATE ?
Answer
Les résultats ne s'appliquent qu'aux 'compliers' et ne peuvent pas être généralisés à toute la population, surtout si les 'compliers' sont peu nombreux.
Question
Quelle est la source la plus crédible pour un instrument 'idéal' ?
Answer
Les essais contrôlés randomisés (ECR) avec un design d'encouragement, où l'encouragement est assigné de manière aléatoire.
Question
Citez un exemple d'instrument issu d'une quasi-expérience.
Answer
Le trimestre de naissance pour estimer l'effet de l'éducation sur le salaire (Angrist & Krueger, 1991).
Question
Pourquoi la méthode VI n'est-elle pas toujours utilisée ?
Answer
Parce que trouver un instrument à la fois pertinent (non faible) et véritablement exogène (crédible) est extrêmement difficile.
Question
Quel est le biais de l'estimateur MCO en cas d'endogénéité ?
Answer
Le biais est donné par la formule cov(ε, T) / V(T), qui est non nul si le traitement est endogène.
Question
Comment s'écrit la variance asymptotique de l'estimateur DMCO, Avar(β̂2SLS) ?
Answer
Avar(β̂2SLS) = Avar(β̂MCO) × [R²T,Z]-1. Elle est toujours supérieure à la variance des MCO.
Question
Que signifie un modèle juste identifié en VI ?
Answer
Le nombre d'instruments est exactement égal au nombre de variables endogènes. Aucun test de sur-identification n'est possible.
Question
Que signifie un modèle sur-identifié en VI ?
Answer
Il y a plus d'instruments que de variables endogènes, ce qui permet de tester la validité des instruments additionnels.
Question
Qu'est-ce que l'effet 'intention-to-treat' (ITT) ?
Answer
L'effet de l'assignation à l'instrument sur le résultat, sans tenir compte de la prise réelle du traitement. C'est le numérateur de l'estimateur VI.
Question
Comment le LATE est-il lié à l'ITT ?
Answer
LATE est l'effet ITT divisé par la proportion de 'compliers'. Il 'redresse' l'ITT pour obtenir l'effet sur ceux qui ont réagi à l'instrument.
Question
Comment peut-on estimer la part des 'always-takers' (πa) ?
Answer
En calculant la probabilité de recevoir le traitement quand l'instrument est absent: πa = P(T=1 | Z=0).
Question
Comment peut-on estimer la part des 'never-takers' (πn) ?
Answer
En calculant la probabilité de ne pas recevoir le traitement quand l'instrument est présent: πn = P(T=0 | Z=1).
Question
Quelle est la première étape dans la mise en œuvre d'une estimation par VI ?
Answer
Trouver un bon instrument: une variable exogène qui affecte fortement la probabilité de traitement mais pas directement le résultat.
Question
Quel est le lien entre le biais d'un instrument faible et l'estimateur MCO ?
Answer
En échantillon fini, l'estimateur VI est biaisé dans la direction de l'estimateur MCO, et ce biais est plus grand lorsque l'instrument est faible.
Question
Quel est l'impact de plusieurs instruments faibles ?
Answer
Ils peuvent aggraver le problème du biais de l'estimateur VI, même s'ils améliorent légèrement le de la première étape.
Question
Dans Y = Tβ + ε, l'estimateur VI élimine quel biais ?
Answer
Il vise à éliminer le biais d'endogénéité, qui provient de la corrélation entre la variable de traitement T et le terme d'erreur ε.
Question
Pourquoi doit-on utiliser des erreurs-types robustes avec les DMCO ?
Answer
Pour corriger les erreurs-types estimées à la deuxième étape, car elles ne tiennent pas compte de l'incertitude de la prédiction de la première étape.
Question
Quel est le risque si un instrument est 'un peu' endogène et faible ?
Answer
L'estimateur VI peut être encore plus biaisé (moins convergent) que l'estimateur MCO qu'il est censé corriger.
Question
Dans quel article Angrist, Imbens & Rubin (1996) ont-ils formalisé le LATE ?
Answer
Dans leur article 'Identification of causal effects using instrumental variables' publié dans le JASA.
Question
Quel instrument Duflo (2001) utilise-t-elle pour les rendements de l'éducation ?
Answer
Un programme massif de construction d'écoles en Indonésie, qui a généré une variation exogène de l'accès à l'éducation.
Question
Comment l'écart entre les estimations MCO et VI doit-il être interprété ?
Answer
Comme une combinaison de la correction du biais d'endogénéité et d'un changement dans la population étudiée (ATE vs LATE).

Rappels sur les Variables Instrumentales (VI)

Introduction aux Variables Instrumentales (VI)

L'utilisation des VI pour l'endogénéité en économétrie est très ancienne (Wright, 1928).

  • Les VI sont un outil crucial lorsque le traitement est endogène, souvent dû à l'auto-sélection.

  • Idée de base: Utiliser une variation exogène qui affecte le traitement mais pas directement le résultat .

  • Souvent désignées comme "expériences naturelles" ou "quasi-expériences".

Hypothèses fondamentales pour l'identification des effets causaux:

  1. Indépendance: (L'instrument n'affecte pas l'issue potentielle directement).

  2. Pertinence: (L'instrument est corrélé au traitement).

Pourquoi les VI sont nécessaires:

  • Lorsque est endogène (), l'estimateur MCO est biaisé.

  • Le biais des MCO est . L'objectif des VI est de l'éliminer.

Fonctionnement des Variables Instrumentales

L'intuition des VI est d'isoler la variabilité du traitement induite par une variable exogène .

  1. Quand varie, la probabilité de traitement change, et certains individus modifient leur statut de traitement.

  2. On mesure le changement des résultats lié à ce changement de statut de traitement.

  3. Ce changement est censé être indépendant des facteurs inobservables, permettant d'attribuer le changement aux effets du traitement.

Modèle en deux étapes:

  • Première étape: Modélisation de la sélection dans le traitement:

  • Deuxième étape: Utilisation des variations exogènes de pour estimer l'effet causal.

Les trois hypothèses clés pour un instrument valide:

  1. Hypothèse 1 (Pertinence): est corrélé au traitement .

    • .

    • affecte la probabilité de traitement.

  2. Hypothèse 2 (Exogénéité): est indépendant des inobservables .

    • (Z est exogène dans l'équation de traitement).

    • (Z n'influence pas directement le résultat).

  3. Hypothèse 3 (Exclusion): n'est pas une fonction déterministe de (variables de contrôle).

    • Les variables peuvent être incluses dans le modèle, mais doit apporter une source de variation exclusive.

Estimateur VI:

Si les hypothèses (1) et (2) tiennent, l'estimateur VI est:

  • permet d'identifier l'effet causal de sur en éliminant le biais.

Forme réduite du modèle:

À partir du système:

La forme réduite est , où .

  • a un effet indirect sur via . Pour trouver , on divise par .

Estimateur de Wald (pour Z binaire):

Si est une variable binaire (0 ou 1):

  • Utilise le changement exogène dans la probabilité de traitement pour estimer l'effet causal.

Modèle général en deux étapes (avec covariables ):

  • Méthode des Doubles Moindres Carrés Ordinaires (DMCO ou 2SLS):

    1. Estimer la première étape: .

    2. Estimer la deuxième étape en remplaçant par .

    3. Attention aux erreurs standards (utiliser logiciels spécialisés).

Instruments Crédibles et Exemples

Un instrument crédible affecte mais pas directement .

Sources d'instruments crédibles:

  1. Expériences contrôlées (ECR):

    • Des ECR avec un design d'encouragement créent des instruments "idéaux".

    • est une incitation au traitement ().

    • est assigné aléatoirement ().

  2. Quasi-expériences: Variations exogènes dans l'environnement des individus.

    • Aléas naturels:

      • Ex: Trimestre de naissance (Angrist & Krueger, 1991) pour l'impact de l'éducation sur les salaires.

      • Ex: Variation des précipitations (Chort & Senne, 2018) pour l'impact de la migration sur les revenus.

      • Ex: Sexe des enfants (Angrist & Evans, 1998) pour l'impact de la fertilité sur l'offre de travail des femmes.

      • Tableaux de Wald Estimates montrent l'impact de la taille de la famille sur le travail des femmes.

    • Règles ou lois institutionnelles:

      • Ex: Date de naissance pour la loterie de la conscription militaire (Angrist, 1990) pour l'impact de l'expérience sur les salaires.

      • Ex: Construction d'écoles (Duflo, 2001) pour l'impact de l'éducation.

Limites de la Méthode VI

Pourquoi les VI ne sont pas utilisées systématiquement?

  1. L'exogénéité doit être très convaincante (les instruments crédibles imitent des expériences).

  2. Les instruments ne découlent souvent pas d'un modèle théorique explicite, posant des problèmes d'interprétation.

  3. Les instruments peuvent être anecdotiques et peu reproductibles.

  4. Un instrument crédible peut être un instrument faible (explique peu la variation du traitement).

  5. Si l'effet du traitement est hétérogène, la VI estime uniquement un Effet Local Moyen du Traitement (LATE).

Tests des Hypothèses des VI

Hypothèse 2 (Exogénéité):

  • Avec un instrument (modèle juste identifié), l'exogénéité est non testable.

  • Avec plusieurs instruments (modèle sur-identifié), on peut réaliser des tests de sur-identification (test de Sargan pour homoscédasticité, test J de Hansen pour hétéroscédasticité).

    • Ces tests vérifient seulement la cohérence globale et ne prouvent pas l'exogénéité pour chaque instrument.

  • Conclusion: L'hypothèse 2 est rigoureusement non testable. Il faut être très convaincant sur l'exogénéité.

Hypothèse 3 (Exclusion):

  • Relativement facile à justifier empiriquement.

  • Vérification: Régression des instruments sur les variables . Si le est proche de 1, il y a un problème. S'il est proche de 0, il n'y a probablement pas de relation déterministe.

Hypothèse 1 (Pertinence):

  • Examiner la première étape attentivement.

  • C'est ici que les problèmes d'instruments faibles apparaissent.

Instruments Faibles

Qu'est-ce qu'un instrument faible?

  • Un instrument qui a un pouvoir explicatif limité sur le traitement endogène .

    • Faible ou faible F-stat de la première étape.

    • Peut arriver même si est exogène.

Pourquoi un instrument faible est-il un problème?

  • Les estimateurs IV sont imprécis et peuvent être plus biaisés que les MCO.

  • Les propriétés asymptotiques (convergence) des IV ne sont pas valides avec des instruments faibles, même pour de grands échantillons.

Trois problèmes principaux des instruments faibles:

  1. L'estimateur VI est beaucoup plus imprécis que les MCO.

    • .

    • Une variance des DMCO (2SLS) beaucoup plus grande que celle des MCO si est faible.

  2. Si n'est pas strictement exogène, n'est pas convergent et peut être plus biaisé que .

    • Le biais relatif .

    • Même un léger problème d'exogénéité peut rendre plus biaisé si est faible.

  3. Si est strictement exogène, est convergent mais biaisé en échantillons de taille finie vers les MCO.

    • Le biais est inversement proportionnel à la statistique F de la première étape.

    • Règle empirique de Staiger & Stock (1997): pour écarter les instruments faibles.

Effets Hétérogènes du Traitement et LATE

Réponse individuelle à l'instrument ( binaire):

  • Fonction de réponse individuelle: attribue une valeur du traitement à l'instrument.

  • Quatre populations instrumentales:

    • Compliers: et (changent de traitement avec ).

    • Never-takers: et (ne sont jamais traités).

    • Always-takers: et (sont toujours traités).

    • Defiers: et (agissent à l'encontre de l'instrument).

Angrist, Imbens & Rubin (1996) ont montré que les VI estiment uniquement l'effet du traitement pour les 'compliers'. Cet estimateur est un Effet Local Moyen du Traitement (LATE).

Hypothèses supplémentaires pour le LATE:

  1. Indépendance de l'instrument:

    • (Z est indépendant des résultats potentiels).

    • (Z est indépendant des types d'individus, réparti aléatoirement entre les populations).

  2. Monotonicité:

    • (Pas de 'defiers').

    • La réponse des individus va toujours dans la même direction; l'instrument n'incite jamais à l'inverse.

Interprétation du LATE:

  • Sous l'hypothèse de monotonie, seuls les 'compliers' contribuent à l'estimation.

  • L'estimateur de Wald devient: .

  • Le LATE est un effet "intention-to-treat" (ITT) ajusté par la proportion de compliers.

  • Problème: Si l'hétérogénéité des effets est liée à la réponse à l'instrument, alors (Average Treatment Effect).

  • On ne peut jamais savoir qui est un 'complier' car on n'observe qu'une seule valeur pour chaque individu.

  • On peut estimer la part des 'compliers': .

Implications pour l'interprétation des VI:

  • Pas d'interprétation si effets hétérogènes et des 'defiers' sont présents.

  • Le LATE est un effet local (problème de validité externe si peu de 'compliers').

  • Différents instruments peuvent identifier des LATEs différents (sur différentes sous-populations de 'compliers').

  • Les DMCO avec plusieurs instruments est une somme pondérée des LATEs.

  • L'écart entre MCO et VI combine correction de biais et changement de population estimée.

Étapes de mise en œuvre des estimations par VI:

  1. Trouver un bon instrument: Exogène et affectant le traitement, pas le résultat.

  2. Vérifier l'exogénéité: Strictement non testable, donc soyez rigoureux (et convaincant).

  3. Vérifier la pertinence: Examiner la première étape et la F-stat (doit être ).

  4. Estimer la seconde étape: Utiliser DMCO (2SLS) avec des logiciels adaptés pour les erreurs standards.

  5. Interpréter les résultats: Comme un LATE. Discuter la validité externe si peu de 'compliers'.

Start a quiz

Test your knowledge with interactive questions