Économétrie : Causalité, Corrélations, Variables
10 KartenAnalyse de causalité vs corrélation, types de variables, effet de seuil et modèles de régression.
10 Karten
L'Analyse Économétrique : Causalité, Modélisation et Interprétation
L'économétrie est une discipline essentielle pour comprendre les relations économiques. Elle se concentre sur la quantification des relations entre variables, la prévision et l'évaluation des politiques.I. Causalité et Corrélation : Concepts Fondamentaux
En économie, la distinction entre causalité et corrélation est primordiale pour toute analyse rigoureuse.1. Définition et Différence Principale
- Causalité : Indique une relation de cause à effet directe. Un événement ou un facteur (la cause) en entraîne un autre (l'effet). Si cause , alors une modification de entraînera une modification de , toutes choses égales par ailleurs. C'est l'objectif principal de nombreuses études économétriques de déterminer si une variable en influence réellement une autre.
- Corrélation : Décrit une relation statistique entre deux variables où elles tendent à varier ensemble. Elles peuvent augmenter ou diminuer simultanément (corrélation positive) ou l'une peut augmenter pendant que l'autre diminue (corrélation négative). Cependant, la corrélation n'implique pas nécessairement la causalité. Deux variables peuvent être corrélées sans que l'une cause l'autre (ex: variable omise, causalité inversée, coïncidence).
Exemple Clé : Un étudiant assidu obtient de meilleures notes.
- Cela pourrait être une causalité : l'assiduité () cause une amélioration des notes ().
- Mais cela pourrait être de la corrélation sans causalité directe si, par exemple, les étudiants plus motivés (variable non observée) sont à la fois plus assidus et obtiennent de meilleures notes. L'assiduité n'est alors qu'un symptôme de la motivation, pas la cause unique.
"Corrélation n'est pas causalité." C'est une maxime fondamentale en économétrie.
2. Implications pour l'Analyse
L'identification de la causalité est cruciale pour l'élaboration de politiques efficaces. Une politique basée uniquement sur une corrélation pourrait ne pas produire l'effet désiré si la cause sous-jacente n'est pas correctement identifiée.
Si la causalité est établie entre l'assiduité et les notes, alors une politique visant à augmenter l'assiduité des étudiants devrait, en principe, améliorer leurs résultats.
3. Variables dans l'Analyse Causalité
Pour établir une relation causale, on distingue plusieurs types de variables :- Variable Expliquée (dépendante) : C'est la variable dont on cherche à expliquer les variations. (Ex: notes des étudiants).
- Variable d'Intérêt (explicative principale) : C'est la variable dont on veut tester l'effet causal sur . (Ex: assiduité).
- Variables de Contrôle : Ce sont d'autres variables qui peuvent influencer et qui sont incluses dans le modèle pour isoler l'effet causal de . (Ex: temps d'étude personnel, intelligence, antécédents scolaires, etc.). Leur inclusion permet de "tenir toutes choses égales par ailleurs".
La distinction entre variable d'intérêt et variable de contrôle est cruciale pour l'interprétation. La variable d'intérêt est celle sur laquelle porte l'hypothèse causale principale, tandis que les variables de contrôle servent à réduire le biais des variables omises et à obtenir une meilleure estimation de l'effet de la variable d'intérêt.
4. Corrélation Négative
Une corrélation est négative lorsque deux variables évoluent en sens inverse. Si augmente, diminue, et vice-versa.Exemple : = prix d'un bien ; = quantité demandée. Lorsque le prix augmente, la quantité demandée diminue (loi de la demande, corrélation négative).
II. Utilisation des Transformations Logarithmiques (Modèles Log)
Les transformations logarithmiques sont couramment utilisées en économétrie pour diverses raisons, notamment pour stabiliser la variance, normaliser les distributions, et faciliter l'interprétation des coefficients en termes d'élasticité ou de taux de croissance.1. Quand Utiliser les Transformations Logarithmiques ?
Les modèles log sont particulièrement utiles dans les cas suivants :- Pour résoudre des problèmes d'hétéroscédasticité (variance non constante des erreurs).
- Pour linéariser des relations non linéaires.
- Lorsque les variables sont fortement asymétriques ou ont une large plage de valeurs.
- Pour obtenir des interprétations en pourcentage des effets des variables.
2. Conditions Préalables
Pour appliquer une transformation logarithmique, il est impératif que les variables respectent certaines conditions :- Les valeurs doivent être strictement positives. On ne peut pas prendre le logarithme d'un nombre négatif ou de zéro. Il convient de vérifier les valeurs minimales des variables.
- Les transformations logarithmiques sont souvent adaptées aux relations de croissance multiplicative ou aux fonctions de production.
3. Types de Modèles Logarithmiques et Interprétations
Soit le modèle de régression linéaire de base : . L'interprétation est : une augmentation d'une unité de entraîne une augmentation (ou diminution) de unités de .| Nom du Modèle | Équation du Modèle | Interprétation | Quand l'utiliser | Exemple |
|---|---|---|---|---|
| Linéaire-Linéaire (Niveau-Niveau) | Une augmentation d'une unité de entraîne une variation de unités de . | Effets absolus | Salaire = : 1 an d'expérience en plus dollars de salaire en plus. | |
| Log-Log | Une augmentation de 1% de entraîne une variation de % de . Le coefficient est l'élasticité de par rapport à . | Élasticités, effets en pourcentage | Prix = 0.1%, Quantité = 0.5% : 1% d'augmentation du prix 0.5% de diminution de la quantité. | |
| Log-Lin (ou Log-Niveau) | Une augmentation d'une unité de entraîne une variation de % de . | Effets en pourcentage sur Y pour un changement d'unité sur X | Taux de croissance du PIB = : 1 million d'euros d'investissement en plus Taux de croissance du PIB augmente de %. | |
| Lin-Log (ou Niveau-Log) | Une augmentation de 1% de entraîne une variation de unités de . | Effets absolus sur Y pour un changement en pourcentage sur X | Dépense en publicité = : 1% d'augmentation de l'audience TV euros de dépense en publicité en plus. |
L'utilisation de au lieu de permet de modéliser des effets non linéaires de sur , où l'effet marginal de sur diminue à mesure que augmente.
III. Modèles Quadratiques et Effets Non Linéaires
Les modèles linéaires supposent une relation constante entre les variables. Cependant, de nombreuses relations économiques ne sont pas linéaires. Les termes quadratiques permettent de capturer ces non-linéarités.1. Quand Utiliser les Formes Quadratiques ?
Les formes quadratiques sont utilisées lorsque l'effet d'une variable explicative sur la variable dépendante n'est pas constant, mais qu'il change à mesure que varie. Plus précisément, elles sont utilisées pour modéliser :- Un effet de seuil : l'effet de augmente jusqu'à un certain point, puis diminue (ou vice-versa).
- Des rendements décroissants ou croissants.
- Un effet en forme de U ou de U inversé.
2. La Fonction Quadratique Simple
L'équation d'un modèle avec un terme quadratique est : Ici, est le terme quadratique.3. Interprétation de l'Effet Marginal (Effet "Cherry Mule")
L'effet marginal de sur n'est plus simplement , car il dépend de la valeur de . Pour trouver cet effet, il faut dériver par rapport à : Ceci est l'effet marginal de sur , parfois appelé "effet cherry mule" dans les notes. L'interprétation est la suivante : l'effet de sur dépend des coefficients et , ainsi que de la valeur actuelle de .Exemple Chiffré : Considérons un modèle de rendement agricole où le rendement () dépend de la quantité d'engrais () :
Ici, et . L'effet marginal de l'engrais sur le rendement est : Cela signifie :- Si unités : . Une unité d'engrais en plus augmente le rendement de 100.
- Si unités : . L'effet marginal a diminué.
- Si unités : . L'effet marginal est nul.
4. L'Effet de Seuil (Point de Retournement)
L'effet de seuil correspond au point où l'effet marginal de sur devient nul, ou change de signe. C'est le sommet ou le creux de la parabole décrite par la fonction quadratique. Pour trouver le point de seuil, on pose l'effet marginal égal à zéro : Résolvons pour :Reprenons l'exemple :
On cherche le point où l'effet de l'engrais est maximum (ou minimum) et commence à s'inverser :Interprétation : Jusqu'à 20 unités d'engrais, le rendement augmente avec l'engrais (avec des rendements marginaux décroissants). Au-delà de 20 unités, l'effet de l'engrais devient négatif (l'ajout d'engrais ferait baisser le rendement, par exemple à cause de l'excès de fertilisation).
IV. Synthèse et Conseils Pratiques
1. Résoudre les Équations (Min/Max)
- Lorsque l'on travaille avec des modèles quadratiques, la recherche des points de minimum ou de maximum (min/max) est cruciale et se fait en annulant la dérivée première de la fonction par rapport à la variable d'intérêt.
- De même, pour des objectifs d'optimisation dans des modèles plus complexes (par exemple, maximisation du profit ou minimisation des coûts), la résolution implique des techniques de calcul différentiel.
2. Tirer la Distribution et Gérer les Valeurs Aberrantes
- Avant toute modélisation, il est essentiel d'analyser la distribution des variables (histogrammes, boîtes à moustaches). Cela permet d'identifier des valeurs aberrantes (outliers) ou des distributions non normales.
- Les valeurs aberrantes peuvent biaiser les estimations des coefficients de régression. Des techniques comme la Winsorisation, la troncature, ou l'utilisation de méthodes robustes peuvent être envisagées.
- Les transformations logarithmiques peuvent aider à rendre certaines distributions plus symétriques ou proches de la normalité.
3. Comparer Fructueusement et Interpréter
- Il est impératif de comparer les résultats de différents modèles (linéaire, log, quadratique) pour choisir celui qui représente le mieux la relation économique.
- L'interprétation des coefficients doit être précise et adaptée au type de modèle utilisé (unités, pourcentages, élasticités).
- Utiliser des graphiques pour visualiser les relations et les effets marginaux peut largement améliorer la compréhension.
4. Considérations sur le Choix de Modèle
Le choix entre un modèle linéaire, log-lin, lin-log, ou quadratique dépend de :- La nature théorique de la relation entre les variables.
- Les propriétés statistiques des données (distributions, hétéroscédasticité).
- La facilité d'interprétation des résultats pour un public donné.
En résumé, l'économétrie fournit des outils puissants pour démêler les relations économiques. La compréhension rigoureuse de la causalité, la maîtrise des transformations de variables comme le log, et la capacité à modéliser et interpréter les non-linéarités via les termes quadratiques sont des compétences indispensables pour tout analyste.
Économétrie : Guide Essentiel
I. Corrélation vs. Causalité
Ce qui est le plus important en économie, c'est la causalité.1. Causalité
- Implique une relation directe de cause à effet.
- Deux événements existent : un événement (la cause) entraîne un événement (l'effet).
- **Exemple** : L'étude assidue cause de meilleures moyennes.
- Pour parler de relation causale, l'effet de la variable d'intérêt doit être significatif, même après contrôle des autres facteurs.
2. Corrélation
- Indique que deux variables sont liées, évoluant souvent dans la même direction ou dans des directions opposées.
- Ne signifie pas nécessairement qu'une variable cause l'autre.
- **Exemple** : Contrats OPC, fièvre, et rhume peuvent être corrélés sans lien de causalité direct entre eux.
- Une corrélation positive signifie que si augmente, augmente.
- Une corrélation négative signifie que si augmente, diminue.
- Identifier la corrélation est une première étape, mais il faut contrôler les facteurs confondants.
3. Variables
- Variable expliquée () : La variable dont on cherche à comprendre les variations (ex: moyenne des étudiants).
- Variable d'intérêt / Spécifique : La variable explicative principale dont on veut mesurer l'impact (ex: assiduité). Elle est exploratoire.
- Variable de contrôle : D'autres variables qui peuvent influencer la variable expliquée et doivent être prises en compte pour isoler l'effet causal (ex: temps de révision personnel, caractéristiques des étudiants). La variable spécifique n'a pas d'effet sur elle.
II. Utilisation des Formes Fonctionnelles (Transformations Logarithmiques)
1. Pourquoi utiliser le log ?
- Pour résoudre des problèmes d'**hétéroscédasticité** (variance non constante des erreurs).
- Pour tirer des conclusions sur des **distributions asymétriques**.
- Pour gérer la **non-normalité** des erreurs.
- Pour comparer des fructuations (taux de croissance, élasticités).
2. Conditions d'utilisation
- **Pas de valeurs négatives ou zéro** pour les variables transformées en log.
- Toujours vérifier la **valeur minimale** et la **plausibilité de la valeur** après transformation.
3. Différentes formes de modèles avec log
a. Modèle Linéaire-Linéaire (Référence)
- **Formule** :
- **Interprétation** : Une augmentation de 1 unité de entraîne une variation de unités de ( unités de ).
b. Modèle Log-Log
- **Formule** :
- **Interprétation** : Une augmentation de 1% de entraîne une variation de % de . L'élasticité est constante.
c. Modèle Lin-Log
- **Formule** :
- Interprétation : Une augmentation de 1% de entraîne une variation de unités de .
d. Modèle Log-Lin
- **Formule** :
- **Interprétation** : Une augmentation de 1 unité de entraîne une variation de % de .
III. Modèles Non-Linéaires : Effets Quadratiques (Effet Cherry-Mule)
1. Intérêt de la forme quadratique
- Utilisée pour capturer des relations **non-linéaires** (courbes).
- Utile quand l'effet d'une variable augmente puis diminue, ou vice-versa (effet de seuil).
- Exemple : La productivité augmente avec l'expérience jusqu'à un certain point, puis peut stagner ou diminuer.
2. Modèle quadratique
- **Formule** :
- **Interprétation** : L'effet de sur dépend à la fois de et de , ainsi que de .
- La dérivée de par rapport à est .
- Cela signifie que l'impact de sur varie selon le niveau de .
3. Effet de seuil
- C'est le point où l'effet marginal de sur devient nul.
- Il est trouvé en posant la dérivée partielle égale à zéro : .
- **Calcul** : .
- Au-delà de ce point, l'effet de s'inverse.
Économétrie et Modélisation : Relations, Effets et Transformations
L'économétrie est une discipline qui applique des méthodes statistiques à des données économiques pour donner un contenu empirique aux relations économiques. Elle permet de quantifier des relations, de tester des théories et de faire des prévisions. Deux concepts fondamentaux en économétrie sont la causalité et la corrélation, dont la distinction est cruciale pour une analyse rigoureuse. De plus, la modélisation des relations non linéaires et l'utilisation de transformations comme le logarithme sont des outils essentiels pour capturer la complexité des phénomènes économiques.I. Causalité et Corrélation en Économie
Il est impératif de distinguer la causalité de la corrélation en économie, car une mauvaise interprétation peut mener à des conclusions erronées et des politiques inefficaces.1. Définitions et Distinction
- Corrélation : La corrélation indique une relation ou une association statistique entre deux ou plusieurs variables. Lorsque deux variables sont corrélées, elles ont tendance à évoluer ensemble, soit dans la même direction (corrélation positive), soit dans des directions opposées (corrélation négative). Cependant, une corrélation n'implique pas nécessairement qu'une variable cause l'autre.
- Exemple : Il peut y avoir une corrélation entre les ventes de glaces et les noyades. Les deux augmentent en été, mais l'un ne cause pas l'autre ; la chaleur est un facteur commun influençant les deux.
- Exemple économique : Des élèves plus assidus tendent à avoir de meilleures notes. Il y a une corrélation.
- Causalité : La causalité implique qu'un changement dans une variable (la cause) entraîne un changement dans une autre variable (l'effet). Pour établir la causalité, il faut démontrer que la variable explicative influence directement la variable expliquée, toutes choses égales par ailleurs (ceteris paribus), et qu'il n'y a pas de facteurs confondants non contrôlés.
- Exemple : L'assiduité accrue d'un étudiant mène à de meilleures notes. Ici, l'assiduité est la cause et les meilleures notes l'effet.
2. Les Pièges de la Corrélation
Le principal piège est de conclure à la causalité à partir d'une simple corrélation. Une corrélation peut être due à plusieurs facteurs :- Variable cachée (variable confondante) : Une troisième variable non observée peut influencer les deux variables corrélées, créant une corrélation apparente sans lien causal direct entre elles.
- Exemple : La corrélation entre "plus de pompiers sur un incendie" et "plus de dégâts" ne signifie pas que les pompiers causent plus de dégâts. La taille de l'incendie est la variable cachée qui détermine à la fois le nombre de pompiers et l'ampleur des dégâts.
- Exemple économique : La corrélation entre l'assiduité et la moyenne peut être due à des facteurs comme l'intérêt intrinsèque de l'étudiant pour la matière, sa capacité cognitive générale, ou le temps qu'il consacre aux études en dehors des cours. Ces facteurs peuvent influencer à la fois l'assiduité et les notes.
- Causalité inverse : La direction de la causalité peut être inversée (X cause Y, mais on pense que Y cause X).
- Exemple : Est-ce que le bonheur cause la réussite, ou la réussite cause le bonheur ?
- Pure coïncidence : Deux événements peuvent être corrélés sans aucun lien logique.
3. Établir la Causalité : Le Rôle des Variables de Contrôle
Pour essayer d'établir une relation causale, les économètres utilisent des techniques qui tentent de "contrôler" ou de neutraliser l'effet des variables tierces.- Variables explicatives (d'intérêt) : Celles dont on veut évaluer l'impact causal (par exemple, l'assiduité).
- Variables expliquées (dépendante) : La variable dont on observe les changements (par exemple, la moyenne des étudiants).
- Variables de contrôle : Autres facteurs qui pourraient influencer la variable expliquée et qui doivent être inclus dans le modèle pour isoler l'effet causal de la variable d'intérêt.
- Exemple : Pour évaluer l'impact de l'assiduité () sur les notes (), on pourrait contrôler le temps d'étude personnel, l'intelligence de l'étudiant (par un test de QI ou des notes antérieures), le niveau socio-économique, etc. Si, après avoir contrôlé ces facteurs, l'assiduité reste un prédicteur significatif des notes, on peut alors parler plus sereinement d'une relation causale.
- Si une relation significative subsiste après avoir contrôlé les variables pertinentes, on peut conclure à une relation causale.
4. Corrélation Négative
Une corrélation est dite négative (ou inverse) lorsque les deux variables évoluent dans des directions opposées.- Exemple : Si (nombre d'heures consacrées aux jeux vidéo) augmente, alors (moyenne scolaire) diminue.
5. Variables d'Intérêt vs. Variables Spéculatives
Il est important de distinguer les variables cruciales pour l'analyse des variables moins pertinentes :- Variable d'intérêt : La variable clé que l'on souhaite étudier et dont on cherche à comprendre l'impact ou la relation spécifique. C'est le centre de l'analyse.
- Variable spéculative : Variables dont on n'est pas certain qu'elles aient un impact ou dont l'effet est secondaire par rapport à la variable d'intérêt. Elles peuvent être testées mais ne sont pas le focus principal.
II. Fonctions de Régression Linéaire et Non Linéaire
Les modèles de régression tentent de décrire la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Souvent, les relations économiques ne sont pas strictement linéaires. Les fonctions de transformation, notamment le logarithme et les termes quadratiques, permettent de modéliser des relations non linéaires.1. Le Modèle Linéaire Simple
Le point de départ est souvent le modèle linéaire simple :
- : variable dépendante
- : variable indépendante
- : ordonnée à l'origine (valeur de quand )
- : coefficient de pente (mesure l'impact d'une unité de sur )
- : terme d'erreur (comprend les facteurs non observés et l'erreur de mesure)
- Interprétation : Une augmentation d'une unité de est associée à une augmentation (ou diminution si ) de unités de .
2. Utilisation des Transformations Logarithmiques
Les transformations logarithmiques sont très utiles pour modéliser des relations non linéaires et pour interpréter les effets en termes de changements proportionnels ou de pourcentages.Conditions d'Utilisation du Logarithme
Pour utiliser le logarithme (généralement le logarithme népérien, ), les variables doivent satisfaire certaines conditions :- Valeurs positives : Les variables transformées par le log doivent avoir des valeurs strictement positives. Le logarithme n'est pas défini pour les nombres négatifs ou zéro.
- Vérification des extrêmes : Il est crucial de vérifier les valeurs minimales et maximales des variables. Si une variable peut prendre des valeurs très proches de zéro ou des valeurs négatives, le logarithme n'est pas approprié.
Les Différents Formes Logarithmiques et Leur Interprétation
a) Modèle Lin-Log (Log-Lin) :
Transforme uniquement la variable indépendante .- Interprétation : Une augmentation de 1% de est associée à une variation de unités de .
- Exemple : Si , une augmentation de 1% du revenu () est associée à une augmentation de unités de bonheur ().
b) Modèle Log-Lin :
Transforme uniquement la variable dépendante .- Interprétation : Une augmentation d'une unité de est associée à une variation de % de .
- Exemple : Si et , alors une année d'expérience supplémentaire est associée à une augmentation de % du salaire.
c) Modèle Log-Log :
Transforme à la fois la variable dépendante et la variable indépendante .- Interprétation : Une augmentation de 1% de est associée à une variation de % de . Le coefficient est alors l'élasticité constante de par rapport à .
- Exemple : Si et , alors une augmentation de 1% du prix est associée à une diminution de 0.5% de la demande (élasticité prix de la demande).
3. Modélisation des Relations Non Linéaires avec Termes Quadratiques
Les termes quadratiques () sont utilisés pour capturer des relations non linéaires où l'effet d'une variable change à mesure que la variable elle-même change. On parle d'effet marginal qui varie avec le niveau de .Effet quadratique (ou non linéaire)
- Lorsque utiliser :
- Pour modéliser des relations non monotones (c'est-à-dire qui augmentent puis diminuent, ou diminuent puis augmentent).
- Pour capturer des "effets de seuil" ou des points d'inflexion où l'effet d'une variable change de direction.
- Interprétation : L'effet de sur n'est pas constant. L'effet marginal de sur est donné par la dérivée partielle de par rapport à :
Cet effet marginal dépend de la valeur de .
- Exemple : L'effet des années d'expérience sur le salaire peut augmenter dans un premier temps puis diminuer (ou au moins ralentir) après un certain âge. Un niveau de pollution peut d'abord avoir un effet positif sur l'activité économique (via la production) puis un effet négatif sur la santé et la productivité.
Effet Cherrymule (ou Effet de Courbure)
C'est un autre nom pour l'effet non linéaire capturé par un terme quadratique. Il décrit comment l'effet marginal d'une variable sur change à mesure que varie.
- L'effet de sur est .
- Exemple : Si
- Ici, et .
- L'effet de l'expérience sur la performance est .
- Cet effet diminue à mesure que l'expérience augmente.
- Exemple : Si
Effet de Seuil (Point d'inflexion)
L'effet de seuil est le point où l'effet marginal de sur s'annule ou change de signe. C'est le sommet ou le creux de la parabole.- Pour le modèle , l'effet de seuil se produit lorsque l'effet marginal est égal à zéro :
- Résoudre pour :
- Exemple : Reprenons l'exemple précédent : .
- L'effet marginal est .
- Le point de seuil est quand , donc , ce qui donne .
- Interprétation : Jusqu'à 20 ans d'expérience, la performance augmente avec l'expérience. Au-delà de 20 ans d'expérience, la relation s'inverse, et des années supplémentaires d'expérience sont associées à une diminution de la performance (ce qui pourrait refléter des effets de "burn-out", d'obsolescence des compétences, ou d'autres facteurs non capturés).
4. Comparaison des Formes Fonctionnelles Courantes
| Forme Fonctionnelle | Modèle | Interprétation de | Quand l'utiliser | Avantages | Inconvénients / Précautions |
| Linéaire | (unités) Pour 1 unité de , change de unités |
Relation linéaire attendue ; facile à interpréter | Simplicité ; coefficients directs | Ne capture pas les non-linéarités ; peut masquer des relations complexes | |
| Lin-Log | (unités) Pour 1% de , change de unités |
L'effet de sur diminue à mesure que augmente. | Interprétation en unités et pourcentages ; atténue l'influence des grandes valeurs de | doit être | |
| Log-Lin | Pour 1 unité de , change de %. |
L'effet de sur est proportionnel (taux de croissance). | Interprétation en pourcentages ; permet de lisser les données de . | doit être | |
| Log-Log (Élasticité) | Pour 1% de , change de %. ( est l'élasticité) |
Relation en élasticité (proportionnelle) ; permet de comparer des élasticités entre modèles. | Élasticité constante ; atténue l'impact des valeurs extrêmes sur les deux variables. | et doivent être | |
| Quadratique | L'effet de sur est . | Relation non-monotone (en forme de U ou de U inversé), effet de seuil. | Capture les points d'inflexion / effets de courbure. | Peut être difficile à interpréter si n'est pas centré ; nécessite des valeurs de suffisamment variées. |
III. Récapitulatif : Pourquoi et Comment Utiliser ces Outils
En somme, les économètres disposent de plusieurs outils pour analyser les relations entre variables :- Résoudre les problèmes d'identification (causalité vs. corrélation) : L'objectif est de trouver des moyens d'isoler l'impact causal d'une variable d'intérêt. Cela implique souvent d'identifier et de contrôler les variables confondantes.
- Décrire la distribution : Comprendre la forme de la relation entre variables. Est-elle linéaire, exponentielle, en forme de U ? Les transformations logarithmiques et les termes quadratiques aident à capturer ces formes.
- Gérer les variables asymétriques ou à forte disparité : Lorsque les valeurs des variables sont très dispersées ou suivent une distribution asymétrique (par exemple, les revenus), l'application du logarithme peut "normaliser" la distribution et rendre les résultats de régression plus robustes.
- Comparer des effets de manière relative : Les modèles log-log sont particulièrement utiles pour comparer des élasticités, c'est-à-dire comment des changements proportionnels dans une variable conduisent à des changements proportionnels dans une autre.
- Modéliser des relations non linéaires évidentes : Lorsque la théorie économique ou l'observation empirique suggère que l'effet d'une variable dépend de son niveau (rendements décroissants, coûts croissants, courbes en J inversé, etc.), les termes quadratiques sont indispensables.
Fiche de Révision : Économétrie
I. Causation vs. Corrélation
1. Quelle est le plus important en économie, la causalité ou la corrélation ?
C'est la causalité.
2. Quelle est la différence entre causalité et corrélation ?
Causalité : Cause à effet. Une chose (X) entraîne directement une autre (Y). Il doit y avoir un lien de cause à effet. Ex: Plus un étudiant est assidu, meilleure est sa moyenne.
Corrélation : Une relation statistique entre deux variables, mais pas nécessairement de cause à effet. Elles évoluent ensemble. Ex: Les ventes de glaces et les noyades sont corrélées en été, mais l'une ne cause pas l'autre.
3. Comment s'assurer d'une relation causale ?
Il faut contrôler les autres facteurs (variables de contrôle) qui pourraient influencer la performance ou le résultat.
Variables clé :
Variable expliquée (Y) : Ce qu'on cherche à expliquer (ex: la moyenne).
Variable d'intérêt (X) : La variable dont on veut mesurer l'impact causal (ex: l'assiduité).
Variables de contrôle : Autres facteurs qui influencent Y et X (ex: le temps de révision personnel).
4. Quand parle-t-on de relation causale ?
Si après avoir contrôlé toutes les variables de confusion, la variable d'intérêt (Ex: assiduité) reste significative, alors on peut parler de relation causale.
5. Comment différencier variable d'intérêt et variable de spécification ?
La variable d'intérêt est la variable explicative qu'on explore et dont on veut mesurer l'impact.
La variable de spécification sont les autres variables qui peuvent avoir un effet sur la variable expliquée mais sur lesquelles on ne se focalise pas directement pour l'analyse causale.
II. Modèles Économétriques Spécifiques
1. Quels sont les différents buts quand on utilise les logs (fonctions logarithmiques) ?
Pour résoudre les problèmes de non-linéarité (min/max).
Pour tirer des distributions (rendre normal la distribution des variables).
Pour gérer les pentes hétérogènes.
Pour comparer facilement les pentes hétérogènes (en pourcentages).
2. Quelles sont les conditions pour utiliser le log ?
Assurez-vous qu'il n'y a pas de valeurs négatives ou nulles pour la variable à transformer en log.
Vérifiez la valeur minimale et la valeur de pente (slope).
3. Quels sont les différents types de modèles avec les logs et leur interprétation ?
Linéaire-Linéaire :
Interprétation : Une augmentation d'1 unité de X entraîne une augmentation de unités de Y.
Log-Log (double log) :
Interprétation : Une augmentation de 1% de X entraîne une augmentation de % de Y. ( est l'élasticité)
Log-Linéaire :
Interprétation : Une augmentation d'1 unité de X entraîne une augmentation de de Y.
Linéaire-Log :
Interprétation : Une augmentation de 1% de X entraîne une augmentation de unités de Y.
III. Effets Non-Linéaires
1. Quand utilise-t-on la forme quadratique (relation non-linéaire) ?
Lorsque l'effet d'une variable augmente puis diminue (ou inversement), on parle d'effet de seuil ou d'effet en U inversé/normal.
Ex : Si X augmente, la relation commence par diminuer puis augmente marginalement (ou inversement). L'effet initial s'inverse à un certain point.
2. Qu'est-ce que l'effet "cherry mute" (effet quadratique ou d'interaction) ?
Il s'agit d'une interaction où l'effet d'une variable sur Y dépend de son propre niveau ou du niveau d'une autre variable.
Modèle : ou .
Interprétation : L'effet de X sur Y est contingent à la valeur de X (ou de Z).
3. Qu'est-ce que l'effet de seuil ?
C'est le point où l'effet "cherry mute" est égal à zéro (le point de retournement).
Pour un modèle quadratique , le point d'inflexion (seuil) est trouvé en dérivant Y par rapport à X et en égalisant à zéro : .
Donc, le seuil X est égal à .
Exemple : Si , alors . Cela signifie qu'avant 20, la relation X-Y a une certaine direction, et après 20, la direction s'inverse.
IV. Concepts de Corrélation
1. Qu'est-ce qu'une corrélation positive ?
Lorsque X augmente, Y augmente également.
Ex: Plus l'assiduité est élevée, plus la moyenne est élevée.
2. Qu'est-ce qu'une corrélation négative ?
Lorsque X augmente, Y diminue.
Ex: Plus le temps passé sur les réseaux sociaux est élevé, plus la moyenne diminue.
Podcasts
In der App anhören
Öffne Diane, um diesen Podcast anzuhören
Quiz starten
Teste dein Wissen mit interaktiven Fragen