Intro generale des stats

Aucune carte

Comprendre les concepts de population, échantillon et méthodes d'échantillonnage en statistiques.

Généralités sur les Statistiques

La méthode statistique vise à dégager des propriétés ou à décrire un ensemble de mesures ou d'observations, appelé population.

Population et Échantillon

Une population est un ensemble d'éléments (êtres humains, objets) partageant un attribut ou une propriété commune (ex: les individus de sexe masculin).

Le statisticien étudie rarement la population entière, mais plutôt un échantillon, pour plusieurs raisons :

  • La taille de la population peut être trop importante, rendant l'enquête coûteuse.
  • L'accès à tous les individus de la population est matériellement impossible.
  • L'étude du caractère peut détruire les éléments de la population.

L'effectif ou la taille de l'échantillon est le nombre d'éléments le constituant.

Un bon échantillon doit être une image réduite de la population. Si ce n'est pas le cas, l'échantillon est dit biaisé.

Le choix de l'échantillon et le recueil des données sont des étapes fondamentales et souvent les plus longues de l'étude.

Pour généraliser les résultats, l'échantillon doit être le plus représentatif possible de la population cible.

Échantillonnage

Comment choisir un échantillon représentatif ?

Tirage au Hasard

Un échantillon ne doit pas être choisi par commodité. Pour être représentatif, il doit être constitué de manière aléatoire, par un tirage au sort ou l'utilisation de tables de nombres aléatoires.

Le tirage peut être fait sur toute la population ou par des procédés plus complexes comme la stratification.

Stratification

La stratification consiste à subdiviser la population en sous-groupes (strates), puis à tirer au sort dans chaque strate. Chaque strate peut être représentée proportionnellement à son importance dans la population.

  • Exemple 1 (Épidémiologie) : Pour une enquête sur l'hypertension artérielle, un échantillon peut être stratifié selon les catégories socioprofessionnelles, les tranches d'âges, et le sexe pour refléter la composition de la population.
  • Exemple 2 (Essai thérapeutique) : Dans un essai anticancéreux, les strates peuvent être définies par des facteurs pronostiques comme la taille de la tumeur, l'extension loco-régionale, ou la présence de métastases.

Il est crucial que le prélèvement de l'échantillon soit fait au hasard pour éviter les biais.

Exemple de Biais d'Échantillonnage

Pour étudier le pourcentage de décès par infarctus du myocarde en France, observer les décès dans un service hospitalier donné introduirait un biais. Ce service pourrait avoir un recrutement particulier (malades plus graves, catégorie sociale spécifique), ce qui fausserait les résultats par rapport à la population française générale. Un échantillon représentatif nécessiterait un tirage au sort sur tous les cas d'infarctus recensés en France, ce qui est souvent difficile.

Problème de l'Estimation

L'estimation consiste à évaluer un paramètre sur un échantillon pour estimer ce même paramètre pour la population entière.

  • Exemple : Évaluer la valeur moyenne de la glycémie pour tous les sujets sains de 20 à 40 ans à partir de mesures effectuées sur un échantillon de cette tranche d'âge.

Pour une estimation précise, l'échantillon doit être le plus représentatif possible de la population.

Les Tests Statistiques

Les tests statistiques permettent de tirer des conclusions sur une population à partir de l'étude de caractères observés sur un ou plusieurs échantillons.

Ils sont utilisés pour comparer des caractéristiques entre deux ou plusieurs populations (ex: comparer la glycémie moyenne des sujets urbains et ruraux).

Ces tests sont des tests d'hypothèses et permettent de faire des inférences statistiques. Les hypothèses testées sont définies par la construction du test.

Lancer un quiz

Teste tes connaissances avec des questions interactives