<loading.../>

Nessuna carta

Statistiques descriptives: mesures de tendance centrale et de dispersion, types de variables, échantillonnage, présentation des données.

Statistiques : Aide-mémoire Essentiel

Ce guide propose un aperçu structuré des concepts fondamentaux en statistiques, indispensable pour la méthodologie de recherche.

I. Introduction à la Méthodologie de la Recherche

  • But : Comprendre et mener des études statistiques, interpréter des articles scientifiques et développer un esprit critique.

  • Contexte : Enseignement à la HELB Ilya Prigogine, par Françoise Klein.

  • Supports de cours : Disponibles en ligne, mais ne dispensent pas de la prise de notes et de l'étude de sources additionnelles.

  • Droit d'auteur : Le support est réservé à l'usage pédagogique, toute reproduction ou transmission à des tiers est interdite.

II. Critères de Scientificité et Outils Statistiques

  • Domaines d'application : Sciences médicales et paramédicales.

  • Quand est-ce scientifique ? Dès qu'il y a :

    • Prises de mesures

    • Observations

    • Enquêtes

    • Sondages

  • Objectifs des statistiques :

    • Mener à bien une étude statistique simple.

    • Comprendre les articles et conclusions statistiques.

    • Devenir un outil critique dans l'apprentissage.

    • Interpréter et réaliser des statistiques descriptives élémentaires.

III. Premiers Pas en Statistique Descriptive

A. Qu'est-ce que la statistique ?

  • La Statistique (au singulier) : Science en soi.

  • Les Statistiques (au pluriel) : Les données elles-mêmes et leur traitement.

  • Fonctions : Rassembler, Synthétiser, Analyser, Extrapoler, Interpréter, Vérifier une hypothèse.

B. Population et Échantillon

  • Population : Ensemble des éléments à étudier sur certaines caractéristiques.

    • Peut être petite ou grande.

    • Nécessite la sélection d'un échantillon représentatif.

  • Échantillon : Partie choisie de la population.

    • n : Nombre d'individus (éléments) dans l'échantillon.

    • Échantillonnage : Processus de sélection, viser la représentativité.

    • Techniques :

      • Théorique : Échantillon aléatoire (chaque élément a une chance égale).

      • Pratique : Échantillon de convenance (pour des raisons pratiques et éthiques).

C. Variables

  • Définition : Caractéristiques choisies à étudier (représentées par X, Y, Z).

  • Types de Variables :

    • Variables quantitatives : Chiffrables (ex: âge, taille, poids).

      • Discrètes : Valeur finie (ex: nombre de patients).

      • Continues : Infinité de valeurs (ex: poids, taille, température).

    • Variables qualitatives : Non chiffrables (ex: état de santé, sexe).

      • Ordinales : Classées selon un ordre (ex: excellent, bon, moyen).

      • Nominales : Non-ordinales (ex: couleur des yeux).

  • Remarques :

    • Groupement par classe : Variable quantitative → qualitative ordinale.

    • Ex : Amplitude de mouvement en « grande, moyenne, petite ».

D. Données

  • Définition : Résultats des mesures ou observations sur les variables de l'échantillon.

    • Pour 1 variable, il y a n données (pour n individus).

    • Collecte via : instruments de mesure, questionnaires, observation.

IV. Présentation des Données

Les données recueillies doivent être présentées clairement pour analyse.

  • Données brutes : Sans ordre.

    Individus

    Sexe

    Âge

    Taille

    Présence en cours

    1

    F

    19

    165

    2

    ...

    ...

    ...

    ...

    ...

    • k colonnes = k variables.

    • n lignes = n sujets.

  • Suite ordonnée de données : Classement logique selon une variable.

    • Numériques/Ordinales : Classement par valeurs croissantes.

    • Nominales : Classement par fréquence d'apparition.

  • Regroupement des données discrètes : Regroupe les valeurs égales avec leur effectif.

    Nombre de séances

    Nombre de patients

    10

    2

    20

    7

  • Regroupement par classes pour variables continues :

    • Classe : Intervalle.

    • Classes contiguës : Extrémité inférieure ouverte, supérieure fermée.

    Cet étape facilite la lecture et l'interprétation rapide des données, identifiant les valeurs extrêmes ou les erreurs.

    Variable X = poids (g)

    Effectifs (nj)

    Fréq. relatives (fj)

    Point milieu (xj)

    Largeur (Lj)

    ]500;900]

    1

    3,6%

    700

    400

    Total

    N = 28

    100%

V. Représentations Graphiques

Le choix graphique dépend de la variable étudiée.

  • Diagrammes en bâtons : Pour variables quantitatives discrètes ou qualitatives.

  • Graphiques en secteurs (circulaires) : Pour mettre en évidence des proportions.

  • Boxplots (Boîtes à moustaches) :

    • Pour variables quantitatives dans de petits échantillons (n < 50).

    • Renseigne sur : la médiane, les quartiles, la symétrie et l'étendue des données.

  • Histogrammes : Pour variables quantitatives continues regroupées en classes.

VI. Mesures de Tendance Centrale et de Dispersion

Ces mesures sont essentielles pour les variables quantitatives.

A. Mesures de Tendance Centrale (position)

Représentent le centre de la distribution des données.

  • 1. Le Mode (M) :

    • Pour variables quantitatives et qualitatives.

    • Valeur la plus fréquente dans l'échantillon.

    • Correspond au point le plus élevé de la distribution graphique.

    • Peut ne pas exister, ou être multiple.

    • Non influencé par les valeurs extrêmes.

    • Ex : Dans 98, 74, 114, 96, 113, 98, 72, 121, 98, 134, 87, 98, 74, 121, 111, le mode est 98.

  • 2. La Médiane () :

    • Pour variables quantitatives et qualitatives ordinales.

    • Divise la distribution en deux groupes d'effectifs égaux ().

    • 50% des valeurs sont inférieures, 50% sont supérieures.

    • Formule pour sa position : .

    • Ex : Pour les ages 2,3,3,3,4,5,8,9,10,12,16,18,28,33 (ordonnés), la médiane est entre la 7e et 8e valeur.

  • 3. La Moyenne () :

    • Se calcule à partir de toutes les données (brutes).

    • Pour un échantillon : ; pour une population : .

    • Formule (données brutes) :

    • Formule (données groupées) : (où est le point milieu de la classe).

    • Ex : Moyenne des âges (10, 18, 33, 3, 8, 5, 3, 2, 12, 3, 16, 28, 3, 4) = 10.5 mois.

  • Comparaison des Tendances Centrales :

    • Mode : Facile, moins riche en information.

    • Médiane : Représente la valeur la plus centrale et typique.

    • Moyenne : Tient compte de toutes les observations.

    • Plus la distribution est symétrique, plus moyenne et médiane sont proches.

    • Plus l'échantillon est grand, plus il est pertinent de regrouper en classes pour se rapprocher de la valeur attendue.

B. Mesures de Dispersion

Mettent en évidence la variabilité des données autour du centre de la distribution.

  • 1. L'Étendue (Range) :

    • Définition : Différence entre la valeur la plus grande et la plus petite ().

    • Pour données groupées :

      • centre de la dernière classe centre de la première classe.

      • borne sup de la dernière classe borne inf de la première classe.

    • Peu fiable car ne dépend que de deux valeurs extrêmes.

    • Ex : Pour les poids des bébés (entre 500g et 2900g), R = 2400g ou 2000g (selon la méthode).

  • 2. La Variance () :

    • Moyenne arithmétique des carrés des écarts entre chaque donnée et la moyenne.

    • Pour un échantillon : ; pour une population : .

    • Formule (données brutes) :

    • Formule (données groupées) :

  • 3. L'Écart-type (s ou D.S.) :

    • Racine carrée de la variance.

    • Pour un échantillon : ; pour une population : .

    • Formule (données brutes) :

    • Formule (données groupées) :

  • 4. Le Coefficient de Variation (CV) :

    • Moyen de comparer des écarts-types pour des mesures ayant des moyennes très différentes.

    • Plus CV est important, plus la dispersion est importante.

    • Formule : (exprimé en %).

VII. Mesures de Quartiles et Percentiles

Permettent de diviser une distribution en parties égales une fois les données rangées par ordre croissant.

  • Médiane : Divise en 2 parties.

  • Quartiles : Divisent en 4 parties égales.

    • : Isole 25% des observations inférieures. Formule : .

    • : Isole 50% des observations inférieures (c'est aussi la médiane).

    • : Isole 75% des observations inférieures et 25% supérieures. Formule : .

    • Espace interquartile : Distance entre et . Met en évidence les 50% des observations les plus centrales après élimination des 25% inférieurs et supérieurs.

  • Déciles : Divisent en 10 parties.

  • Pourcentiles : Divisent en 100 parties.

VIII. Références

Le cours s'appuie sur une bibliographie variée et des travaux de fin d'études, comme celui de CHIU Mathilde (2021-2022) sur les effets du massage à l'arnica.

Inizia un quiz

Testa le tue conoscenze con domande interattive