<loading.../>
Sin tarjetasStatistiques descriptives: mesures de tendance centrale et de dispersion, types de variables, échantillonnage, présentation des données.
Statistiques : Aide-mémoire Essentiel
Ce guide propose un aperçu structuré des concepts fondamentaux en statistiques, indispensable pour la méthodologie de recherche.
I. Introduction à la Méthodologie de la Recherche
But : Comprendre et mener des études statistiques, interpréter des articles scientifiques et développer un esprit critique.
Contexte : Enseignement à la HELB Ilya Prigogine, par Françoise Klein.
Supports de cours : Disponibles en ligne, mais ne dispensent pas de la prise de notes et de l'étude de sources additionnelles.
Droit d'auteur : Le support est réservé à l'usage pédagogique, toute reproduction ou transmission à des tiers est interdite.
II. Critères de Scientificité et Outils Statistiques
Domaines d'application : Sciences médicales et paramédicales.
Quand est-ce scientifique ? Dès qu'il y a :
Prises de mesures
Observations
Enquêtes
Sondages
Objectifs des statistiques :
Mener à bien une étude statistique simple.
Comprendre les articles et conclusions statistiques.
Devenir un outil critique dans l'apprentissage.
Interpréter et réaliser des statistiques descriptives élémentaires.
III. Premiers Pas en Statistique Descriptive
A. Qu'est-ce que la statistique ?
La Statistique (au singulier) : Science en soi.
Les Statistiques (au pluriel) : Les données elles-mêmes et leur traitement.
Fonctions : Rassembler, Synthétiser, Analyser, Extrapoler, Interpréter, Vérifier une hypothèse.
B. Population et Échantillon
Population : Ensemble des éléments à étudier sur certaines caractéristiques.
Peut être petite ou grande.
Nécessite la sélection d'un échantillon représentatif.
Échantillon : Partie choisie de la population.
n : Nombre d'individus (éléments) dans l'échantillon.
Échantillonnage : Processus de sélection, viser la représentativité.
Techniques :
Théorique : Échantillon aléatoire (chaque élément a une chance égale).
Pratique : Échantillon de convenance (pour des raisons pratiques et éthiques).
C. Variables
Définition : Caractéristiques choisies à étudier (représentées par X, Y, Z).
Types de Variables :
Variables quantitatives : Chiffrables (ex: âge, taille, poids).
Discrètes : Valeur finie (ex: nombre de patients).
Continues : Infinité de valeurs (ex: poids, taille, température).
Variables qualitatives : Non chiffrables (ex: état de santé, sexe).
Ordinales : Classées selon un ordre (ex: excellent, bon, moyen).
Nominales : Non-ordinales (ex: couleur des yeux).
Remarques :
Groupement par classe : Variable quantitative → qualitative ordinale.
Ex : Amplitude de mouvement en « grande, moyenne, petite ».
D. Données
Définition : Résultats des mesures ou observations sur les variables de l'échantillon.
Pour 1 variable, il y a n données (pour n individus).
Collecte via : instruments de mesure, questionnaires, observation.
IV. Présentation des Données
Les données recueillies doivent être présentées clairement pour analyse.
Données brutes : Sans ordre.
Individus
Sexe
Âge
Taille
Présence en cours
1
F
19
165
2
...
...
...
...
...
k colonnes = k variables.
n lignes = n sujets.
Suite ordonnée de données : Classement logique selon une variable.
Numériques/Ordinales : Classement par valeurs croissantes.
Nominales : Classement par fréquence d'apparition.
Regroupement des données discrètes : Regroupe les valeurs égales avec leur effectif.
Nombre de séances
Nombre de patients
10
2
20
7
Regroupement par classes pour variables continues :
Classe : Intervalle.
Classes contiguës : Extrémité inférieure ouverte, supérieure fermée.
Cet étape facilite la lecture et l'interprétation rapide des données, identifiant les valeurs extrêmes ou les erreurs.
Variable X = poids (g)
Effectifs (nj)
Fréq. relatives (fj)
Point milieu (xj)
Largeur (Lj)
]500;900]
1
3,6%
700
400
Total
N = 28
100%
V. Représentations Graphiques
Le choix graphique dépend de la variable étudiée.
Diagrammes en bâtons : Pour variables quantitatives discrètes ou qualitatives.
Graphiques en secteurs (circulaires) : Pour mettre en évidence des proportions.
Boxplots (Boîtes à moustaches) :
Pour variables quantitatives dans de petits échantillons (n < 50).
Renseigne sur : la médiane, les quartiles, la symétrie et l'étendue des données.
Histogrammes : Pour variables quantitatives continues regroupées en classes.
VI. Mesures de Tendance Centrale et de Dispersion
Ces mesures sont essentielles pour les variables quantitatives.
A. Mesures de Tendance Centrale (position)
Représentent le centre de la distribution des données.
1. Le Mode (M) :
Pour variables quantitatives et qualitatives.
Valeur la plus fréquente dans l'échantillon.
Correspond au point le plus élevé de la distribution graphique.
Peut ne pas exister, ou être multiple.
Non influencé par les valeurs extrêmes.
Ex : Dans 98, 74, 114, 96, 113, 98, 72, 121, 98, 134, 87, 98, 74, 121, 111, le mode est 98.
2. La Médiane () :
Pour variables quantitatives et qualitatives ordinales.
Divise la distribution en deux groupes d'effectifs égaux ().
50% des valeurs sont inférieures, 50% sont supérieures.
Formule pour sa position : .
Ex : Pour les ages 2,3,3,3,4,5,8,9,10,12,16,18,28,33 (ordonnés), la médiane est entre la 7e et 8e valeur.
3. La Moyenne () :
Se calcule à partir de toutes les données (brutes).
Pour un échantillon : ; pour une population : .
Formule (données brutes) :
Formule (données groupées) : (où est le point milieu de la classe).
Ex : Moyenne des âges (10, 18, 33, 3, 8, 5, 3, 2, 12, 3, 16, 28, 3, 4) = 10.5 mois.
Comparaison des Tendances Centrales :
Mode : Facile, moins riche en information.
Médiane : Représente la valeur la plus centrale et typique.
Moyenne : Tient compte de toutes les observations.
Plus la distribution est symétrique, plus moyenne et médiane sont proches.
Plus l'échantillon est grand, plus il est pertinent de regrouper en classes pour se rapprocher de la valeur attendue.
B. Mesures de Dispersion
Mettent en évidence la variabilité des données autour du centre de la distribution.
1. L'Étendue (Range) :
Définition : Différence entre la valeur la plus grande et la plus petite ().
Pour données groupées :
centre de la dernière classe centre de la première classe.
borne sup de la dernière classe borne inf de la première classe.
Peu fiable car ne dépend que de deux valeurs extrêmes.
Ex : Pour les poids des bébés (entre 500g et 2900g), R = 2400g ou 2000g (selon la méthode).
2. La Variance () :
Moyenne arithmétique des carrés des écarts entre chaque donnée et la moyenne.
Pour un échantillon : ; pour une population : .
Formule (données brutes) :
Formule (données groupées) :
3. L'Écart-type (s ou D.S.) :
Racine carrée de la variance.
Pour un échantillon : ; pour une population : .
Formule (données brutes) :
Formule (données groupées) :
4. Le Coefficient de Variation (CV) :
Moyen de comparer des écarts-types pour des mesures ayant des moyennes très différentes.
Plus CV est important, plus la dispersion est importante.
Formule : (exprimé en %).
VII. Mesures de Quartiles et Percentiles
Permettent de diviser une distribution en parties égales une fois les données rangées par ordre croissant.
Médiane : Divise en 2 parties.
Quartiles : Divisent en 4 parties égales.
: Isole 25% des observations inférieures. Formule : .
: Isole 50% des observations inférieures (c'est aussi la médiane).
: Isole 75% des observations inférieures et 25% supérieures. Formule : .
Espace interquartile : Distance entre et . Met en évidence les 50% des observations les plus centrales après élimination des 25% inférieurs et supérieurs.
Déciles : Divisent en 10 parties.
Pourcentiles : Divisent en 100 parties.
VIII. Références
Le cours s'appuie sur une bibliographie variée et des travaux de fin d'études, comme celui de CHIU Mathilde (2021-2022) sur les effets du massage à l'arnica.
Empezar cuestionario
Prueba tus conocimientos con preguntas interactivas