Lektionen
Zu Diane

Statistique Descriptive 

Keine Karten

Statistique descriptive : indices de position, dispersion et graphiques

Ceci est un aide-mémoire sur la statistique descriptive, cours donné par F. Mauny, UFR Santé – Université de Franche-Comté.

Introduction à la Statistique Descriptive

La statistique descriptive est la **première étape** du travail statistique. Elle vise à résumer et présenter *fidèlement* les données brutes.
  • Objectifs Clés :

    • Classer et Condenser les résultats (tableaux, graphiques).
    • Obtenir une vision globale de la série statistique.
    • Utiliser des indices pour décrire la position et la dispersion.
    • Permettre les comparaisons.
    • Dépend de la nature des données (qualitatives ou quantitatives).

Nature des Caractères Étudiés

La manière de traiter l'information dépend fortement de sa nature.

  • Caractères Qualitatifs :

    • Ordinal : Les modalités peuvent être ordonnées (ex: bandelettes U : 0, +, ++, +++).
    • Nominal : Les modalités ne peuvent pas être ordonnées (ex: sexe, couleur des yeux, statut marital).
  • Caractères Quantitatifs :

    • Discret : Ne peut prendre qu'un nombre fini ou dénombrable de valeurs isolées (ex: nombre d'enfants, nombre d'ovocytes).
    • Continu : Peut prendre toute valeur dans un intervalle donné (ex: poids, taille, IMC, tension artérielle).
    • Date : Un type spécifique souvent traité à part.
  • Transformation des Données :

    • Un caractère continu peut être rendu qualificatif (ex: TA mesurée vs. statut hypertendu oui/non).
    • Un caractère continu peut être regroupé en classes (ex: temps de gestation : avant 33 SA, entre 33 et 37 SA, 37 SA et plus).

Convention de Notation

  • NN : Taille de la population.
  • nn : Taille de l'échantillon observé.
  • XX et YY : Caractères définis dans la population.
  • xx et yy : Caractères définis dans l'échantillon.
  • xix_i et yiy_i : Valeurs observées chez le sujet ii.

Présentation de l'Information

L'information brute (une série de données) est organisée pour la rendre lisible.

  • Tableaux de Distribution des Fréquences :

    • Permettent une mise en forme immédiate pour les données qualitatives et quantitatives.
    • nin_i : Fréquence absolue (nombre d'occurrences).
    • fi=ni/nf_i = n_i / n : Fréquence relative (proportion).

    Caractère Qualitatif :

    Statut marital nin_i fif_i
    Célibataire 30 0,25
    Pacs 18 0,15

    Caractère Quantitatif :

    • Nécessite souvent une transformation des données par répartition en classes.
    Âge (années) nin_i fif_i
    15 - 24 246 0,31
    25 - 34 272 0,34

Indices de Position (Mesures de Valeurs Centrales)

Ces indices décrivent le "centre" ou la "tendance centrale" des données.

  • Le Mode :

    • Définition : La valeur la plus fréquemment rencontrée dans la série.
    • Détermination : Par identification et comptage des valeurs distinctes.
    • Unité : Identique à celle de la série.
    • Une série peut avoir plusieurs modes (multimodale) ou aucun.
  • La Médiane :

    • Définition : La valeur seuil qui partage la série ordonnée en deux groupes de même effectif (50% des données sont en dessous, 50% au-dessus).
    • Détermination : La série doit être impérativement ordonnée.
      • Si nn est impair (n=2p+1n=2p+1) : la médiane est la valeur centrale.
      • Si nn est pair (n=2pn=2p) : la médiane est la moyenne des deux valeurs centrales. median=xp+xp+12median = \frac{x_p + x_{p+1}}{2}.
    • Unité : Identique à celle de la série.
    • Peu sensible aux valeurs extrêmes (outliers).
  • La Moyenne Arithmétique :

    • Notation :
      • μ\mu pour la population.
      • mm ou x\overline{x} pour l'échantillon.
    • Définition : La somme de toutes les valeurs divisée par le nombre de valeurs (effectif).
    • Calcul :
      • Échantillon : x=xin\overline{x} = \frac{\sum x_i}{n}.
      • Population : μ=XiN\mu = \frac{\sum X_i}{N}.
      • Avec données en classes d'effectif nin_i : x=nixin=fixi\overline{x} = \frac{\sum n_i x_i}{n} = \sum f_i x_i.
    • Unité : Identique à celle de la série.
    • Propriétés :
      • Si x2=x1+ax_2 = x_1 + a, alors x2=x1+a\overline{x_2} = \overline{x_1} + a.
      • Si x2=a×x1x_2 = a \times x_1, alors x2=a×x1\overline{x_2} = a \times \overline{x_1}.
    • Très sensible aux valeurs extrêmes.

Les Quantiles

Les quantiles sont des valeurs seuils qui partagent la série ordonnée en plusieurs parties égales.

  • Définition : Sur une série ordonnée, une valeur seuil qui partage la série en deux groupes : une proportion pp des données en dessous et une proportion 1p1-p au-dessus de cette valeur.
  • Détermination : La série doit être ordonnée.
  • Unité : Identique à celle de la série.
  • Types de Quantiles :

    • Quartiles (Q1,Q2,Q3Q_1, Q_2, Q_3) : Divisent la série en 4 parties égales.
      • Q1Q_1 (p=0,25) : 25% des valeurs sont inférieures ou égales à Q1Q_1.
      • Q2Q_2 (p=0,50) : C'est la médiane.
      • Q3Q_3 (p=0,75) : 75% des valeurs sont inférieures ou égales à Q3Q_3.
    • Déciles (D1D_1 à D9D_9) : Divisent la série en 10 parties égales (ex: D1D_1 pour p=0,10).
    • Percentiles (P1P_1 à P99P_{99}) : Divisent la série en 100 parties égales (ex: P1P_1 pour p=0,01).

Indices de Dispersion

Ces indices décrivent la variabilité ou l'étalement des données autour de leur tendance centrale.

  • L'Étendue :

    • Définition : L'écart entre la valeur maximale (xmaxx_{max}) et la valeur minimale (xminx_{min}) de la série.
    • Calcul : Étendue = xmaxxminx_{max} - x_{min}.
    • Simple mais très sensible aux valeurs extrêmes.
  • La Variance :

    • Notation :
      • σ2\sigma^2 pour la population.
      • s2s^2 pour l'échantillon.
    • Principe : Quantifier l'écart au carré moyen entre chaque valeur et la moyenne. La somme des écarts non carrés est toujours nulle.
    • Calcul :
      • Échantillon : s2=(xix)2n1=xi2(xi)2nn1s^2 = \frac{\sum (x_i - \overline{x})^2}{n-1} = \frac{\sum x_i^2 - \frac{(\sum x_i)^2}{n}}{n-1}.
      • Population : σ2=(Xiμ)2N=Xi2(Xi)2NN\sigma^2 = \frac{\sum (X_i - \mu)^2}{N} = \frac{\sum X_i^2 - \frac{(\sum X_i)^2}{N}}{N}.
      • Avec données en classes nin_i : s2=1n1(nixi2(nixi)2n)s^2 = \frac{1}{n-1} \left( \sum n_i x_i^2 - \frac{(\sum n_i x_i)^2}{n} \right).
    • Unité : Le carré de l'unité de la série (ex: années²).
    • Propriétés :
      • Si x2=x1+ax_2 = x_1 + a, alors s22=s12s_2^2 = s_1^2. (L'ajout d'une constante ne change pas la dispersion).
      • Si x2=a×x1x_2 = a \times x_1, alors s22=a2×s12s_2^2 = a^2 \times s_1^2.
    • La variance est en unités carrées, rendant son interprétation directe parfois difficile.
  • L'Écart-type :

    • Notation :
      • σ\sigma pour la population.
      • ss pour l'échantillon.
    • Calcul : La racine carrée de la variance. s=s2s = \sqrt{s^2}.
    • Unité : Même unité que celle de la série (ex: ans).
    • C'est l'indice de dispersion le plus couramment utilisé car il est dans la même unité que les données originales, facilitant l'interprétation.

Graphiques

Les graphiques sont des représentations visuelles des données pour faciliter leur compréhension.

  • Caractère Qualitatif :

    • Diagramme en Bâtons (ou en Barres) :
      • Hauteur des bâtons représente l'effectif (nin_i) ou la fréquence relative (fif_i).
      • Les figurés (bâtons) sont disjoints car il n'y a pas de continuité entre les classes.
    • Diagramme en Secteurs (Camembert) :
      • L'aire de chaque secteur est proportionnelle à la fréquence relative (fif_i).
      • L'ensemble du disque représente 360°, et chaque angle de classe = 360×fi360 \times f_i.
      • Les figurés sont joints, la totalité du disque correspondant à fi=1\sum f_i = 1.
  • Caractère Quantitatif Discret :

    • Souvent représenté de la même manière qu'un caractère qualitatif, avec des diagrammes en bâtons.
  • Caractère Quantitatif Continu :

    • Histogramme :
      • Nécessite de découper la distribution continue en classes (intervalles contigus, sans chevauchement, généralement d'étendues égales).
      • Amplitude aa = étendue / nombre de classes.
      • La hauteur du rectangle est proportionnelle à la fréquence relative (fif_i) ou à l'effectif (nin_i) si l'amplitude des classes est constante.
      • Les rectangles sont joints pour montrer la continuité du caractère.
    • Polygone de Fréquences : Souvent tracé en joignant les points centraux de la partie supérieure des rectangles d'un histogramme.
    • Courbe de Fréquences Cumulées (Ogive) : Obtient la fréquence relative cumulée (FiF_i) par sommation successive des fif_i.

Indices de Position & Distribution

  • La relation entre la moyenne, la médiane et le mode peut donner des indications sur la forme de la distribution :
    • Moyenne << Médiane << Mode : Distribution dissymétrique à gauche (queue de distribution à gauche).
    • Mode << Médiane << Moyenne : Distribution dissymétrique à droite (queue de distribution à droite).
    • Si Moyenne \approx Médiane \approx Mode : Distribution symétrique.

Conclusion

La statistique descriptive est une étape fondamentale de l'analyse statistique, qui permet de :
  • Évaluer l'ordre de grandeur et la variabilité des caractères étudiés.
  • Contrôler la qualité des informations.
  • Synthétiser et présenter les données de manière claire.
  • Orienter la démarche de l'analyse statistique ultérieure.

Statistique Descriptive

La statistique descriptive est la première étape du travail statistique. Elle consiste à collecter, organiser, résumer et présenter les données d'une manière significative, afin de donner une vision globale et de faciliter l'interprétation. Les données brutes issues d'observations ou d'expériences sont transformées en informations condensées et fidèles, souvent sous forme de tableaux et de graphiques.

Nature des Caractères Étudiés

Les caractéristiques (variables) que l'on étudie peuvent être de différentes natures, ce qui influence leur traitement statistique et leur représentation.

Caractères Qualitatifs

Ces caractères décrivent une qualité ou une catégorie et ne sont pas mesurables numériquement.

  • Ordinal : Les modalités peuvent être ordonnées. Ex : bandelettes urinaires (0,+,++,+++), niveau de douleur (faible, moyen, fort).

  • Nominal : Les modalités ne peuvent pas être ordonnées. Ex : sexe, couleur des yeux, statut marital.

Caractères Quantitatifs

Ces caractères sont mesurables numériquement et expriment une quantité.

  • Discret : Les valeurs possibles sont dénombrables et souvent entières. Ex : nombre d'enfants, nombre d'ovocytes.

  • Continu : Les valeurs possibles peuvent prendre n'importe quelle valeur dans un intervalle donné. Ex : poids, taille, indice de masse corporelle (IMC), tension artérielle (TA).

  • Date : Un type spécial de donnée qui peut être traité comme quantitatif ou catégorique selon le contexte.

Dépendance du Traitement

La nature d'une donnée peut dépendre de la manière dont elle est traitée :

  • Exemple du temps de gestation humaine (en nombre de semaines d'aménorrhée) :

    avant 33 SA

    entre 33 et 37 SA

    37 SA et +

    grand et TG prématuré

    prématuré

    Non prématuré

    Ici, une variable quantitative continue (semaines d'aménorrhée) est transformée en variable qualitative ordinale (catégories de prématurité).

  • Exemple de la tension artérielle (TA) : Elle peut être une valeur mesurée (quantitative continue) ou transformée en un statut hypertendu (oui/non) (qualitative nominale).

Principe de Notation

Pour faciliter la compréhension et les calculs, des conventions de notation sont utilisées :

  • : taille de la population totale.

  • : taille de l'échantillon observé.

  • et : caractères (variables) définis dans la population.

  • et : caractères (variables) définis dans l'échantillon.

  • et : valeurs observées chez le sujet .

Présentation de l'Information

L'information brute sous forme de série statistique (ex: 125, 178, 169, ...) est difficilement exploitable. Elle doit être organisée.

Tableaux de Distribution des Fréquences

Les tableaux permettent de condenser l'information.

  • Pour un caractère Qualitatif : La mise en forme est immédiate.

    • : fréquence absolue (nombre d'occurrences de la modalité ).

    • : fréquence relative (proportion d'occurrences de la modalité ).

    Exemple : 120 sujets buveurs excessifs, statut marital

    Statut marital

    Célibataire

    30

    0,25

    Pacs

    18

    0,15

    Marié

    24

    0,20

    Divorcé

    36

    0,30

    Veuf

    12

    0,10

  • Pour un caractère Quantitatif : Nécessite souvent une transformation des données en classes de répartition. Exemple : 800 patients vus en consultation

    Âge (années)

    15 - 24

    246

    0,31

    25 - 34

    272

    0,34

    35 - 44

    157

    0,19

    45 - 54

    85

    0,11

    55 - 64

    40

    0,05

Indices Statistiques

Les indices permettent de résumer numériquement les caractéristiques principales d'une série statistique. Ils se divisent en indices de position et indices de dispersion.

Indices de Position (Mesures de Tendance Centrale)

Ces indices décrivent la position "centrale" ou "typiqued" des données.

Le Mode

  • Définition : Le mode est la valeur la plus fréquemment rencontrée dans une série statistique.

  • Détermination : Il s'identifie en comptant les occurrences de chaque valeur distincte.

  • Unité : Identique à celle de la série.

  • Exemple : Série d'âges (10 femmes en consultation pour infertilité) : 37, 29, 31, 39, 38, 35, 34, 33, 35, 32.
    Dans cette série, la valeur 35 apparaît deux fois, les autres une seule fois. Le mode est 35 ans.

La Médiane

  • Définition : La médiane est la valeur seuil qui partage la série ordonnée en deux groupes de même effectif. La moitié des données est inférieure ou égale à la médiane, l'autre moitié est supérieure ou égale.

  • Détermination :

    1. La série doit d'abord être ordonnée par ordre croissant.

    2. Si (effectif) est impair (), la médiane est la valeur centrale, soit la -ième valeur.

    3. Si est pair (), la médiane est la moyenne des deux valeurs centrales, soit la moyenne de la -ième et de la -ième valeur. </p></li></ol></li><li><pstyle="textalign:left;"><strong>Uniteˊ</strong>:Identiqueaˋcelledelaseˊrie.</p></li><li><pstyle="textalign:left;"><strong>Exemple</strong>:Seˊrieda^gesordonneˊepourlinfertiliteˊ(n=10):<br>29,31,32,33,<mark>34</mark>,<mark>35</mark>,35,37,38,39.<br>Les5eet6evaleurssont34et35.<br>Meˊdiane=<spandatalatex="(34+35)/2=34,5 ans"datatype="inlinemath"></span>.</p></li></ul><pstyle="textalign:left;">LaMoyenne(<mark>arithmeˊtique</mark>)</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><strong>Notation</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><spandatalatex="μ"datatype="inlinemath"></span>:pourla<strong>population</strong>.</p></li><li><pstyle="textalign:left;"><spandatalatex="xˉ"datatype="inlinemath"></span>ou<spandatalatex="m"datatype="inlinemath"></span>:pourun<strong>eˊchantillon</strong>.</p></li></ul></li><li><pstyle="textalign:left;"><strong>Deˊfinition</strong>:Lamoyenneestla<strong>sommedetouteslesvaleursdiviseˊeparlenombredevaleurs(effectif)</strong>.</p></li><li><pstyle="textalign:left;"><strong>Calcul</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;">Pouruneˊchantillon:<spandatalatex="</p></li></ol></li><li><p style="text-align: left;"><strong>Unité</strong> : Identique à celle de la série.</p></li><li><p style="text-align: left;"><strong>Exemple</strong> : Série d'âges ordonnée pour l'infertilité (n=10) : <br>29, 31, 32, 33, <mark>34</mark>, <mark>35</mark>, 35, 37, 38, 39. <br>Les 5e et 6e valeurs sont 34 et 35. <br>Médiane = <span data-latex="(34 + 35) / 2 = \text{34,5 ans}" data-type="inline-math"></span>.</p></li></ul><p style="text-align: left;">La Moyenne (<mark>arithmétique</mark>)</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Notation</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="\mu" data-type="inline-math"></span> : pour la <strong>population</strong>.</p></li><li><p style="text-align: left;"><span data-latex="\bar{x}" data-type="inline-math"></span> ou <span data-latex="m" data-type="inline-math"></span> : pour un <strong>échantillon</strong>.</p></li></ul></li><li><p style="text-align: left;"><strong>Définition</strong> : La moyenne est la <strong>somme de toutes les valeurs divisée par le nombre de valeurs (effectif)</strong>.</p></li><li><p style="text-align: left;"><strong>Calcul</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;">Pour un échantillon : <span data-latex=" \bar{x} = \frac{\sum x_i}{n} " data-type="inline-math"></p></li><li><pstyle="textalign:left;">Pourunepopulation:<spandatalatex="</p></li><li><p style="text-align: left;">Pour une population : <span data-latex=" \mu = \frac{\sum X_i}{N} " data-type="inline-math"></p></li><li><pstyle="textalign:left;">Silesdonneˊessontregroupeˊesenclassesdeffectif<spandatalatex="ni"datatype="inlinemath"></span>(avec<spandatalatex="xi"datatype="inlinemath"></span>repreˊsentantlecentredeclasse):<spandatalatex="</p></li><li><p style="text-align: left;">Si les données sont regroupées en classes d'effectif <span data-latex="n_i" data-type="inline-math"></span> (avec <span data-latex="x_i" data-type="inline-math"></span> représentant le centre de classe) : <span data-latex=" \bar{x} = \frac{\sum n_i x_i}{n} = \sum f_i x_i " data-type="inline-math"></p></li></ul></li><li><pstyle="textalign:left;"><strong>Uniteˊ</strong>:Identiqueaˋcelledelaseˊrie.</p></li><li><pstyle="textalign:left;"><strong>Proprieˊteˊsdetranslationetdemiseaˋleˊchelle</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;">Si<spandatalatex="x2=x1+a"datatype="inlinemath"></span>alors<spandatalatex="x2ˉ=x1ˉ+a"datatype="inlinemath"></span></p></li><li><pstyle="textalign:left;">Si<spandatalatex="x2=a×x1"datatype="inlinemath"></span>alors<spandatalatex="x2ˉ=a×x1ˉ"datatype="inlinemath"></span></p></li></ul></li><li><pstyle="textalign:left;"><strong>Exemple</strong>:Seˊrieda^gespourlinfertiliteˊ:37,29,31,39,38,35,34,33,35,32.<br><spandatalatex="x=37+29+31+39+38+35+34+33+35+32=343"datatype="inlinemath"></span><br><spandatalatex="xˉ=34310=34,3 ans"datatype="inlinemath"></span></p></li><li><pstyle="textalign:left;"><strong>Sensibiliteˊauxvaleursextre^mes</strong>:Lamoyenneestsensibleauxvaleursaberrantes.<br>Exempleavecuneerreurdesaisie(32remplaceˊpar12):<br>Seˊrie:37,29,31,39,38,35,34,33,35,12.<br><spandatalatex="x=37+29+31+39+38+35+34+33+35+12=323"datatype="inlinemath"></span><br><spandatalatex="xˉ=32310=32,3 ans"datatype="inlinemath"></span>(uneerreuraaffecteˊlamoyennede2ans).</p></li></ul><pstyle="textalign:left;">LesQuantiles</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><strong>Deˊfinition</strong>:Suruneseˊrieordonneˊe,unquantileestune<strong>valeurseuilquipartagelaseˊriedesortequuneproportion</strong><spandatalatex="p"datatype="inlinemath"></span><strong>desdonneˊessetrouveendessous</strong>etuneproportion<spandatalatex="1p"datatype="inlinemath"></span>audessusdecettevaleur.</p></li><li><pstyle="textalign:left;"><strong>Deˊtermination</strong>:Neˊcessiteuneseˊrieordonneˊe.</p></li><li><pstyle="textalign:left;"><strong>Uniteˊ</strong>:Identiqueaˋcelledelaseˊrie.</p></li><li><pstyle="textalign:left;"><strong>Typesdequantiles</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><strong>Quartiles</strong>:3valeursseuilquidivisentlaseˊrieen4partieseˊgales.</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><spandatalatex="Q1"datatype="inlinemath"></span>(premierquartile):<spandatalatex="p=0,25"datatype="inlinemath"></span>(25</p></li></ul></li><li><p style="text-align: left;"><strong>Unité</strong> : Identique à celle de la série.</p></li><li><p style="text-align: left;"><strong>Propriétés de translation et de mise à l'échelle</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;">Si <span data-latex="x_2 = x_1 + a" data-type="inline-math"></span> alors <span data-latex="\bar{x_2} = \bar{x_1} + a" data-type="inline-math"></span></p></li><li><p style="text-align: left;">Si <span data-latex="x_2 = a \times x_1" data-type="inline-math"></span> alors <span data-latex="\bar{x_2} = a \times \bar{x_1}" data-type="inline-math"></span></p></li></ul></li><li><p style="text-align: left;"><strong>Exemple</strong> : Série d'âges pour l'infertilité : 37, 29, 31, 39, 38, 35, 34, 33, 35, 32. <br><span data-latex="\sum x = 37 + 29 + 31 + 39 + 38 + 35 + 34 + 33 + 35 + 32 = 343" data-type="inline-math"></span> <br><span data-latex="\bar{x} = \frac{343}{10} = \text{34,3 ans}" data-type="inline-math"></span></p></li><li><p style="text-align: left;"><strong>Sensibilité aux valeurs extrêmes</strong> : La moyenne est sensible aux valeurs aberrantes. <br>Exemple avec une erreur de saisie (32 remplacé par 12) : <br>Série : 37, 29, 31, 39, 38, 35, 34, 33, 35, 12. <br><span data-latex="\sum x = 37 + 29 + 31 + 39 + 38 + 35 + 34 + 33 + 35 + 12 = 323" data-type="inline-math"></span> <br><span data-latex="\bar{x} = \frac{323}{10} = \text{32,3 ans}" data-type="inline-math"></span> (une erreur a affecté la moyenne de 2 ans).</p></li></ul><p style="text-align: left;">Les Quantiles</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Définition</strong> : Sur une série ordonnée, un quantile est une <strong>valeur seuil qui partage la série de sorte qu'une proportion </strong><span data-latex="p" data-type="inline-math"></span><strong> des données se trouve en dessous</strong> et une proportion <span data-latex="1-p" data-type="inline-math"></span> au-dessus de cette valeur.</p></li><li><p style="text-align: left;"><strong>Détermination</strong> : Nécessite une série ordonnée.</p></li><li><p style="text-align: left;"><strong>Unité</strong> : Identique à celle de la série.</p></li><li><p style="text-align: left;"><strong>Types de quantiles</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Quartiles</strong> : 3 valeurs seuil qui divisent la série en 4 parties égales.</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="Q_1" data-type="inline-math"></span> (premier quartile) : <span data-latex="p=0,25" data-type="inline-math"></span> (25% des données sont inférieures ou égales).</p></li><li><p style="text-align: left;"><span data-latex="Q_2" data-type="inline-math"></span> (deuxième quartile) : <span data-latex="p=0,50" data-type="inline-math"></span> (50% des données sont inférieures ou égales) - <mark>C'est la médiane</mark>.</p></li><li><p style="text-align: left;"><span data-latex="Q_3" data-type="inline-math"></span> (troisième quartile) : <span data-latex="p=0,75" data-type="inline-math"></span> (75% des données sont inférieures ou égales).</p></li></ul></li><li><p style="text-align: left;"><strong>Déciles</strong> : 9 valeurs seuil qui divisent la série en 10 parties égales.</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="D_1" data-type="inline-math"></span> : <span data-latex="p=0,10" data-type="inline-math"></span> (10%).</p></li><li><p style="text-align: left;">...</p></li><li><p style="text-align: left;"><span data-latex="D_9" data-type="inline-math"></span> : <span data-latex="p=0,90" data-type="inline-math"></span> (90%).</p></li></ul></li><li><p style="text-align: left;"><strong>Percentiles</strong> : 99 valeurs seuil qui divisent la série en 100 parties égales.</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="P_1" data-type="inline-math"></span> : <span data-latex="p=0,01" data-type="inline-math"></span> (1%).</p></li><li><p style="text-align: left;">...</p></li><li><p style="text-align: left;"><span data-latex="P_{99}" data-type="inline-math"></span> : <span data-latex="p=0,99" data-type="inline-math"></span> (99%).</p></li></ul></li></ul></li><li><p style="text-align: left;"><strong>Exemple de Quatiles</strong> : Série d'âges ordonnée (n=10) : 29, 31, 32, 33, 34, 35, 35, 37, 38, 39.</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="Q_1" data-type="inline-math"></span> : <span data-latex="0,25 \times 10 = 2,5" data-type="inline-math"></span>. On retient la 3e valeur, soit <mark>32 ans</mark>.</p></li><li><p style="text-align: left;"><span data-latex="Q_3" data-type="inline-math"></span> : <span data-latex="0,75 \times 10 = 7,5" data-type="inline-math"></span>. On retient la 8e valeur, soit <mark>37 ans</mark>.</p></li></ul></li></ul><h3 style="text-align: left;">Indices de Dispersion</h3><p style="text-align: left;">Ces indices mesurent l'étalement ou la variabilité des données autour de la tendance centrale.</p><p style="text-align: left;">L'Étendu</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Valeurs minimale et maximale</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="x_{\min}" data-type="inline-math"></span> : La plus petite valeur de la série.</p></li><li><p style="text-align: left;"><span data-latex="x_{\max}" data-type="inline-math"></span> : La plus grande valeur de la série.</p></li></ul><p style="text-align: left;"> Exemple : Série d'âges pour l'infertilité : <span data-latex="x_{\min} = \text{29 ans}" data-type="inline-math"></span> et <span data-latex="x_{\max} = \text{39 ans}" data-type="inline-math"></span>.</p></li><li><p style="text-align: left;"><strong>Définition de l'étendue</strong> : L'écart entre la plus grande et la plus petite valeur de la série. <span data-latex=" \text{Étendue} = x_{\max} - x_{\min} " data-type="inline-math">3929=10 ans"datatype="inlinemath"></span>.</p></li></ul><pstyle="textalign:left;">LaVariance</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><strong>Notation</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><spandatalatex="σ2"datatype="inlinemath"></span>:pourla<strong>population</strong>.</p></li><li><pstyle="textalign:left;"><spandatalatex="s2"datatype="inlinemath"></span>:pourun<strong>eˊchantillon</strong>.</p></li></ul></li><li><pstyle="textalign:left;"><strong>Principe</strong>:Quantifierleˊcartentrechaquevaleuretlamoyennedelaseˊrie.Onutiliselecarreˊdeseˊcarts<spandatalatex="(xixˉ)2"datatype="inlinemath"></span>poureˊviterquelasommedeseˊcarts<spandatalatex="(xixˉ)"datatype="inlinemath"></span>nesoitnulle.</p></li><li><pstyle="textalign:left;"><strong>Deˊfinition</strong>:Lavarianceestla<strong>moyennedescarreˊsdeseˊcartsaˋlamoyenne</strong>.</p></li><li><pstyle="textalign:left;"><strong>Calcul</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;">Pouruneˊchantillon:<spandatalatex="39 - 29 = \text{10 ans}" data-type="inline-math"></span>.</p></li></ul><p style="text-align: left;">La Variance</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Notation</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="\sigma^2" data-type="inline-math"></span> : pour la <strong>population</strong>.</p></li><li><p style="text-align: left;"><span data-latex="s^2" data-type="inline-math"></span> : pour un <strong>échantillon</strong>.</p></li></ul></li><li><p style="text-align: left;"><strong>Principe</strong> : Quantifier l'écart entre chaque valeur et la moyenne de la série. On utilise le carré des écarts <span data-latex="(x_i - \bar{x})^2" data-type="inline-math"></span> pour éviter que la somme des écarts <span data-latex="\sum (x_i - \bar{x})" data-type="inline-math"></span> ne soit nulle.</p></li><li><p style="text-align: left;"><strong>Définition</strong> : La variance est la <strong>moyenne des carrés des écarts à la moyenne</strong>.</p></li><li><p style="text-align: left;"><strong>Calcul</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;">Pour un échantillon : <span data-latex=" s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} " data-type="inline-math">$ Note : On divise par pour un échantillon car cela donne un estimateur non biaisé de la variance de la population.

    4. Pour une population : </p></li></ul></li><li><pstyle="textalign:left;"><strong>Uniteˊ</strong>:Le<strong>carreˊdeluniteˊ</strong>delaseˊrie(ex:varianceda^gesenanneˊessexprimeenanneˊes2).</p></li><li><pstyle="textalign:left;"><strong>Formuledecalculsimplifieˊe(TheˊoreˋmedeKoenig)</strong>:<spandatalatex="</p></li></ul></li><li><p style="text-align: left;"><strong>Unité</strong> : Le <strong>carré de l'unité</strong> de la série (ex: variance d'âges en années s'exprime en années²).</p></li><li><p style="text-align: left;"><strong>Formule de calcul simplifiée (Théorème de Koenig)</strong> : <span data-latex=" \sum (x_i - \bar{x})^2 = \sum x_i^2 - \frac{(\sum x_i)^2}{n} " data-type="inline-math">$ D'où :

      • Pour un échantillon : </p></li><li><pstyle="textalign:left;">Pourunepopulation:<spandatalatex="</p></li><li><p style="text-align: left;">Pour une population : <span data-latex=" \sigma^2 = \frac{\sum X_i^2 - \frac{(\sum X_i)^2}{N}}{N} " data-type="inline-math"></p></li></ul></li><li><pstyle="textalign:left;"><strong>Silesdonneˊessontenclasses(avec</strong><spandatalatex="xi"datatype="inlinemath"></span><strong>lecentredeclasse)</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;">Eˊchantillon:<spandatalatex="</p></li></ul></li><li><p style="text-align: left;"><strong>Si les données sont en classes (avec </strong><span data-latex="x_i" data-type="inline-math"></span><strong> le centre de classe)</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;">Échantillon : <span data-latex=" s^2 = \frac{1}{n - 1} \left( \sum n_i x_i^2 - \frac{(\sum n_i x_i)^2}{n} \right) " data-type="inline-math"></p></li><li><pstyle="textalign:left;">Population:<spandatalatex="</p></li><li><p style="text-align: left;">Population : <span data-latex=" \sigma^2 = \frac{1}{N} \left( \sum N_i X_i^2 - \frac{(\sum N_i X_i)^2}{N} \right) " data-type="inline-math"></p></li></ul></li><li><pstyle="textalign:left;"><strong>Proprieˊteˊsdetranslationetdemiseaˋleˊchelle</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;">Si<spandatalatex="x2=x1+a"datatype="inlinemath"></span>alors<spandatalatex="s22=s12"datatype="inlinemath"></span>(Lavarianceest<mark>insensibleaˋunetranslation</mark>).</p></li><li><pstyle="textalign:left;">Si<spandatalatex="x2=a×x1"datatype="inlinemath"></span>alors<spandatalatex="s22=a2×s12"datatype="inlinemath"></span>(Lavarianceestmultiplieˊeparle<mark>carreˊdufacteurdeˊchelle</mark>).</p></li></ul></li><li><pstyle="textalign:left;"><strong>Exemple</strong>:Calculdelavariancepourlaseˊrieda^ges(infertiliteˊ,<spandatalatex="xˉ=34,3"datatype="inlinemath"></span>ans,<spandatalatex="n=10"datatype="inlinemath"></span>)</p><tablestyle="minwidth:300px;"><colgroup><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"><colstyle="minwidth:25px;"></colgroup><tbody><tr><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"><strong>Sujet</strong></p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">1</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">2</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">4</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">5</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">6</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">8</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">9</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">10</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"><spandatalatex=""datatype="inlinemath"></span></p></td></tr><tr><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"><spandatalatex="xi"datatype="inlinemath"></span></p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">37</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">29</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">31</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">39</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">38</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">35</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">34</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">33</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">35</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">32</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">343</p></td></tr><tr><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"><spandatalatex="xixˉ"datatype="inlinemath"></span></p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">2,7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">5,3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">3,3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">4,7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">3,7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">1,3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,7</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">2,3</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"></p></td></tr><tr><tdcolspan="1"rowspan="1"><pstyle="textalign:left;"><spandatalatex="(xixˉ)2"datatype="inlinemath"></span></p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">7,29</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">28,09</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">10,89</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">22,09</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">13,69</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,49</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,09</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">1,69</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">0,49</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">5,29</p></td><tdcolspan="1"rowspan="1"><pstyle="textalign:left;">90,1</p></td></tr></tbody></table><pstyle="textalign:left;">Lasommedescarreˊsdeseˊcartsest<spandatalatex="(xixˉ)2=90,1"datatype="inlinemath"></span>.<br>Veˊrificationaveclaformulesimplifieˊe:<br><spandatalatex="xi2=1369+841+961+1521+1444+1225+1156+1089+1225+1024=11855"datatype="inlinemath"></span><br><spandatalatex="xi2(xi)2n=11855(343)210=1185511764910=1185511764,9=90,1"datatype="inlinemath"></span><br>Calculdelavariancedeleˊchantillon:<spandatalatex="</p></li></ul></li><li><p style="text-align: left;"><strong>Propriétés de translation et de mise à l'échelle</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;">Si <span data-latex="x_2 = x_1 + a" data-type="inline-math"></span> alors <span data-latex="s_2^2 = s_1^2" data-type="inline-math"></span> (La variance est <mark>insensible à une translation</mark>).</p></li><li><p style="text-align: left;">Si <span data-latex="x_2 = a \times x_1" data-type="inline-math"></span> alors <span data-latex="s_2^2 = a^2 \times s_1^2" data-type="inline-math"></span> (La variance est multipliée par le <mark>carré du facteur d'échelle</mark>).</p></li></ul></li><li><p style="text-align: left;"><strong>Exemple</strong> : Calcul de la variance pour la série d'âges (infertilité, <span data-latex="\bar{x} = 34,3" data-type="inline-math"></span> ans, <span data-latex="n=10" data-type="inline-math"></span>)</p><table style="min-width: 300px;"><colgroup><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"><col style="min-width: 25px;"></colgroup><tbody><tr><td colspan="1" rowspan="1"><p style="text-align: left;"><strong>Sujet</strong></p></td><td colspan="1" rowspan="1"><p style="text-align: left;">1</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">2</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">4</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">5</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">6</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">8</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">9</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">10</p></td><td colspan="1" rowspan="1"><p style="text-align: left;"><span data-latex="\sum" data-type="inline-math"></span></p></td></tr><tr><td colspan="1" rowspan="1"><p style="text-align: left;"><span data-latex="x_i" data-type="inline-math"></span></p></td><td colspan="1" rowspan="1"><p style="text-align: left;">37</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">29</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">31</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">39</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">38</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">35</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">34</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">33</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">35</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">32</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">343</p></td></tr><tr><td colspan="1" rowspan="1"><p style="text-align: left;"><span data-latex="x_i - \bar{x}" data-type="inline-math"></span></p></td><td colspan="1" rowspan="1"><p style="text-align: left;">2,7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">-5,3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">-3,3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">4,7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">3,7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">0,7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">-0,3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">-1,3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">0,7</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">-2,3</p></td><td colspan="1" rowspan="1"><p style="text-align: left;"></p></td></tr><tr><td colspan="1" rowspan="1"><p style="text-align: left;"><span data-latex="(x_i - \bar{x})^2" data-type="inline-math"></span></p></td><td colspan="1" rowspan="1"><p style="text-align: left;">7,29</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">28,09</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">10,89</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">22,09</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">13,69</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">0,49</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">0,09</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">1,69</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">0,49</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">5,29</p></td><td colspan="1" rowspan="1"><p style="text-align: left;">90,1</p></td></tr></tbody></table><p style="text-align: left;"> La somme des carrés des écarts est <span data-latex="\sum (x_i - \bar{x})^2 = 90,1" data-type="inline-math"></span>. <br>Vérification avec la formule simplifiée : <br><span data-latex="\sum x_i^2 = 1369 + 841 + 961 + 1521 + 1444 + 1225 + 1156 + 1089 + 1225 + 1024 = 11855" data-type="inline-math"></span> <br><span data-latex="\sum x_i^2 - \frac{(\sum x_i)^2}{n} = 11855 - \frac{(343)^2}{10} = 11855 - \frac{117649}{10} = 11855 - 11764,9 = 90,1" data-type="inline-math"></span> <br>Calcul de la variance de l'échantillon : <span data-latex=" s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} = \frac{90,1}{10-1} = \frac{90,1}{9} = \text{10,01 années}^2 " data-type="inline-math"></p></li></ul><pstyle="textalign:left;">LEˊcartType</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><strong>Notation</strong>:</p><ulclass="tight"datatight="true"><li><pstyle="textalign:left;"><spandatalatex="σ"datatype="inlinemath"></span>:pourla<strong>population</strong>.</p></li><li><pstyle="textalign:left;"><spandatalatex="s"datatype="inlinemath"></span>:pourun<strong>eˊchantillon</strong>.</p></li></ul></li><li><pstyle="textalign:left;"><strong>Calcul</strong>:Leˊcarttypeestla<strong>racinecarreˊedelavariance</strong>.<spandatalatex="</p></li></ul><p style="text-align: left;">L'Écart-Type</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><strong>Notation</strong> :</p><ul class="tight" data-tight="true"><li><p style="text-align: left;"><span data-latex="\sigma" data-type="inline-math"></span> : pour la <strong>population</strong>.</p></li><li><p style="text-align: left;"><span data-latex="s" data-type="inline-math"></span> : pour un <strong>échantillon</strong>.</p></li></ul></li><li><p style="text-align: left;"><strong>Calcul</strong> : L'écart-type est la <strong>racine carrée de la variance</strong>. <span data-latex=" s = \sqrt{s^2} " data-type="inline-math"></p></li><li><pstyle="textalign:left;"><strong>Uniteˊ</strong>:Leˊcarttypeala<mark>me^meuniteˊquecelledelaseˊrie</mark>observeˊe,cequilerendplusinterpreˊtablequelavariance.</p></li><li><pstyle="textalign:left;"><strong>Exemple</strong>:Pourlaseˊrieda^ges(infertiliteˊ),<spandatalatex="s2=10,01 ans2"datatype="inlinemath"></span>.<spandatalatex="</p></li><li><p style="text-align: left;"><strong>Unité</strong> : L'écart-type a la <mark>même unité que celle de la série</mark> observée, ce qui le rend plus interprétable que la variance.</p></li><li><p style="text-align: left;"><strong>Exemple</strong> : Pour la série d'âges (infertilité), <span data-latex="s^2 = 10,01 \text{ ans}^2" data-type="inline-math"></span>. <span data-latex=" s = \sqrt{10,01} \approx \text{3,16 ans} " data-type="inline-math">$

      Graphiques

      Les graphiques sont des représentations visuelles des données qui facilitent la compréhension rapide des distributions et des comparaisons.

      Graphiques pour Caractères Qualitatifs

      Diagramme en Bâtons

      • Utilisé pour les caractères qualitatifs (nominaux ou ordinaux) ou quantitatifs discrets.

      • La hauteur des bâtons représente l'effectif () ou la fréquence relative () de chaque modalité (classe).

      • Les bâtons sont disjoints, soulignant l'absence de continuité entre les catégories.

      • Exemple : Nombre d'enfants de 234 femmes

      Diagramme Circulaire (Secteurs)

      • Utilisé pour les caractères qualitatifs nominaux, particulièrement lorsque le nombre de catégories n'est pas trop élevé.

      • L'aire de chaque secteur est proportionnelle à la fréquence relative () de la catégorie.

      • L'ensemble de la série représente 360°. L'angle de chaque secteur est calculé par .

      • Les secteurs sont joints et couvrent la totalité du disque, représentant l'ensemble des observations ().

      • Exemple : Statut marital de 120 sujets

        Statut marital

        Célibataire

        30

        0,25

        Pacs

        18

        0,15

        Marié

        24

        0,20

        Divorcé

        36

        0,30

        Veuf

        12

        0,10

      Graphiques pour Caractères Quantitatifs

      Caractère Quantitatif Discret

      • La représentation est similaire au diagramme en bâtons pour les caractères qualitatifs.

      • Les bâtons sont disjoints.

      • Exemple : Nombre d'enfants chez 117 femmes atteintes d'un cancer du sein

        Nombre d'enfants

        1

        28

        0,24

        2

        39

        0,33

        3

        26

        0,22

        4

        14

        0,12

        5

        9

        0,08

        6

        1

        0,01

      Caractère Quantitatif Continu : Histogramme

      • Pour représenter une distribution continue, on la découpe en intervalles contigus (classes), généralement d'égales étendues et sans chevauchement.

      • Chaque classe correspond à un rectangle.

      • L'amplitude d'une classe peut être calculée comme : .

      • Construction des classes :

      • La hauteur du rectangle est proportionnelle à la fréquence relative () ou à l'effectif () si l'amplitude des classes est constante. S'il y a des amplitudes de classes inégales, c'est l'aire qui est proportionnelle à la fréquence.

      • Par sommation successive des , on peut calculer la fréquence relative cumulée , utile pour le calcul des quantiles.

      • Les rectangles sont joints, soulignant la continuité de la variable.

      Relation entre Indices de Position et Distribution

      La position relative de la moyenne, médiane et mode peut donner une indication sur la forme de la distribution (symétrique ou asymétrique).

      • Si la distribution est symétrique (ex: distribution normale), alors Mode Médiane Moyenne.

      • Si la distribution est asymétrique à gauche (étalée vers les valeurs faibles) : Moyenne Médiane Mode.

      • Si la distribution est asymétrique à droite (étalée vers les valeurs élevées) : Mode Médiane Moyenne.

      Conclusion

      La statistique descriptive est une phase fondamentale de toute approche statistique. Elle vise à :

      • Évaluer l'ordre de grandeur et la variabilité des caractères étudiés.

      • Contrôler la qualité des informations collectées.

      • Synthétiser et présenter les données de manière claire et compréhensible.

      • Orienter la démarche de l'analyse ultérieure (statistique inférentielle).

Quiz starten

Teste dein Wissen mit interaktiven Fragen