Statistique
I. Le tableau de contingence
A. Activité
Dans une classe de 39 élèves, on a recueilli et consigné des informations sur la taille et le poids des élèves dans le tableau suivant :
Nombre d'élèves | 11 | 15 | 6 | 7 |
Taille (en $cm$) | 140 | 150 | 160 | 170 |
Poids (en $kg$) | 50 | 55 | 60 | 65 |
1. Quels sont les caractéristiques étudiées ?
2. Que représente le nombre 15 ?
Réponse :
1. Les caractères étudiés sont la taille et le poids des élèves.
2. La valeur 15 signifie qu’il y’a 15 élèves qui ont une taille de $150$ $cm$ et un poids de $55$ $kg$.
B. Définition
Une étude portant sur deux caractères d’une population est souvent présentée par un tableau à double entrée. Ce tableau rend compte de la distribution des individus suivant la modalité des deux caractères : c’est le tableau de contingence.
Les totaux obtenus en ligne sont les effectifs marginaux liés à la taille.
Les totaux obtenus en colonne sont des effectifs marginaux liés au poids.
II. Représentation d’une série statique à double variable: les nuages de points
Lorsqu’une étude est faite sur un ensemble représentant deux caractères d'une série statistique double $(x_i ; y_i)$. L’économiste ou le gestionnaire cherchera s’il y’a un lien de cause à effet entre ses deux caractères et le statisticien quantifiera ce lien.
A. Le nuage de points
Dans un repère orthogonal bien choisi l’ensemble des points tel que $\mathbf{M_i (x_i ; y_i)}$ est appelé le nuage de point de la série double.
B. Le point moyen
Une étude faite sur deux caractères $\mathbf{x_i}$ et $\mathbf{y_i}$ permet de calculer les valeurs moyennes de $\mathbf{x_i}$ notées $\mathbf{\bar{x}}$ et celle de $\mathbf{y_i}$ notées $\mathbf{\bar{y}}$. Le point $\mathbf{(\bar{x};\bar{y})}$ est appelé point moyen de la série double.
III. Ajustement affine
A. Ajustement
Suivant la forme du nuage du point, on peut essayer de trouver une fonction qui modélise le lien entre les deux caractères de sorte que la courbe d’équation $\mathbf{f(x) = y}$ passe le plus près possible du nuage du point.
B. Ajustement affine
Si le nuage de point est longiligne, on peut rendre compte de la tendance observée à l’aide d’une droite d’équation $\mathbf{y= ax +b}$ on parle alors d’ajustement affine.
C. Méthode ajustement affine
Si le nuage présente un certain alignement de points, on peut ajuster à l’aide d’une droite d’équation. Il existe diverses méthodes pour obtenir cette droite.
1. Méthode graphique
Le procédé le plus rapide consiste à effectuer. un ajustement à l’œil. Cet ajustement peut être améliorer en faisant passer par le point moyen.
Définition
On trace une droite $(D)$ passant par $G$ et « assez proche des points du nuage» puis on détermine son equation sous la forme $y =mx+p$.
En effet : $(D)$ passe par $ A(x_A; y_B)$ et $B(x_A; x_B) \Leftrightarrow \left\{ \begin{array}{rl} y_A = mx_A + p \\ y_B= mx_B + p \end{array}\right.$.
Masse suspendue $x_i $ en $kg$ |
2 |
2.5 | 4 | 4.5 | 6.5 | 7 | 8 | 10 |
Allongement $ y_i $ en $cm$ | 19 | 20 | 21 | 22 | 26 | 32 | 36 | 40 |
Déterminons l'équation de la droite $(D)$ passant par $G(5.5; 27)$ et le septième point du nuage de points :
$ \left\{ \begin{array}{ll} 27 = 5.5m + p\\36 = 8m + p \end{array}\right. \Leftrightarrow m = 3.6 $ et $ p = 7.2 \Leftrightarrow (D): y =3.6x + 7.2 $
2. La méthode Mayer
Elle consiste à fractionner le nuage en deux sous nuages d’importance équivalence et à joindre les points moyens de deux nuages partiels.
On fractionne le nuage de points en deux sous-nuages de même effectif de points moyens respectifs $G_1$ et $G_2$ (ou différent a une unité près si l'effectif est impair ) alors puis on détermine l'équation de la droite $(G_1G_2)$ appelée droite de MAYER.
Determinons la droite de Mayer du nuage de points :
- Soit $G_1$ le point moyen des quatres premiers points
$G_1(\frac{13}{4}; \frac {82}{4})$ $\Leftrightarrow$$G_1(3.25; 20.5)$
- Soit $G_2$ le point moyen des quatres derniers pointsÂ
  Â
    $G_2(\frac{31.5}{4}; \frac {134}{4})$ $\Leftrightarrow$$G_2(7.875;33.5)$
- Equation de la droite $(G_1G_2)$
$(G_1G_2)$: $y = mx + p$$\Leftrightarrow$ $\left\{ \begin{array}{ll} 20.5=3.25m+p \\ 33.5=7.875m+p \end{array}\right.$$\Leftrightarrow$ $m = 2.8$ et $p = 11.4$
Donc $G_1G_2$ : $y = 2.8x +11.4 $
3. Ajustement affine après le changement de variable
Des changements de variables convenables permettent de transformer le nuage de points situé au voisinage d’une courbe en un nuage longiligne.
C'est faire des prévisions ou retrouver des résultats manquants sur la série statistique double à partir de l'équation $y=mx+p$.
En utilisant la droite $(D): y = 3.6x + 7.2$
- Determinations l'allongement previsible pour une masse suspendue de 18 $kg$
$x= 18 \Leftrightarrow y$ $=3.6\times 18+7.2\\=72$
- Estimons la masse suspendue ayant produit un allongement du ressort de 27 $cm$.
$y=27 $ $\Leftrightarrow 27 =3.6x + 7.2\\ \Leftrightarrow x=5.5$
- Pour une masse suspendue de 18 $kg$, l'allongement à prevoir est de 72 $cm$.
- La masse de l'objet suspendu au ressort ayant produit un allongement du ressort de 27 $cm$ est 5.5 $kg$.