STATISTIQUES

GENERALITES

Rangement en classe

Pour réaliser l’étude statistique d’un caractère quantitatif pouvant prendre toutes les valeurs sur un intervalle, on regroupe parfois ces valeurs en classe.

Effectif d’une classe

 L’effectif d’une classe est le nombre d’individus dont les modalités appartiennent à cette classe.

Exemple : On a regroupé dans le tableau ci-dessous le nombre d’avocatiers d’une pépinière en fonction de leur taille en cm. La série statistique obtenue est regroupée en classes.

30 avocatiers ont une taille comprise entre 0 et 5 cm

12 avocatiers ont une taille comprise entre 10 et 15 cm

Amplitude

 · L’amplitude d’une classe [a,b[ est le nombre b-a

Pour la classe [ 10,15[,

L’amplitude est 15-10=5

Centre

· Le centre est le nombre (a+b) /2

Exemple : le centre la classe [10,15[ est (10+15) /2=12,5

Densité d’une classe

C’est le quotient de l’effectif par l’amplitude de la classe.

Fréquence

 La fréquence en pourcentage d’une classe est donnée par la formule :

 Fréquence de la classe [ a,b[ est :

Exemple : la fréquence de la classe [5,10 [   est :

 Remarque : la somme de toutes les fréquences en pourcentage est toujours égale à 100.

Effectifs et fréquences cumulés

-On appelle effectif cumulé croissant (ECC) d’une modalité le nombre d’individu dont l’effectif est inférieur ou égal à cette modalité.

-On appelle effectif cumulé décroissant (ECD) d’une modalité le nombre d’individu dont l’effectif est supérieur ou égal à cette modalité.

-On appelle fréquence cumulé décroissant (FCC) d’une modalité le rapport de ECC par l’effectif total.

 

Quartiles, écart interquartile

Le premier quartile est la plus petite valeur de la série telle qu'au moins 25 % des autres valeurs de la série sont inférieures ou égales à cette valeur. Le troisième quartile est la plus petite valeur de la série telle qu'au moins 75 % des autres valeurs de la série sont inférieures ou égales à cette valeur.
L'écart interquartile d'une série statistique de premier quartile Q1 et de troisième quartile Q3 est égal à la différence Q3 - Q1.

 

Remarque :

 L'écart interquartile d'une série mesure la dispersion autour de la médiane. Il contient au moins 50% des valeurs de la série. L'écart interquartile n'est pas influencé par les valeurs extrêmes de la série.

 

CARACTERISTIQUES DE POSITION

Classe modale et mode

·         La classe modale est la classe ayant le plus grand effectif.

·         Le mode est le centre de la classe modale.

Exemple : Dans l’exemple ci-dessus, la classe modale est [5 ; 10[.

                                                             Le mode est (5 + 10)/2.

NB: Étant donné que les modalités sont des variables discrètes, les modes et les classes modales seront définis à partir des effectifs et non des densités.

 

Moyenne :

La moyenne d’une série statistique est le réel :

 , où ni est l’effectif de centre ci.

Médiane

            On appelle médiane d’une série statistique la modalité qui correspond à la moitié de l’effectif total. La classe médiane est la classe qui contient la médiane.si N est l’effectif totale, la médiane Me est telle que le nombre d’individus de modalité supérieur a Me et le nombre d’individus de modalité inférieur à Me soit N/2.

 

Détermination d’une médiane par interpolation linéaire :

Me  étant la médiane, N/2 la moitié de l’effectif, soit le point M(Me,N/2) compris entre les points A(xA,yA) et le point B(xB,yB), la médiane est donnée par la relation :

 

Exemple : soit la série statistique suivante :

classes

[2,5[

[4,6[

[6,8[

[8,10[

Total

Effectif

7

9

21

13

50

ECC

7

16

37

50

 

 

La moitié de l’effectif est N/2=25

25 est compris entre les classes [4,6 [  et   [6,8[, donc Me est compris entre 6 et 8.

6                 16

Me               25

8                  37

Par interpolation linéaire :

  =>Me=6,3

 

CARACTERISTIQUES DE DISPERSION

Variance

La variance d’une série statistique est le réel positif :

.

 

La formule de KEONIG :

 permet de calculer plus facilement la variance.

Ecart-type

L’écart type d’une série statistique est le réel positif :

 

Ecart moyen

 L’écart moyen d’une série statistique est le réel positif :

 

L’écart-moyen permet de mesurer la dispersion d’une série.

Intervalle moyen

 L’intervalle est appelé intervalle moyen. Le pourcentage d’observations contenues dans cet intervalle donne une mesure de la concentration des observations autour de la moyenne.

Exemple : soit la série statistique suivante :

Classe

[ 0,5[

[ 5,7[

[ 7,9[

[ 9,15[

Total

Effectif

15

78

36

21

150

ECC

15

93

129

150

 

ECD

150

135

57

21

 

Fréquence

10

52

24

14

100

Centre :ci

2,5

6

8

12

 

nici

37,5

468

288

252

1045,5

ni(ci)2

93,75

28,08

23,04

3024

8229,75

 

Moyenne :

Variance :

Ecart-type :

 

REPRESENTATION GRAPHIQUE

Histogramme

 Un histogramme d’une série statistique est un graphique composé de rectangles juxtaposés dont les bases sont les amplitudes des classes et les hauteurs sont proportionnelles aux densités de ces classes.

 

Cas des classes de même amplitude

Ø  Si les classes ont toutes la même amplitude, alors la hauteur d’un rectangle est proportionnelle à l’effectif (ou à la fréquence) de la classe qu’elle représente.

Exemple : Construisons l’historique de la série ci-dessous 

 

:

Cas des classes d’amplitudes différentes

 

Ø  Si les classes ont des amplitudes différentes, alors la hauteur d’un rectangle est proportionnelle à la densité de la classe qu’elle représente, la classe modale ici est celle qui a la plus forte densité.

·         La largeur de chaque rectangle est proportionnelle à l’amplitude de la classe qu’elle représente, on choisira de multiplier ou diviser l’amplitude par le nombre qui convient pour obtenir une mesure que l’on peut construire.

·         Les aires des rectangles doivent être proportionnelles aux effectifs des classes, on calculera dont les aires des rectangles à partir des effectifs et d’un coefficient de proportionnalité que l’on choisit à sa convenance.

·         On déduit les hauteurs des rectangles en divisant les aires par les largeurs.

 

Dépenses

[0,500[

[500,750[

[750,1000[

[1000,1500[

[1500,3000[

Effectifs

440

320

400

480

300

Amplitude

500

250

250

500

1500

Largeur

2

1

1

2

6

Aire

11

8

10

12

9

Hauteur

5,5

8

10

6

1,5

 

Polygone des effectifs

            Le polygone des effectifs est une ligne brisée obtenue en joignant les milieux des segments supérieurs de chaque rectangle de l’histogramme.

 Le polygone des effectifs cumulés croissants (resp décroissants) est une ligne brisée joignant les points ayant pour abscisse la borne supérieure ( esp la borne inférieure ) de la classe et pour ordonnée l’effectif cumulé de la classe.

               

Construction des EEC :

1-Placer en ordonnées les EEC.

- Placer en abscisse les valeurs supérieures des classes. Pour éviter de mettre tous les éléments, on place souvent un double trait signifiant que l’on coupe l’axe.

2.On place les points du tableau, ensuite on relie ces points.

NB : les ECD sont des nombres qui sont de plus en plus petits, on prend les valeurs inferieures des classes.

Exemple : Soit la distribution suivante :

xi

[0,5[

[5,7[

[7,10[

[10,12[

[12,14[

[14,16[

total

ni

6

8

10

3

1

1

29

 

Pour construire les polygones des ECC et ECD, on complète le tableau

xi

[0,5[

[5,7[

[7,10[

[10,12[

[12,14[

[14,16[

total

ni

6

8

10

3

1

1

29

ECC

6

14

24

27

28

29

 

ECD

29

23

15

5

2

1

 

 

                       

 

Dans un repère cartésien, on place les ECC (ou ECD) en ordonnées et les classes e abscisses

 

 

 

  A l’aide du polygone des ECC (en bleu) où des ECD (en noir), on détermine la médiane d’une série statistique. En effet la médiane est l’abscisse du point de l’effectif cumulé croissant où décroissant dont l’ordonnée est la moitié de l’effectif total N/ 2.

 

 

EXERCICES

EXERCICE I: Une enquête a été réalisée et a donné les tailles exprimées en cm de 51 élèves d’une classe.

1.Completer le tableau

Classes

[150,160[

[160,165[

[165,170[

[170,178[

total

Effectif

12

20

11

8

51

ECC

 

 

 

 

 

ECD

 

 

 

 

 

 

2. Déduire le nombre d’élèves qui ont une taille inférieure à 165

3. Déduire le nombre d’élèves qui ont une taille supérieure ou égal à 160

4. Déterminer moyenne, la variance, l’écart-type et la médiane de cette série statistique.

 

EXERCICE II: soit la série statistique suivante :

classes

[0,4[

[4,8[

[8,12[

[12,14[

14,16[

[16,20[

total

Effectif

38

50

32

24

26

30

200

 

1.Completer

classes

[0,4[

[4,8[

[8,12[

[12,14[

14,16[

[16,20[

total

Effectif

38

50

32

24

26

30

200

ECC

 

 

 

 

 

 

 

ECD

 

 

 

 

 

 

 

 

2.Calculer la moyenne, variance et l’écart-type

3.Construire les polygones des ECC et ECD

4.En déduire la médiane par la méthode graphique.

 

CORRIGES

EXERCICE I:

Classes

[150,160[

[160,165[

[165,170[

[170,178[

total

Effectif

12

20

11

8

51

ECC

12

32

43

51

 

ECD

51

39

19

8

 

ci

155

162,5

167,5

174

 

nici

1860

3250

1842,5

1392

8344,5

ni(ci)2

288300

528125

308618,75

242208

1367251,75

 

2.   32 représente le nombre d’élèves qui ont une taille inférieure à 165 cm

3.   39 représente le nombre d’élèves qui ont une taille supérieure ou égal à 160 cm

4. 

Moyenne= :

 Variance :

 L’écart-type :

  La médiane :

La moitié de l’effectif est N/2=25,5

25,5 est compris entre les classes [150,160[et   [160,165[ donc Me est compris entre 6 et 8.

160                 12

Me               25,5

165              32

Par interpolation linéaire :

  =>Me=156,63

 

EXERCICE II :

classes

[0,4[

[4,8[

[8,12[

[12,14[

14,16[

[16,20[

total

Effectif

38

50

32

24

26

30

200

ECC

33

88

120

144

170

200

 

ECD

200

162

112

80

56

30

 

ci

2

6

10

13

15

18

 

nici

76

300

320

312

390

540

1938

ni(ci)2

152

1800

3200

1656

5850

9720

22378

 

2.

Moyenne :

 Variance :

 L’écart-type :

3.  ECC en rouge et ECD en noir.

L’abscisse du point de rencontre des deux polygones est la médiane de la série statistique.

Me = 9,5

On peut verifier par le calcul :

La moitié de l’effectif est N/2=100

25,5 est compris entre les classes [4,8[  et   [8,12[ donc Me est compris entre 8 et 12.

8                88

Me               100

12             120

Par interpolation linéaire :

  =>Me=9,5