Correction de l’examen final de « Statistique descriptive »
- Semestre 2- Mai 2018-
Enseignant : Abdessamad OUCHEN
Exercice 1 :
1-
Le caractère étudié : le nombre d’ordinateurs vendus dans la journée.
Sa nature : c’est un caractère quantitatif discret.
2-
Tableau-Fréquences relatives et fréquences cumulées croissantes
Nombre Effectifs Fréquences Fréquences 𝒏𝒊 𝒙𝒊 𝒏𝒊 𝒙𝟐𝒊 ̅ )𝟑
𝒏𝒊 (𝒙𝒊 − 𝒙 ̅ )𝟒
𝒏𝒊 (𝒙𝒊 − 𝒙
d’enfants relatives fi relatives
à charge ni cumulées
ou croissantes
modalité Fi
xi
x1 = 0 n1 = 5 f1 = 0,1667 F1 = 0,1667 𝑛1 𝑥1 = 0 𝑛1 𝑥12 = 0 𝑛1 (𝑥1 − 𝑥̅ )3 = -26,0385 𝑛1 (𝑥1 − 𝑥̅ )4 = 45,1334
x2 = 1 n2 = 11 f2 = 0,3667 F2 = 0,5333 𝑛2 𝑥2 = 11 𝑛2 𝑥22 = 11 𝑛2 (𝑥2 − 𝑥̅ )3 = -4,3381 𝑛2 (𝑥2 − 𝑥̅ )4 = 3,1813
x3 = 2 n3 = 6 f3 = 0,2 F3 = 0,7333 𝑛3 𝑥3 = 12 𝑛3 𝑥32 = 24 𝑛3 (𝑥3 − 𝑥̅ )3 = 0,1138 𝑛3 (𝑥3 − 𝑥̅ )4 = 0,0303
x4 = 3 n4 = 4 f4 = 0,1333 F4 = 0,8667 𝑛4 𝑥4 = 12 𝑛4 𝑥42 = 36 𝑛4 (𝑥4 − 𝑥̅ )3 = 8,1292 𝑛4 (𝑥4 − 𝑥̅ )4 = 10,297
x5 = 4 n5 = 3 f5 = 0,1 F5 =0,9667 𝑛5 𝑥5 = 12 𝑛5 𝑥52 = 48 𝑛5 (𝑥5 − 𝑥̅ )3 = 34,9369 𝑛5 (𝑥5 − 𝑥̅ )4 = 79,1903
x6 = 5 n6 = 1 f6 = 0,0333 F6 = 1 𝑛6 𝑥6 = 5 𝑛6 𝑥62 = 25 𝑛6 (𝑥6 − 𝑥̅ )3 = 34,8590 𝑛6 (𝑥6 − 𝑥̅ )4 = 113,8726
Total n = 30 1 - ∑𝑘=6
𝑖=1 𝑛𝑖 𝑥𝑖 =52 ∑𝑘=6 2
𝑖=1 𝑛𝑖 𝑥𝑖 =144 ∑𝑘=6 3
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ ) = 47,6622 ∑𝑘=6 4
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ ) = 251,7049
3-
le mode 𝒎𝒐 :
Avec la valeur 𝑥2 = 1 ordinateur, l’effectif 𝑛2 = 11 est maximal.
Le mode est alors 𝑚𝑜 = 𝑥2 = 1 ordinateur.
1
La médiane 𝒎𝒆 :
On a : n = 30 est un nombre pair : n = 2 p = 2 x 15 = 30.
∗ +𝑥 ∗
𝑥𝑝 ∗ ∗
𝑝+1 𝑥15 +𝑥16 1+1
Alors : la valeur médiane est 𝑚𝑒 = = = = 1 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟. C’est la moitié
2 2 2
de la somme de la valeur de la variable X (le nombre d’ordinateurs vendus) correspondant à la
15ème observation, c’est-à-dire x = 1 ordinateur (la deuxième modalité 𝑥2 = 1 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟), et
de la valeur de X correspondant à la 16ème observation, c’est-à-dire x = 1 ordinateur (la
deuxième modalité 𝑥2 = 1 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟).
ATTENTION : l’indice « p » pour xp* renvoie au rang de l’observation et non pas à celui de
la modalité xi. On a 6 modalités (x1 = 0 ; x2 = 1 ; x3 = 2 ; x4 = 3 ; x5 = 4 ; x6 = 5) mais 30
observations (x1* ; x2* ; … ; x30*) qui prennent l’une des 6 valeurs des modalités.
Les quartiles :
*Le premier quartile Q1 :
On a : n/4 = 30/4 = 7,5 n’est pas un entier.
Alors : Q1 = x[n/4]+1* = x8* = 1 ordinateur.
ATTENTION : l’indice « [n/4]+1» pour x[n/4]+1* renvoie au rang de l’observation et non pas à
celui de la modalité xi. On a 6 modalités (x1 = 0 ; x2 = 1 ; x3 = 2 ; x4 = 3 ; x5 = 4 ; x6 = 5) mais
30 observations (x1* ; x2* ; … ; x30*) qui prennent l’une des 6 valeurs des modalités.
*Le deuxième quartile Q2 : est la valeur de la médiane 𝑚𝑒 = 𝑄2 = 1 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟.
*Le troisième quartile Q3 :
On a : 3n/4 = (3x30) / 4 = 22,5 n’est pas un entier.
Alors : Q3 = x[3n/4]+1* = x23* = 3 ordinateurs.
ATTENTION : l’indice « [3n/4]+1 » pour x[3n/4]+1* renvoie au rang de l’observation et non
pas à celui de la modalité xi. On a 6 modalités (x1 = 0 ; x2 = 1 ; x3 = 2 ; x4 = 3 ; x5 = 4 ; x6 = 5)
mais 30 observations (x1* ; x2* ; … ; x30*) qui prennent l’une des 6 valeurs des modalités.
2
̅:
La moyenne arithmétique 𝒙
𝑘=6
1 (5𝑥0) + (11𝑥1) + (6𝑥2) + (4𝑥3) + (3𝑥4) + (1𝑥5) 52
𝑥̅ = ∑ 𝑛𝑖 𝑥𝑖 = = = 1,7333 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟𝑠
𝑛 30 30
𝑖=1
4-
La variance 𝑽(𝑿) :
𝑘=6
1 144
𝑉(𝑋) = ∑ 𝑛𝑖 𝑥𝑖2 − 𝑥̅ 2 = 𝑄 2 − 𝑥̅ 2 = − (1,7333)2 = 1,7956 ordinateurs2
𝑛 30
𝑖=1
L’écart-type 𝝈𝒙 :
𝜎𝑥 = √𝑉(𝑋) = √1,7956 = 1,34 𝑜𝑟𝑑𝑖𝑛𝑎𝑡𝑒𝑢𝑟𝑠
Le coefficient de variation 𝑪𝑽 :
𝜎𝑥 1,34
𝐶𝑉 = = = 0,7731 = 77,31 %
𝑥̅ 1,7333
L’écart-type représente 77,31 % de la moyenne arithmétique.
5-
Le coefficient d’asymétrie de Fisher (ou skewness) est :
𝜇 1
𝛾 = 𝜎33 où 𝜇3 = 𝑛 ∑𝑘=6 3 3
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ ) est le moment centré d’ordre 3 et 𝜎𝑋 est l’écart-type élevé
𝑋
à la puissance 3.
Le coefficient d’asymétrie de Fisher (ou skewness) est égal à:
𝜇 47,6622/30
𝛾 = 𝜎33 = = 0,6603 > 0.
𝑋 1,343
D’où: la distribution est asymétrique étalée à droite.
3
Le coefficient d’aplatissement Г de Fisher (ou Kurtosis) est :
𝜇4 1
Г= 4 − 3 où 𝜇4 = 𝑛 ∑𝑘=6 4 4
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ ) est le moment centré d’ordre 4 et 𝜎𝑋 est l’écart-type
𝜎𝑋
élevé à la puissance 4.
Le coefficient d’aplatissement Г de Fisher (ou Kurtosis) est alors :
𝜇4 251,7049/30
Г= 4 −3= − 3 = −0,39 < 0. La distribution est plus aplatie (une
𝜎𝑋 1,3444
distribution platikurtique) que la distribution normale.
Exercice 2 :
1- La distribution marginale de X.
Valeur de X [0, 5[ [5, 10[ [10, 15[ Total
𝑥1 = 2,5 𝑥2 = 7,5 𝑥3 = 12,5
Effectif 𝑛𝑖. 𝑛1. = 37 𝑛2. = 32 𝑛3. = 31 𝑛 = 100
𝑛𝑖.
Fréquence 𝑓𝑖. = 𝑓1. = 0,37 𝑓2. = 0,32 𝑓3. = 0,31 1
𝑛
2-
-La moyenne marginale 𝑥̅ :
𝑘=3
𝑥̅ = ∑ 𝑓𝑖. 𝑥𝑖 = (0,37𝑥2,5) + (0,32𝑥7,5) + (0,31𝑥12,5) = 7,2
𝑖=1
-La variance marginale 𝜎𝑥2 :
𝑘=3 𝑘=3
𝜎𝑥2 = ∑ 𝑓𝑖. (𝑥𝑖 − 𝑥̅ )2 = ∑ 𝑓𝑖. 𝑥𝑖 2 − 𝑥̅ 2 = 68,75 − 7,22 = 16,91
𝑖=1 𝑖=1
4
2-
-La distribution conditionnelle de X/Y = y1 ∈ [−20; 0[ est :
X/Y=y1 [0, 5[ [5, 10[ [10, 15[ Total
𝑥1 = 2,5 𝑥2 = 7,5 𝑥3 = 12,5
Effectif 𝑛𝑖1 𝑛11 = 12 𝑛21 = 6 𝑛31 = 4 𝑛.1 = 22
Fréquence 𝑛11 12 𝑛21 6 𝑛31 4
𝑛𝑖1 𝑓1/1 = = = 0,54545 𝑓2/1 = = = 0,2727 𝑓3/1 = = = 0,1818 1
𝑓𝑖/1 = 𝑛.1 22 𝑛.1 22 𝑛.1 22
𝑛.1
-La moyenne conditionnelle 𝑥
̅̅̅1 pour 𝑦1 = −10 est :
𝑘=3
𝑥1 = ∑ 𝑓𝑖/1 𝑥𝑖 = (0,54545𝑥2,5) + (0,2727𝑥7,5) + (0,1818𝑥12,5) = 5,6814
̅̅̅
𝑖=1
-La variance conditionnelle 𝜎 2𝑗 = 𝜎 21 est :
𝑘=3 𝑘=3
𝜎12 = ∑ 𝑓𝑖/1 (𝑥𝑖 − ̅̅̅)2
̅̅̅1 2 = 47,1548 − 5,68142 = 14,8765
𝑥1 = ∑ 𝑓𝑖/1 𝑥𝑖2 − 𝑥
𝑖=1 𝑖=1
5
Exercice 3 :
1-
2- Les paramètres de l’équation de la droite de régression de Y en X : Y=aX+b (la
méthode des moindres carrés ordinaires (MCO))
𝒙𝒊 𝒚𝒊 𝒙 𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒚𝟐𝒊
6 5 30 36 25
9 4,2 37,8 81 17,64
12 4,1 49,2 144 16,81
14 4 56 196 16
24 3 72 576 9
30 2,2 66 900 4,84
𝑛=6 𝑛=6 𝑛=6 𝑛=6 𝑛=6
Total ∑ 𝑥𝑖 = 95 ∑ 𝑦𝑖 = 22,5 ∑ 𝑥𝑖 𝑦𝑖 = 311 ∑ 𝑥𝑖2 = 1933 ∑ 𝑦𝑖2 = 89,29
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
∑𝑛=6
𝑖=1 𝑥𝑖 95
𝑥̅ = = = 15,833
𝑛 6
∑𝑛=6
𝑖=1 𝑦𝑖 22,5
𝑦̅ = = = 3,75
𝑛 6
6
𝑛=6
1 1933
𝑉(𝑋) = ∑ 𝑥𝑖2 − 𝑥̅ 2 = − (15,8332 ) = 71,4722
𝑛 6
𝑖=1
𝜎𝑥 = √𝑉(𝑋) = √71,4722 = 8,4541
𝑛=6
1 89,29
𝑉(𝑌) = ∑ 𝑦𝑖2 − 𝑦̅ 2 = − (3,752 ) = 0,8192
𝑛 6
𝑖=1
𝜎𝑦 = √𝑉(𝑌) = √0,8192 = 0,9051
*Pour a :
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎̂ =
𝜎𝑥2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑎̂ =
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝑎̂ =
∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑥̅ 2
311 − (6𝑥15,833𝑥3,75)
𝑎̂ = = −0,1055
1933 − (6𝑥15,8332 )
*Pour b :
𝑏̂ = 𝑦̅ − 𝑎̂𝑥̅
𝑏̂ = 3,75 − (−0,1055 𝑥 15,833) = 5,4207
D’où : 𝑦̂ = −0,1055 𝑥 + 5,4207
Le point moyen est : M(𝑥̅ = 15,833, 𝑦̅ = 5,4207)
7
Le point moyen
M(𝑥̅ = 15,833, 𝑦̅ = 5,4207)
3- Le coefficient de corrélation linéaire r(X, Y) :
𝑐𝑜𝑣(𝑋, 𝑌)
𝑟(𝑋, 𝑌) =
𝜎𝑋 𝜎𝑌
𝑛 𝑛
1 1
𝑐𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅
𝑛 𝑛
𝑖=1 𝑖=1
𝑛
1
𝑐𝑜𝑣(𝑋, 𝑌) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅
𝑛
𝑖=1
𝑛=6
1 311
𝑐𝑜𝑣(𝑋, 𝑌) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅ = − (15,833 x 3,75) = −7,5417
𝑛 6
𝑖=1
8
𝑐𝑜𝑣(𝑋,𝑌) −7,5417
𝑟(𝑋, 𝑌) = = 8,4541 𝑥 0,9051 = −0,9856 < 0 => Il existe une relation linéaire négative
𝜎𝑋 𝜎𝑌
entre X et Y.
4-
Pour x=8, alors : 𝑦̂ = ((−0,1055) 𝑥 8) + 5,4207 = 4,57
Pour x=15, alors : 𝑦̂ = ((−0,1055) 𝑥 15) + 5,4207 = 3,8379
Exercice 3 :
1-
Tableau-Indices simples base 1 année précédente
Année 𝑡 𝐷𝑖𝑣𝑡
𝐼𝑡/𝑡−1 =
𝐷𝑖𝑣𝑡−1
𝑡 = 2014 −
𝑡 = 2015 𝐷𝑖𝑣2015 196
𝐼2015/2014 = = = 0,98
𝐷𝑖𝑣2014 200
𝑡 = 2016 𝐷𝑖𝑣2016 245
𝐼2016/2015 = = = 1,25
𝐷𝑖𝑣2015 196
𝑡 = 2017 𝐷𝑖𝑣2017 343
𝐼2017/2016 = = = 1,4
𝐷𝑖𝑣2016 245
2-
𝐼2017/2014 = 𝐼2017/2016 𝑥 𝐼2016/2015 𝑥 𝐼2015/2014
𝐼2017/2014 = 1,4 𝑥 1,25 𝑥 0,98 = 1,715
3- Taux de variation des dividendes annuels :
*Pour 2015/2014 :
𝑇𝑎𝑢𝑥 𝑣𝑎𝑟𝑖𝑎𝑡𝑖𝑜𝑛 = 𝐼2015/2014 − 1 = 0,98 − 1 = −0,02 = −2%
*Pour 2017/2016 :
𝑇𝑎𝑢𝑥 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑡𝑖𝑜𝑛 = 𝐼2017/2016 − 1 = 1,4 − 1 = 0,4 = 40%