0% ont trouvé ce document utile (0 vote)
389 vues12 pages

Traitements Préalables Sur Les Séries Statistiques

Transféré par

Sabri Elmehdi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
389 vues12 pages

Traitements Préalables Sur Les Séries Statistiques

Transféré par

Sabri Elmehdi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 12

TRAITEMENT PREALABLES SUR LES SERIES STATISTIQUES

« Master Econométrie Appliquée à l’Analyse et la Modélisation »

Réalisé par : Encadré par :


Sabri El mehdi Professeur Fouzi Mourji
Bel lazaar Nouhaila
Ajebli Imane
Ben Abdellah Tarik

Année Universitaire : 2022/2023


PLAN
 INTRODUCTION
I. TRAITEMENTS SUR LES SERIES CHRONOLOGIQUES
1. Les séries chronologiques
a. Définition
b. Composantes d’une série chronologique
c. Les modèles de ces composantes
2. Le passage de séries en valeur à séries en volume
3. Intérêts et méthodes pour établir les séries
a. Indices élémentaires
b. Indices synthétiques
c. transformation linéaire
4. Correction des variations saisonnières
II. TRAITEMENT SUR LES SERIES EN COUPE TRANSVERSALE
1. Les séries en coupe transversale ou instantanée
a. Définition
b. Caractéristiques
2. Traitement préalables sur les séries en coupe transversale
 INTRODUCTION
Lorsqu'un économiste cherche à identifier les déterminants de phénomènes tels que l’inflation, les
inégalités des revenus, la croissance économique. Il a automatiquement recours à des modèles
économétriques. D’où la nécessité de passage par les différentes étapes de la modélisation :
spécification, estimation, validation et utilisation.

Il est cependant nécessaire de faire des traitements sur les données lors du passage de la phase de
spécification à la phase d'estimation.

Ces traitements concernent aussi bien les séries chronologiques que les séries en coupe instantanée.
Ils sont importants pour mener une étude exacte dans le but de prendre des décisions pertinentes.

I. TRAITEMENTS SUR LES SERIES CHRONOLOGIQUES


1. Les séries chronologiques
a. Définition :

On s’intéresse à l’évolution au cours du temps d’un phénomène, dans le but de d´écrire, expliquer
puis prévoir ce phénomène dans le futur. On dispose ainsi d’observations à des dates différentes,
c’est à dire d’une suite de valeurs numériques indicées par le temps.

Par Exemple : le nombre mensuel de vente de voitures neuves au Maroc. Nombre annuel de
naissance au Maroc.

Une série chronologique peut-être aussi définit comme une suite d’observations d’une famille de
variables aléatoires réelles notées (Yt)t∈Θ où l’ensemble Θ est appelé espace des temps.

La variable Yt est une variable temporelle se caractérisant par des dates d’observations ordonnées de
manière régulière dans le temps.

On manipule des séries journalières (cours d’une action en bourse) mensuelles (consommation
mensuelle d’électricité) trimestrielles (nombre trimestriel de chômeurs) annuelles (chiffre annuel des
bénéfices des exportations).

b. Composantes d’une série chronologique

Le but de la décomposition d’une série chronologique est de distinguer dans l’évolution de la série,
une tendance « générale », des variations saisonnières qui se répètent chaque année, et des
variations accidentelles imprévisibles. L’intérêt de ceci est d’une part de mieux comprendre, de
mieux décrire l’évolution de la série, et d’autre part de prévoir son évolution (à partir de la tendance
et des variations saisonnières).

 La tendance Ct : la tendance correspond à l’évolution à long terme de la série, l’évolution


fondamentale de la série. Exemple : augmentation du chiffre d’affaires de 1978 à 1982.
 Les variations saisonnières St : les variations saisonnières sont des fluctuations périodiques à
l’intérieur d’une année, et qui se reproduisent de façon plus ou moins permanente d’une
année sur l’autre, sont des fluctuations périodiques à l’intérieur d’une année, et qui se
reproduisent de façon plus ou moins permanente d’une année sur l’autre. Ces variations sont
dues au rythme des saisons : matières premières, congés, …
 Les variations accidentelles ou résiduelles εt : Les variations accidentelles sont des
fluctuations irrégulières et imprévisibles. Elles sont supposées en général de faible
amplitude. Elles proviennent de circonstances non prévisibles : catastrophes naturelles, crise
boursière, grèves.

c. Les modèles de ces composantes :


 Le modèle additif

Dans un modèle additif, on suppose que les 3 composantes : tendance, variations saisonnières et
variations accidentelles sont indépendantes les unes des autres. On considère que la série Yt s’écrit
comme la somme de ces 3 composantes : Yt = Ct + St + εt

Graphiquement, l’amplitude des variations est constante autour de la tendance

 Le modèle multiplicatif
- 1°forme de modèle multiplicatif

On suppose que les variations saisonnières dépendent de la tendance. Et on considère que Yt s’écrit
de la manière suivante : Yt = Ct × St + εt

Graphiquement, l’amplitude des variations (saisonnières) varie.

- 2°forme de modèle multiplicatif


On suppose que les variations saisonnières et les variations accidentelles dépendent de la tendance.
Et on considère que Yt s’écrit de la manière suivante : Yt = Ct × St × εt

2. Le passage de séries en valeur aux séries en volume

L'inflation pose problème aux économistes. Car la valeur apparente de la production, à production
constante, change et, logiquement, affecte les salaires en menaçant le pouvoir d'achat. Par
conséquent, afin d'observer la véritable évolution de l'activité économique, de la production et de la
consommation, nous devons considérer les effets de l'inflation.

Déflater une série statistique consiste à annuler, effacer l’effet de l’inflation.

Et ici, il est nécessaire d’aborder les termes de prix courants qui correspondent à l’évolution en
valeur : à savoir les prix affichés dans les magasins, sur les étiquettes. Et de prix constants : les prix
débarrassés de l’inflation et qui correspondent à l’évolution en volume (Ils sont exprimés en monnaie
constante de telle ou telle année, comme si le pouvoir d’achat de la monnaie était resté stable
depuis cette année-là).

Exemple : en utilisant les indices simples

Exemple 1 :
Imaginons que l’indice des prix à la consommation soit 100,30 en 2016 et 101,17 en 2017 avec
comme année de référence 2015. 
Par ailleurs, le PIB nominal par habitant en France était de 33 000 euros courants en 2015, 33 300
euros courants en 2016 et 34 200 euros courants en 2017. Pour connaître l’évolution du PIB Réel
entre 2015 et 2017 en euros constants 2015, c’est-à-dire une fois l’inflation prise en compte, il faut
appliquer le calcul suivant :
PIB par hab. en 2016 : (33300/100.30) *100 = 33200 euros constants
PIB par hab. en 2017 : (34200/101.17) *100 = 33804 euros constants
Ainsi, une fois déflaté au prix de 2015, le prix par habitants en France s’élevait en terme réel à 33000
euros 2015, 33200 euros en 2016 et 33804 euros en 2017.
Exemple 2 :

De par le tableau suivant on a eu, les quantités vendues et les prix des chemises sur deux périodes
2006 et 2007

2006 2007 CA2006 CA2007


Prix Quantités Prix Quantités
Chemises 20 300 22 290 6000 6380

Pour analyser l’évolution du chiffre d’affaires, on peut dire que :

Entre 2006 et 2007, en terme nominal, le chiffre d’affaires a augmenté de 6 % ((6380/6000) *100) ;
par contre le volume des ventes a baissé de 3,3 % ((290/300) -1) *100)).
Il est possible de mesurer les variations du chiffre d’affaires en terme réel en écartant l’effet de
l’inflation ; pour cela il faut déflater ou corriger le CA en dhs courants par l’indice des prix et obtenir
dans ce cas-là un CA en dhs constants.

En prenant comme année de base 2006 :

On rappelle que IP2006/0 = (P2006/P0) *100

. Pour l’année 2006 :

Le chiffre d’affaires va rester le même, vu que l’indice des prix est égal à 100

. Pour l’année 2007 :

IP2007/2006 = (22/20) *100) = 110

CA en dhs constants2007 = CA en dhs courants2007/IP2007/2006 *100 = 6380/110 *100 = 5800

CA2006 en dh CA2007 en dh CA2007 en dh ∆ du CA en ∆ du CA en ∆ des quantités


courant courant constant dh courant dh produites
constant
Chemises 6000 6380 5800 6% -3,33 % -3,33 %

L’égalité entre la variation du CA en dh constants et la variation des quantités vendues tient du fait
de l’élimination de l’effet des prix, entre 2006 et 2007.

CA2007 en dh constant / CA2006 en dh constant = Q2007 * P2006/ Q2006 * P2006 = Q2007/ Q2006 * 100 = IQ2007/2006

3. Intérêts et méthodes pour établir des séries


a. Les indices élémentaires

Ils sont décrits comme des indicateurs qui permettent de mesurer l’évolution d’une grandeur
simple.

Ils sont représentés par la relation suivante :

It/t = valeur courante/valeur de base = at/a0 * 100


Exemple :

Nombre d’adhérents à un programme de sport durant l’année 2001 et 2002

2001 2002
Nombre d’adhérents 20000 25000

L’indice élémentaire du nombre d’adhérents est : I2002/2001 = (25000/20000) * 100 = 125 soit une
augmentation de 25 % du nombre d’adhérents.

b. Les indices synthétiques

Ce sont des indicateurs qui permettent de mesurer l’évolution d’un ensemble de grandeurs.

Exemple :
Une épicerie commercialise 3 biens : du lait (L), de la farine (F) et des bouteilles d’huile (H).

T0 T Δ du CA
Produits en Dh
Prix Qtés CA Px Qtés CA courant
L 5 20 100 4.5 25 112.5 12.5%
F 12 30 360 18 24 432 20%
H 9 40 360 11 36 396 10%
Total 820 940.5 14 .7%

Afin d’étudier l’évolution du chiffre d’affaires global de cette épicerie en termes réels, il faut
l’exprimer en dh constants. Il faut donc « corriger » le CA en dh courants, par un indice des prix.
Or, le recours à la moyenne arithmétique des trois indices de prix correspondants aux trois biens
n’est pas valable, du fait que ces trois biens n’entrent pas sous parties égales au niveau des
quantités vendues (dans la formation du CA global).

Le recours aux indices synthétiques à savoir l’indice de Laspeyres sera nécessaire.

 L’indice de Laspeyres :

C'est un indice qui permet de mesurer l'évolution d'un phénomène, souvent prix ou production, au
cours du temps.

Cet indice est celui utilisé en France par l'INSEE pour le calcul de l'inflation.

L’indice de Laspeyres est la moyenne arithmétique PONDEREE des indices élémentaires. Les
coefficients de pondération utilisés sont obtenus à partir du poids de chaque bien dans le CA de
l’année de base.

Prenons T0 comme année de base :

p¿
Lt ∕ t =∑ α i t ⋅ avec : α i t = Pit . Qit0/Pit0. Qit0
0 0
pi t
0
0

T0 T Pit / Pit0 αit0


Produits a*b b/a
Qtés Px CA Qtés Px CA a b
L 20 5 100 25 4.5 112.5 0.9 0.12 10.8 13.3

F 30 12 360 24 18 432 1.5 0.44 66 29.3

H 40 9 360 36 11 396 1.22 0.44 53.68 36.06

Total 820 940.5 1 130.48 78.66


Donc : Lt ∕ t = 1.3048 *100 = 130.48
0

Selon l’indice, le prix a augmenté de 30.48 %


Pour obtenir aussi : CAt/t0 en dh constant est égal à (940.5 / 130.48) x 100 = 720.80
En partant des résultats précédents, on pourra dire que la variation du CAt/t0 global est :

 14,695 %, en terme nominal (variation du CA en dirhams courants). ((940,5 – 820) /


820) x 100 = 14.7 %

 -12,097 % en terme réel (variation du CA dirhams constants). ((720,80 – 820) / 820) x


100 = - 12.1 %

 L’indice de Paasche :

L’indice de Paasche est la moyenne harmonique des indices élémentaires pondérés par les
coefficients budgétaires ∝ti de la date courante.

Il est défini par la formule suivante :

1
Pt / t =
0
∑α i t 0

p¿
pi t
0

En partant de l’exemple précédent :

Pt / t = 1/0.7866 = 1.2712 * 100 = 127.12


0

Selon l’indice, le prix a augmenté de 27.12 %

Pour obtenir aussi : CAt/t0 en dh constant est égal à (940.5 / 127.12) x 100 = 739.85
En partant des résultats précédents, on pourra dire que la variation du CAt/t0 global est :

 14,695 %, en terme nominal (variation du CA en dirhams courants). ((940,5 – 820) /


820) x 100 = 14.7 %

 -9.77 % en terme réel (variation du CA dirhams constants). ((739.85 – 820) / 820) x


100 = - 9.77 %

 L’indice de Fisher :

C’est la moyenne géométrique des indices de Laspeyres et de Paasche :

F t ∕ t =√ Pt / t × Lt ∕ t
0 0 0

De même pour l’exemple :

F t ∕ t =√1.2712 ×1.3048=1.287 * 100 = 128.7


0
Selon l’indice, le prix a augmenté de 28.7 %
Pour obtenir aussi : CAt/t0 en dh constant est égal à (940.5 / 128.7) x 100 = 730.76
En partant des résultats précédents, on pourra dire que la variation du CAt/t0 global est :

 14,695 %, en terme nominal (variation du CA en dirhams courants). ((940,5 – 820) /


820) x 100 = 14.7 %

 -12,097 % en terme réel (variation du CA dirhams constants). ((730.76– 820) / 820) x


100 = - 10.88 %

c. Transformation linéaire
La linéarisation par le logarithme a pour avantages :
1. La transformation de fonction non linéaire en fonction linéaire.
2. Transformer les coefficients de régression en coefficients d’élasticité.
3. Réduire l’effet des unités.
Pour illustrer cela, on prend les formes linéaires et non linéaires d’une fonction de
production de type Cobb-Douglass :
∝ β u
Q= A K L e avec : α et β ≥ 0

La transformation linéaire de cette fonction est :


q=a 0+ a1 k +a 2 l+u avec : 𝑞 = log(𝑄) ; 𝑘 = log(𝐾) ; 𝑙 = log(𝐿) ; 𝑎0 = log(𝐴) ; 𝑢 = log(𝑒u) ; 𝑎1 = α
𝑒𝑡 𝑎2 = β
La fonction ainsi transformée peut être estimée par la méthode des moindres carrés ordinaires
(MCO) du fait qu’elle est linéaire.

4. Correction des variations saisonnières


La correction des variations saisonnières permet d’éliminer l’effet de fluctuations
périodiques infra-annuelles dues au calendrier et aux saisons, de manière à faire ressortir les
évolutions les plus significatives de la série.
Exemple :
Une entreprise communique le montant de son chiffre d’affaires (en milliers d’euro) pour les années
de 1989 à 1992
Le modèle choisit ici est un modèle additif et la méthode utilisée pour la correction des variations
saisonnières est la méthode des moyennes mobiles.

Il va falloir d’abord calculer les coefficients saisonniers sur une période d’une année, autrement dit
on doit déterminer 12 coefficients, pour j = 1,.…,12

1
α j = ( X j + X 12+ j + X 24+ j+ X 36+ j )
4
On obtient les résultats suivants :
1 1 1
α 1= ( 1230+1590+1750+1840 )=1602.5, α 2= ( 1280+1640+1650+1790 ) =1590 ,… , α 12= ( 1550+ 1670+1
4 4 4
Il faut calculer ensuite la moyenne des coefficients saisonniers :

1 21000
α= ( 1602.5+1590+…+1817.5 )= =1750
12 12
'
On en déduit les CVS, grâce à la formule α j =α j−α  
' '
Par exemple : α 1=α 1−α =1602.5−1750=147.5 et α 12=α 12−α =1817.5−1750=67.5 

À partir de cela, on obtient la série corrigée des variations saisonnières :


'
Y 12 (i−1)+ j= X 12 (i−1 )+ j −α j
' '
Y 1= X 1−α 1=1230−(−147.5 )=1377.5 , … ,Y 2 =X 2−α 2=1280−(−160 )=1440

Les résultats précédents seront résumés dans le tableau suivant :

m/a 1989 1990 1991 1992 αj CVS 1989© 1990© 1991© 1992©
Janvier 1230 1590 1750 1840 1602.5 -147.5 1377.5 1737.5 1897.5 1987.5
Février 1280 1640 1650 1790 1590 -160 1440 1800 1810 1950
Mars 1400 1800 1800 2370 1842.5 92.5 1307.5 1707.5 1707.5 2277.5
Avril 1600 1990 1900 2360 1962.5 212.5 1387.5 1777.5 1687.5 2147.5
Mai 1450 1870 1950 2280 1887.5 137.5 1312.5 1732.5 1812.5 2142.5
Juin 1390 1910 1910 2510 1930 180 1210 1730 1730 2330
Juillet 1280 1670 1980 2320 1812.5 62.5 1217.5 1607.5 1917.5 2257.5
Août 930 1260 1410 1870 1367.5 -382.5 1312.5 1642.5 1792.5 2252.5
Septembre 1080 1430 1520 1820 1462.5 -287.5 1367.5 1717.5 1807.5 2107.5
Octobre 1400 1780 1920 2210 1827.5 77.5 1322.5 1702.5 1842.5 2132.5
Novembre 1500 1750 1900 2440 1897.5 147.5 1352.5 1602.5 1752.5 2292.5
Décembre 1550 1670 1780 2270 1817.5 67.5 1482.5 1602.5 1712.5 2202.5

II. TRAITEMENTS SUR LES SERIES EN COUPE TRANSVERSALE


1. Les séries en coupe transversale ou instantanée
a. Définition :

Les données Cross-section aussi appelées données en coupe instantanée sont des données
unidimensionnelles qui consistent d’un échantillon aléatoire (ensemble d’individus, firmes,
ménages) observé à un moment donné dans le temps.

Exemple :

Part du patrimoine détenue par les plus fortunés dans les pays riches en %

Pays Les 10 % les plus fortunés Le 1 % le plus fortuné détient


détiennent
Etats-Unis 79 42
Allemagne 60 24
Royaume-Uni 52 20
Canada 51 17
France 51 19
Espagne 46 16
Italie 43 12

Aux Etats-Unis, les 10 % les plus fortunés détiennent 79 % de l’ensemble du patrimoine des
ménages Américains en 2016, selon l’OCDE et le 1 % le plus fortuné, 42 %.

b. Caractéristiques :

- Le temps est fixé, ces données permettent donc une analyse statique exclusivement.
- On part de l’hypothèse que la coupe transversale est un échantillon aléatoire de la
population sous-jacente. Par exemple : Si on peut choisir au hasard 500 personnes parmi la
population active et obtenir des informations sur le salaire, l'éducation et l'expérience, on
aura un échantillon aléatoire de cette population. Cette stratégie d'échantillonnage est le
plus souvent abordée dans les cours d'introduction aux statistiques. Son utilisation simplifie
l'analyse des données transversales.
- Il existe cependant des circonstances où l’échantillonnage ne peut être respecté :
 En prenant un exemple : si on désire étudier les facteurs qui déterminent l’accumulation de
richesse dans une famille, il est possible de mener une enquête auprès d’un échantillon
aléatoire mais certaines familles refuseront de divulguer leur patrimoine. Or, si la probabilité
de refus est plus élevée pour les familles les plus riches, cet échantillon ne correspondra pas
un échantillon aléatoire et ne sera pas représentatif de la population.
 Lorsque l’échantillon est plus proche de la population ; C'est souvent le cas des unités
géographiques. Dans ces cas, un problème potentiel est que la taille de la population n'est
pas assez grande pour satisfaire l'hypothèse selon laquelle les observations sont tirées de
manière indépendante. Par exemple, on cherche à étudier le développement de nouvelles
activités commerciales dans différentes régions en fonction des niveaux de salaire, des prix
de l'énergie, des impôts sur les sociétés, des impôts fonciers, de la disponibilité des services,
de la qualité de la main-d'œuvre et d'autres caractéristiques régionales. Il est peu probable
que les activités commerciales opérant dans deux régions adjacentes soient indépendantes.

Les données en coupe transversale sont très souvent utilisées en sciences sociales, finances
publiques, organisation industrielle, économie spatiale, démographie, économie de la santé.

2. Traitement préalable sur les séries en coupe transversale


 Le risque de colinéarité doit être testé avec les données transversales. Les problèmes de
colinéarité surviennent lorsque deux variables sont corrélées. Cela signifie que les deux
variables prennent la même observation. Si les variables sont colinéaires, les résultats de
l'estimateur du modèle ne sont pas fiables car la contribution spécifique de chaque variable
ne peut être distinguée.
 Pour cependant savoir si les variables varient ensemble (dans le même sens ou non) on peut
cov ( x , y)
utiliser le coefficient de corrélation linéaire r tel que : r ( x , y )=
σx . σ y

Vous aimerez peut-être aussi