ARCHICTECTURE DEVOIR DE
GROUPE
DES RESEAUX
ANALYSE DES DONNEES FINANCIERES / BACHELORS 3 / CDP
1. INTRODUCTION
L'objectif de ce rapport est d'analyser les données financières des actions d'Apple (AAPL),
Microsoft (MSFT) et Amazon (AMZN) sur la période 2020-2024, téléchargées depuis Yahoo
Finance. Cette analyse couvre le nettoyage des données, l'exploration (EDA), les analyses
descriptives, diagnostiques, prédictives et prescriptives, ainsi que des visualisations et des
modèles statistiques pour formuler des recommandations d'investissement. Les outils
utilisent pandas , numpy , matplotlib , seaborn , plotly , scipy , statsmodels et sklearn .
2. PRÉPARATION DES DONNÉES
2.1 TELECHARGEMENT DES DONNEES
ANALYSE
Les actions Apple en janvier 2020 montrent une légère hausse des prix de clôture, de 72,77
$ à 73,40 $, accompagnée de variations modérées des volumes. Le volume a atteint son pic
le 3 janvier avec 146 millions de transactions, puis a diminué progressivement jusqu'à 108
millions le 7 janvier. Le prix le plus bas (70,87 $) a été enregistré le 6 janvier, et le plus haut
(73,70 $) le 8 janvier.
INTERPRETATION
Cette période reflète une croissance régulière des actions d'Apple, avec des ajustements du
marché en fonction des fluctuations des volumes. Cela démontre la confiance des
investisseurs tout en révélant un intérêt accru pour l'action lors des jours de volume élevé.
Ces tendances traduisent un marché sain et dynamique.
2.2 Types de Données
ANALYSE
Ces informations décrivent un DataFrame Pandas contenant 1257 entrées de données
boursières pour Apple (AAPL), couvrant la période du 2 janvier 2020 au 30 décembre 2024.
Les colonnes incluent :
1. Close, High, Low, Open (float64) : Ces colonnes contiennent les prix ajustés de
clôture, le plus haut, le plus bas et d'ouverture des actions.
2. Volume (int64) : Cette colonne capture le volume de transactions pour chaque jour,
mesuré en unités.
INTERPRETATION
Ces données riches et bien structurées offrent un aperçu des prix et volumes des actions
d'Apple sur une période de près de cinq ans. Elles peuvent être utilisées pour :
• Analyser les tendances historiques des prix et des volumes.
• Construire des modèles financiers prédictifs, comme des régressions ou des
projections de rendements.
• Examiner la volatilité des actions ou rechercher des corrélations entre volume et
variations de prix.
2.3 Gestion des Valeurs Manquantes
ANALYSE
Ces résultats indiquent qu’il n’y a aucune donnée manquante dans les colonnes "Close",
"High", "Low", "Open" et "Volume" pour les actions Apple (AAPL). Chaque valeur manquante
aurait été signalée par un chiffre supérieur à zéro dans la sortie fournie.
INTERPRETATION
Cela confirme que l’ensemble de données est complet et propre, ce qui est essentiel pour
garantir la fiabilité des analyses futures. Vous pouvez avancer en toute confiance avec des
visualisations, des modèles prédictifs ou d’autres analyses sans avoir besoin de gérer des
2.4 Transformation des Dates
ANALYSE
Les données extraites grâce à la méthode YF.download() contiennent les prix boursiers
d'Apple (AAPL) pour les cinq premiers jours de trading de janvier 2020, détaillés par les prix
d'ouverture, de clôture, le plus haut, le plus bas et le volume de transactions. Voici les
observations principales :
• Le prix de clôture commence à 72,7766 (2 janvier) et atteint 73,7063 (8 janvier),
indiquant une tendance légèrement haussière.
• Les volumes de transactions varient de manière significative, culminant à 146,32
millions (3 janvier) et étant les plus bas à 108,87 millions (7 janvier).
• La plus grande variation journalière des prix s'est produite le 8 janvier, avec un écart
de 73,70 à 71,94.
INTERPRETATION
Ces données montrent une performance boursière modérément positive pour Apple au début
de 2020. Les volumes élevés indiquent un intérêt actif des investisseurs, tandis que la
variation des prix reste contenue, reflétant un équilibre entre demande et offre. Ces
tendances suggèrent une certaine stabilité malgré les fluctuations du volume.
3. ANALYSE EXPLORATOIRE DES DONNÉES
3.1 Statistiques Descriptives
ANALYSE
Les statistiques descriptives des données boursières d'Apple (AAPL) sur 1257 jours de
trading montrent les éléments suivants :
1. Tendance centrale :
o Les prix moyens sont : 152,10 $ (Close), 153,63 $ (High), 150,39 $ (Low), et
151,94 $ (Open).
o Le volume moyen est d'environ 90,61 millions.
2. Dispersion (Écarts-types) :
o Les prix présentent une dispersion modérée, avec des écarts-types proches
de 42 $, ce qui montre des variations régulières sur la période.
3. Plage des données :
o Les prix vont d’un minimum de 54,45 $ (Close) à un maximum de 259,81 $
(High).
o Les volumes varient fortement, de 23,23 millions à 426,51 millions, révélant
des journées de très forte activité boursière.
4. Quartiles :
o Les quartiles (25 %, 50 %, 75 %) indiquent des niveaux clés pour la répartition
des prix, par exemple le prix médian de clôture est 150,73 $, plus proche de
la moyenne.
INTERPRETATION
Ces données montrent une croissance stable des actions Apple, marquée par une forte
volatilité à certains moments. Les volumes élevés, notamment leur maximum impressionnant
de 426,51 millions, reflètent des jours d'activité exceptionnelle qui mériteraient une analyse
approfondie pour identifier des catalyseurs spécifiques (annonces majeures, résultats
financiers, etc.). Cette stabilité globale est un signe de confiance persistante des
investisseurs dans la valeur des actions d'Apple.
3.2 Détection des Valeurs Aberrantes
ANALYSE
1. Distribution :
o La boîte représente la plage interquartile (IQR), où se trouve la majorité des
données des prix des actions.
o La ligne à l'intérieur de la boîte indique la médiane, qui est le point central de
la distribution.
2. Étendue des données :
o Les moustaches montrent l'étendue des données qui sont dans une plage
acceptable, c'est-à-dire 1,5 fois l'IQR en dessous de Q1 (1er quartile) ou au-
dessus de Q3 (3e quartile).
o Tout point en dehors de cette plage est considéré comme un outlier (valeur
aberrante).
3. Outliers :
o Les données identifiées comme des outliers sont représentées par des points
situés en dehors des moustaches. Ils peuvent indiquer des anomalies, des
fluctuations du marché ou des événements spécifiques ayant influencé le prix
des actions.
INTERPRETATION
1. Les outliers peuvent être pertinents pour analyser des événements exceptionnels liés
au cours des actions d'Apple, comme des annonces financières importantes ou des
changements soudains dans l'économie.
2. Cette visualisation est utile pour comprendre la stabilité ou la volatilité du prix des
actions. Si les moustaches sont longues ou si les outliers sont nombreux, cela
pourrait refléter une forte variabilité des prix.
3. Pour un investisseur, détecter ces outliers peut être une opportunité d'explorer les
raisons sous-jacentes et de mieux prévoir les tendances futures.
3.3 Tendances Temporelles
ANALYSE
1. Tendance générale :
o Le graphique montre une tendance haussière des prix de l'action Apple
(AAPL) de 2018 à 2025, bien que la courbe soit ponctuée de fluctuations.
2. Fluctuations :
o Certaines baisses ou ralentissements visibles pourraient correspondre à des
périodes d'incertitude économique, des résultats financiers moins
performants, ou des événements particuliers affectant l'entreprise ou le
marché.
3. Niveau des prix :
o Le prix ajusté des actions varie entre 0 $ et 250 $, ce qui indique une
croissance significative au fil des ans.
INTERPRETATION
1. Performance à long terme :
o L'évolution globale reflète la solidité de l'entreprise Apple et sa capacité à
générer de la valeur pour les actionnaires sur une longue période.
2. Moments clés :
o Les fluctuations suggèrent qu'il y a eu des événements ou annonces
marquants ayant influencé le prix des actions. Ces points méritent une
exploration approfondie pour comprendre ce qui les a provoqués.
3. Opportunités d'investissement :
o Pour les investisseurs, ces données montrent à la fois des opportunités
potentielles (en profitant des hausses) et des moments où le risque pourrait
être plus élevé (pendant les baisses ou les fluctuations).
3.4 Corrélations entre Variables
ANALYSE
1. Corrélations fortes (1.0) :
o Les prix de clôture, ouverture, le plus haut et le plus bas d'AAPL sont
parfaitement corrélés entre eux (corrélation = 1.0). Cela est attendu, car ces
métriques sont étroitement liées dans le cadre d'une journée de bourse.
2. Corrélation négative avec le volume (-0,64 à -0,65) :
oUne corrélation négative modérée entre les prix (ouverture, clôture, etc.) et le
volume signifie que lorsque le volume de transactions est élevé, les prix ont
tendance à baisser légèrement, et vice versa.
3. Coloration :
o Les couleurs rouges vives indiquent des corrélations positives fortes.
o Les nuances de bleu illustrent des corrélations négatives, dans ce cas, entre
le volume et les prix.
INTERPRETATION
1. Tendances des prix :
o Une forte corrélation entre les prix (ouverture, clôture, etc.) indique qu'ils
évoluent généralement ensemble, montrant une certaine stabilité dans le
comportement des prix d'Apple.
2. Volume comme indicateur :
o La corrélation négative avec le volume pourrait suggérer des jours d'activité
intense (volumes élevés) où les investisseurs vendent davantage, exerçant
une pression à la baisse sur les prix.
3. Utilité pour les investisseurs :
o Comprendre ces corrélations peut aider les investisseurs à élaborer des
stratégies basées sur les variations du volume ou des prix.
3.5 Segmentation des Données
ANALYSE
1. Tendance des prix (ouverture, clôture, le plus haut, le plus bas) :
o Croissance constante : Les prix affichent une progression impressionnante
entre 2020 (92,83 $ en clôture) et 2024 (206,37 $ en clôture).
o Le prix le plus élevé passe de 94,12 $ en 2020 à 208,06 $ en 2024, montrant
une trajectoire stable de hausse des actions.
2. Volume des transactions :
o On observe une diminution constante du volume des transactions au fil des
années :
▪ 2020 : 157,56 millions
▪ 2021 : 90,52 millions
▪ 2022 : 87,91 millions
▪ 2023 : 59,21 millions
o En 2024, le volume semble incomplet ou erroné (20), ce qui pourrait
nécessiter une clarification.
INTERPRETATION
1. Performance globale :
o Apple affiche une forte croissance des prix des actions, ce qui peut refléter
des innovations technologiques, une expansion du marché ou une
amélioration de ses résultats financiers.
2. Volume décroissant :
o La réduction du volume des transactions pourrait indiquer une baisse
d'activité des investisseurs, peut-être en raison de la stabilité croissante des
actions.
3. Potentiel d'investissement :
o Une telle trajectoire est souvent perçue positivement par les investisseurs à
long terme, mais la réduction du volume peut également signaler une
saturation du marché.
3.4 Distribution des Rendements
ANALYSE
1. Distribution des rendements :
o L'axe des x représente la plage des rendements, allant approximativement de
-0,10 à 0,10.
o L'axe des y montre la fréquence des occurrences, qui varie entre 0 et 175.
o La courbe semble en forme de cloche (distribution normale), ce qui signifie
que la majorité des rendements sont concentrés autour de zéro.
2. Fréquences élevées autour de zéro :
o Les rendements les plus fréquents sont proches de zéro, ce qui peut indiquer
une faible volatilité ou des performances moyennes régulières.
3. Occurrences faibles aux extrémités :
o Les rendements extrêmes, positifs ou négatifs, sont rares, ce qui peut refléter
une moindre probabilité d'événements exceptionnels.
INTERPRETATION
1. Stabilité des rendements :
o Une distribution en forme de cloche suggère que la majorité des rendements
sont prévisibles et suivent une tendance stable. Cela pourrait être rassurant
pour les investisseurs.
2. Risque réduit des extrêmes :
o La faible fréquence des rendements très élevés ou très bas peut indiquer un
risque limité, mais aussi un potentiel réduit pour des gains extraordinaires.
3. Utilité pour les investisseurs :
o Une telle analyse aide à comprendre la performance historique et le risque
associé aux investissements, permettant aux investisseurs d'adopter des
stratégies en conséquence.
o
4. RÉSULTATS QUANTITATIFS
4.1 Volatilité des Actifs
INTERPRETATION
1. Stabilité des rendements :
o Une volatilité faible reflète une faible fluctuation des rendements autour de
leur moyenne. Les prix des actions d'Apple semblent évoluer dans une plage
étroite, offrant une certaine stabilité.
2. Risque réduit :
o Pour les investisseurs, cela peut être interprété comme un signe d'un risque
modéré, car les changements imprévisibles sont moins fréquents.
3. Profil d'investissement :
o Des actifs avec une faible volatilité sont souvent attractifs pour les
investisseurs prudents ou ceux qui cherchent à diversifier leur portefeuille
avec des actifs moins risqués.
4.2 Performance des Actifs
ANALYSE
1. Tendance générale :
o Une trajectoire ascendante prédomine, montrant une augmentation régulière
des rendements cumulés, passant de 1.0 (2020) à environ 3.5 (2025).
2. Fluctuations :
o Des fluctuations notables apparaissent tout au long de cette période, avec
quelques creux, mais cela n'interrompt pas la tendance haussière globale.
3. Périodes clés :
o Certains points d'inflexion peuvent correspondre à des événements ou des
conditions économiques spécifiques qui ont influencé les rendements
positivement ou négativement.
INTERPRETATION
1. Performance positive à long terme :
o Le graphique reflète une performance solide, suggérant que l'investissement
a généré des rendements significatifs à long terme malgré les variations à
court terme.
2. Volatilité gérable :
o La présence de fluctuations indique une volatilité modérée, mais elle semble
contenue dans un cadre qui reste favorable pour les investisseurs.
3. Application pour la prise de décision :
o Ce type d'information peut guider les investisseurs dans leurs stratégies, en
soulignant l'importance de maintenir un investissement à long terme pour
profiter de la croissance cumulative.
4.4 Analyse en Composantes Principales
ANALYSE
1. Dimensions réduites :
o Les deux axes, PC1 et PC2, représentent les premières composantes
principales, qui expliquent la majorité de la variance dans les données
d'origine.
o PC1 varie entre -200 et 200, et PC2 entre -10 et 10.
2. Répartition des points :
o La densité de points est plus élevée autour du centre, près de l'origine. Cela
indique que la plupart des données sont concentrées dans une région limitée,
tandis que quelques points se dispersent aux extrémités.
3. Homogénéité :
o Les points semblent formés d'un noyau central compact et de quelques points
plus éloignés, ce qui pourrait correspondre à des anomalies ou des valeurs
moins fréquentes.
INTERPRETATION
1. Structure des données :
o Ce diagramme reflète une réduction efficace de la dimensionnalité, tout en
conservant une bonne séparation entre les groupes potentiels, si ceux-ci
existent.
2. Applications pratiques :
o L'analyse PCA est souvent utilisée pour visualiser la structure cachée des
données, identifier des clusters, ou simplifier des modèles d'apprentissage
automatique.
3. Données centralisées :
o Une densité élevée au centre pourrait indiquer que beaucoup de variables
dans les données initiales ont des valeurs similaires ou corrélées.
4.5 Régression Linéaire Simple
ANALYSE
1. Coefficient : [1.00010195]
o Ce coefficient indique la pente de la droite d'ajustement. Une valeur proche de
1 suggère une relation quasiment proportionnelle entre la variable
indépendante (X) et la variable dépendante (Y). En d'autres termes, lorsque X
augmente de 1 unité, Y augmente de presque 1,0001 unité.
2. Intercept : [0.14136994]
o L'intercept représente la valeur de Y lorsque X est égal à 0. Dans ce modèle,
la valeur de Y serait d'environ 0,141 lorsqu'il n'y a aucune contribution de X.
INTERPRETATION
1. Relation forte et proportionnelle :
o La relation entre les variables X et Y semble linéaire et proportionnelle, ce qui
peut refléter une bonne adéquation des données au modèle.
2. Prédictions faciles :
o Avec un coefficient aussi simple, il est facile de prédire les valeurs futures de
Y en fonction de X : $$Y = 1,0001 \cdot X + 0,141$$.
3. Applications pratiques :
o Ce modèle pourrait être utilisé pour des prévisions, comme les ventes en
fonction d'un budget marketing ou une autre relation mesurable.
4.6 Régression Linéaire Multiple
ANALYSE
1. Coefficients négatifs et positifs :
o Le premier coefficient, -6.12607150e-01, indique une relation négative entre
cette variable indépendante spécifique et la variable dépendante. Une
augmentation de cette variable entraînerait une diminution de la variable cible.
o Les autres coefficients, 8.17312927e-01, 7.94872503e-01, et -9.02399477e-
10, sont positifs (le dernier étant très proche de zéro). Cela suggère que ces
variables ont un impact positif (mais très faible pour le dernier).
2. Magnitude des coefficients :
o La magnitude des coefficients reflète l'importance relative de chaque variable
sur la variable dépendante. Par exemple, le coefficient 8.17312927e-01
montre une influence plus forte que 7.94872503e-01.
INTERPRETATION
1. Contribution des variables :
o Ces coefficients indiquent comment chaque variable indépendante influence
la sortie du modèle, tout en prenant en compte les autres variables.
2. Application pratique :
o Dans un modèle de régression, ces coefficients peuvent être utilisés pour
prédire des valeurs futures ou analyser les relations entre les variables.
3. Petite valeur du dernier coefficient :
o Le coefficient très proche de zéro, -9.02399477e-10, pourrait indiquer que
cette variable a une influence négligeable dans le modèle.
4.7 Évaluation du Modèle
ANALYSE
1. R² (Coefficient de détermination) : 0.99947
o Cette valeur extrêmement élevée proche de 1 indique que le modèle explique
presque parfaitement la variance des données. Cela reflète une excellente
adéquation entre les prédictions du modèle et les données réelles.
2. RMSE (Root Mean Squared Error) : 0.96481
o L'erreur quadratique moyenne est une mesure de la dispersion des erreurs de
prédiction. Une valeur faible comme celle-ci montre que les écarts entre les
prédictions et les valeurs réelles sont très faibles en moyenne.
3. MAE (Mean Absolute Error) : 0.72537
o L'erreur absolue moyenne est encore une autre mesure des écarts de
prédiction. Une valeur de 0,725 est également faible, indiquant une précision
élevée dans les prédictions.
INTERPRETATION
1. Précision élevée du modèle :
o Les trois métriques combinées montrent que le modèle est très performant
dans la prédiction de valeurs, avec une erreur minimale.
2. Utilisation pratique :
o Un modèle avec de telles métriques peut être utilisé pour effectuer des
prédictions fiables dans des contextes où la précision est essentielle, comme
les analyses financières ou les prévisions opérationnelles.
3. Limites potentielles :
o Bien que les métriques soient impressionnantes, il est toujours important de
vérifier qu'il n'y a pas de surajustement (overfitting), surtout si le modèle est
testé uniquement sur un jeu de données limité.
4.8 Utilisation des Résultats
Les coefficients jouent un rôle clé en montrant la relation entre chaque variable
indépendante et le prix de clôture. Une valeur élevée, positive ou négative, indique
une influence significative de la variable sur le prix de clôture. Cela permet de
déterminer quels facteurs méritent une attention particulière dans les analyses ou
stratégies.
Cela pourrait aussi orienter des décisions pour maximiser le rendement ou minimiser
les risques. Par exemple, si une variable a un coefficient négatif important, cela
pourrait signaler un levier à ajuster ou une tendance à surveiller.
5. RECOMMANDATION
Analyse des tendances :
1. MSFT (rouge) : Microsoft affiche la plus forte croissance sur la période, passant
d’environ 100 à plus de 400. Malgré des fluctuations, la tendance est clairement
haussière, avec une forte accélération après 2023.
2. AAPL (bleu) et AMZN (vert) : Les deux suivent une trajectoire similaire, avec une
croissance plus modeste (de 100 à environ 150-200). AAPL semble légèrement plus
stable qu’AMZN, qui montre plus de volatilité, notamment en 2022-2023.
Recommandations prescriptives :
Investissement dans MSFT :
o Action : Acheter ou conserver les actions MSFT.
o Raison : La forte tendance haussière indique un momentum solide. Si vous
n’êtes pas encore investi, envisagez d’entrer sur un repli (par exemple, lors
d’une correction vers 350-380). Si vous détenez déjà des actions, conservez-
les pour profiter de la croissance continue.
o Risque : Surveillez les corrections potentielles dues à une surévaluation, car
une croissance aussi rapide peut attirer des prises de bénéfices.
Approche prudente avec AAPL :
o Action : Accumuler progressivement lors des creux.
o Raison : AAPL montre une croissance stable mais moins spectaculaire que
MSFT. C’est une valeur refuge avec moins de volatilité, idéale pour un
portefeuille diversifié. Achetez lors des replis (par exemple, vers 150-160)
pour minimiser le risque.
o Risque : Une croissance plus lente pourrait indiquer une stagnation si le
marché global ralentit.
Stratégie défensive pour AMZN :
o Action : Attendre une stabilisation avant d’acheter.
o Raison : AMZN est plus volatile, avec des fluctuations marquées en 2022-
2023. Bien que la tendance soit haussière à long terme, attendez une
confirmation de support (par exemple, autour de 150) pour éviter d’acheter au
sommet d’une vague.
o Risque : La volatilité peut entraîner des pertes à court terme si le marché
devient baissier.
Stratégie globale :
• Diversification : Si vous êtes un investisseur prudent, répartissez vos
investissements entre MSFT (croissance), AAPL (stabilité) et AMZN (potentiel de
rebond après volatilité).
• Horizon temporel : Si vous investissez à long terme (5+ ans), MSFT semble le
meilleur choix. Pour un horizon plus court, AAPL est plus sûr.
• Surveillance : Suivez les actualités macroéconomiques (taux d’intérêt, inflation) et
sectorielles (technologie, IA) qui pourraient influencer ces actions.
7. Conclusion et perspectives
Cette analyse a révélé que MSFT est l'actif le plus performant avec une modérée,
tandis qu'AMZN présente un risque plus élevé. Les modèles de régression montrent
des relations exploitables entre les actifs. À l'avenir, il serait pertinent d'intégrer des
données macroéconomiques et d'explorer des modèles de machine learning plus des
complexes comme les réseaux de neurones pour améliorer les prédictions.