SlideShare une entreprise Scribd logo
@Madgicweb
#LaDuckConf
Initier un Datalab :
rien à voir avec ce
que j’imaginais !
La Duck Conf – 29/01
#LaDuckConf
@Madgicweb
#LaDuckConf 2
Frédéric
@Madgicweb
Responsable du département
ARCHITECTURE & DONNEES
@mutuelleMNT @Groupe_VYV
D’ENTREPRISED’ENTREPRISE
@Madgicweb
#LaDuckConf 3
Intelligence artificielle
BIG DATA
DataLake
@Madgicweb
#LaDuckConf 4
Des
indicateurs
« Rétroviseur »
au
« prédictif »
Ordonnancé (Mensuel / Hebdomadaire)
Extract-Transform-Load
Intelligence Biologique
Temps réel (Indicateur / Calcul)
Extract-Load-Transform
Intelligence Artificielle
@Madgicweb
#LaDuckConf
#OnPremise
Réponses à
l’Appel
d’offre
@Madgicweb
#LaDuckConf 6
Sponsoring
#DataLake
#Ingestion
#Cluster
#IA #DataViz
#API
#Streaming
???
MOI SPONSOR
@Madgicweb
#LaDuckConf 7
Le maillon
faible
Pourquoi ? Quoi ?
Quel but ?
Avec qui ?
Quelles données ?
Quelle valeur ?
En phase avec la
stratégie ?
Le ROI ?
…
Comment ?
@Madgicweb
#LaDuckConf 8
Back to basic
Des bases à
maitriser !
MACHINE
LEARNING
(Apprentissage)
DATA
GOUVERNANCE
Data Mining
(Corrélation)
Data Analysis
(Analyse)
Data Analyitics
(Collecte)
BIG DATA
(Passage à l’échelle)
DATA SCIENCE
@Madgicweb
#LaDuckConf 9
C’est parti !!!
Ihssane
RSA
Anne-Marie
Décisionnel
Wiame
Data Scientiste
Brieuc
Data Scientist
Patrice
Décisionnel
Philippe
RDE
DATALAB
…
@Madgicweb
#LaDuckConf 10
Définir les
fondamentaux
du Datalab
Former :
Se familiariser avec les outils de « Data
Science » proposés par la communauté
Opensource. Explorer les algorithmes. Coder.
Expérimenter :
Collecter, analyser et estimer l’effort de
traitement des données de l’entreprise (Accès,
qualité, utilité…). Evaluer leurs potentiels.
Valoriser :
Communiquer régulièrement sur la valeur
apportée par nos travaux et nos initiatives.
Développer :
Fonder une communauté pluridisciplinaire
autour de cas concrets estampillés « Data
Driven ».
1
Quel but ?
Quoi ?
Avec qui ?
Quelle valeur ?
@Madgicweb
#LaDuckConf 11
Identifier des
cas d’usage
stratégiques
Offres
MNT
Recommandation Attrition Fraude
2
@Madgicweb
#LaDuckConf 12
Obtenir
l’outillage
minimum
nécessaire
256 GO RAM
1 To Disque
32 vCPU
R Studio
Jupyter
Spark
CSV
Connecteur BDD
3
@Madgicweb
#LaDuckConf 13
Le grand
principe
GO
Sources
Big Matrice
Algorithme
Machine learning
Matrice de normalité et
détection d’atypisme
Local Outlier Factor
(Unspervised /
Dimensionality Reduction)
Variationnal Auto-Encoder
(Supervised / Regression)
Isolation Forest
(Supervised /Classification)
Spectral Ranking Anomaly
(Unsupervised / Clusturing)
@Madgicweb
#LaDuckConf 14
Premières
difficultés
• Accessibilité des données
(BASES PROGICIEL, DÉMATÉRIALISATION, RÉGLEMENTATION, …)
• Qualité des données
(GARDAGE IN – GARBAGE OUT)
• Véracité de la donnée
(NON MISE À JOUR, SYSTÈME AUTORITAIRE)
• Historiser les changements des modèles de donnée
(SAVOIR FAIRE UN LIEN D’UNE DONNÉE SUR PLUSIEURS ANNÉES D’HISTORIQUE)
• Disponibilité des intervenants
(LE DATALAB N’EST PAS UN PROJET MAIS UNE EXPÉRIMENTATION)
• Consommer des « Data Set » de plus en plus volumineux
(NOTRE SIMPLE SERVEUR N’EST PAS PÉRENNE)
@Madgicweb
#LaDuckConf 15
Premiers
échecs
enseignements
Recommandation
Attrition
Fraude
Choix des algorithmes
Qualité de la donnée
L’intelligence artificielle
ne fait pas tout
@Madgicweb
#LaDuckConf 16
• Identifier les données de chaque système applicatif.
• Corréler une même donnée présente dans plusieurs
systèmes applicatifs.
• Analyser les traitements intra-système applicatif afin
d'estimer la fraîcheur de la donnée et l’autorité du
système applicatif sur cette donnée. Lier les données
brutes aux informations générées.
• Estampiller les données (métadonnées) afin de cadrer
leurs utilisations (Ex : RGPD).
• Déterminer les règles d’accès suivant l’appelant et le
traitement.
S’appuyer
sur la
gouvernance
de donnée
Initiative 1
@Madgicweb
#LaDuckConf 17
Se focaliser
sur un seul
sujet :
LA FRAUDE
S’appuyer sur les règles de
gestion existantes
Augmenter les performances à
l’aide d’intelligence
Artificielle
Interpréter les résultats,
adapter les processus
d’investigation et améliorer le
dispositif global
1
2
3
>
>
>
Initiative 2
@Madgicweb
#LaDuckConf 18
Bilan
Former :
Lancement de la Datalab Academy et
formation des équipes aux fondamentaux de la
« Data Science ».
Expérimenter :
Identification des sources utiles, application
d’une gouvernance de la donnée. Création
d’algorithmes d’extraction, de raffinage et de
traitement de la donnée.
Valoriser :
L’outil facilite l’identification d’atypisme part la
cellule de fraude. Le taux de détection, de
comportements abusifs avérés, augmente.
Développer :
Collaboration forte avec les métiers. (Itératif)
Sensibilisation au travers de présentations.
Quel but ?
Quoi ?
Avec qui ?
Quelle valeur ?
@Madgicweb
#LaDuckConf 19
Timeline
Juin Juillet Août Septembre Octobre Novembre Décembre Janvier
< Sensibilisation au BigData
Equipe Décisionnel motivée
COMEX
Approche
#DALAKE
(Data-Platform)
Appel d’offre BigData
Projet de gouvernance de
donnée débuté
COMEX
Approche
#DATALAB
Lancement
du
DATALAB
Identification
des besoins
métiers
Livraison
du serveur
Extraction et raffinage
des données identifiées
pour les cas d’usage
POC Churn
V2
Etude d’algorithme
de Data-Science
&
Datalab Academy
Focaliser sur
la Fraude
Premier
succès.
Présentation
COMEXArrêts
Lancement de la
Data-Platform
DIVE
Gouvernance de donnée
Session
spécifique
@Madgicweb
#LaDuckConf 20
Création de la
Data
Platform
Restitution
DataMart Services
Processing Jobs
Datalake Services
Extraction
Sources
Gouvernance
DataLab
HDFS
DIVE*
* Données et indicateurs de la
vie de l’entreprise
Dictionnaire
des données
?
@Madgicweb
#LaDuckConf 21
Une approche
Data-Centric
malgré nous
Data is the center of the
universe;
applications are
ephemeral.
Réétudier la conception :
• Formaliser la structure d’un objet métier (création d’un modèle unique
partagé VERSUS un modèle spécifique à chaque système applicatif).
• Identifier chaque fonctionnalité et le système applicatif en charge du
traitement de cette règle métier.
Assurer l’intégrité :
• Gouverner des sources de données faisant autorités sur
l’information afin d’établir une source unique de vérité.
Augmenter sa part de responsabilité :
• Sécuriser l’accès à la donnée.
• Être en capacité de se justifier.
Adapter ses interfaces de restitution :
• Donner l'accès à la donnée sous plusieurs formats et méthodes (Pull,
Push, Evènementiel, Extraction par fichier)
http://datacentricmanifesto.org/
@Madgicweb
#LaDuckConf 22
Take Away
Si je pouvais conseiller le
Frédéric que j’étais !
• La plateforme n’est pas la priorité (Mais sans, ça va être compliqué)
• Fait le avec le métier
• Identifie rapidement la matière première dont tu disposes
et sa complexité de raffinage en t’appuyant sur la
gouvernance de la donnée
• Focalise-toi sur un seul sujet afin d’éviter de transformer
tes « data-set » en « data-swamp »
• Ne t’attends pas à un miracle, la data-science c’est pas
magique
• Utilise des méthodes pragmatique car par définition le
« Datalab » expérimente et se trompe@Madgicweb

Contenu connexe

PPTX
Databricks Fundamentals
PPTX
Apache Kafka with Spark Streaming: Real-time Analytics Redefined
PDF
Deploying Flink on Kubernetes - David Anderson
PDF
MATS stack (MLFlow, Airflow, Tensorflow, Spark) for Cross-system Orchestratio...
PPTX
SingleStore & Kafka: Better Together to Power Modern Real-Time Data Architect...
PPTX
Architecting a datalake
PDF
Etl overview training
PPTX
Data Engineering and the Data Science Lifecycle
Databricks Fundamentals
Apache Kafka with Spark Streaming: Real-time Analytics Redefined
Deploying Flink on Kubernetes - David Anderson
MATS stack (MLFlow, Airflow, Tensorflow, Spark) for Cross-system Orchestratio...
SingleStore & Kafka: Better Together to Power Modern Real-Time Data Architect...
Architecting a datalake
Etl overview training
Data Engineering and the Data Science Lifecycle

Tendances (20)

PPTX
Flexible and Real-Time Stream Processing with Apache Flink
PPT
Cloud Computing presentation
PPTX
IBM BP Session - Multiple CLoud Paks and Cloud Paks Foundational Services.pptx
PPTX
How Pulsar Enables Netdata to Offer Unlimited Infrastructure Monitoring for F...
PDF
Leveraging Apache Spark for Scalable Data Prep and Inference in Deep Learning
PDF
Making Data Timelier and More Reliable with Lakehouse Technology
PDF
Building Dynamic Pipelines in Azure Data Factory (SQLSaturday Oslo)
PDF
DevOps Live Meetup- NetDevOps session with Jay Shah (IEEE Published Paper)
PPTX
Data ops in practice
PPTX
Feature store: Solving anti-patterns in ML-systems
PPTX
Whoops, The Numbers Are Wrong! Scaling Data Quality @ Netflix
PDF
Data and Analytics at Holland & Barrett: Building a '3-Michelin-star' Data Pl...
PPTX
[DSC Europe 22] Overview of the Databricks Platform - Petar Zecevic
PPTX
Les bonnes pratiques en informatique - Référentiel ITIL
PPT
Masakari project onboarding
PPTX
Intro to Data Vault 2.0 on Snowflake
PDF
The delta architecture
PDF
DI&A Slides: Data Lake vs. Data Warehouse
PDF
Rakuten - Recommendation Platform
PPTX
Google Cloud Composer
Flexible and Real-Time Stream Processing with Apache Flink
Cloud Computing presentation
IBM BP Session - Multiple CLoud Paks and Cloud Paks Foundational Services.pptx
How Pulsar Enables Netdata to Offer Unlimited Infrastructure Monitoring for F...
Leveraging Apache Spark for Scalable Data Prep and Inference in Deep Learning
Making Data Timelier and More Reliable with Lakehouse Technology
Building Dynamic Pipelines in Azure Data Factory (SQLSaturday Oslo)
DevOps Live Meetup- NetDevOps session with Jay Shah (IEEE Published Paper)
Data ops in practice
Feature store: Solving anti-patterns in ML-systems
Whoops, The Numbers Are Wrong! Scaling Data Quality @ Netflix
Data and Analytics at Holland & Barrett: Building a '3-Michelin-star' Data Pl...
[DSC Europe 22] Overview of the Databricks Platform - Petar Zecevic
Les bonnes pratiques en informatique - Référentiel ITIL
Masakari project onboarding
Intro to Data Vault 2.0 on Snowflake
The delta architecture
DI&A Slides: Data Lake vs. Data Warehouse
Rakuten - Recommendation Platform
Google Cloud Composer
Publicité

Similaire à La Duck Conf - Initier un Datalab : rien à voir avec ce que j'imaginais ! (13)

PPTX
La datascience comme outil de valorisation de la donnée
PDF
Data Lake
PPSX
Une offre de formation en mouvement.
PDF
Machine Learning
PDF
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
PDF
Matinale - Levez la malédiction du passage de l'IA en production
PDF
IA C'EST MON DADA : Conference introduction machine learning et IA
PDF
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)
PPTX
02 big data definition
PPTX
02 big data definition
PDF
Big Data by Soft Computing - Lille
PDF
How AI metyourcomex
PDF
ebiznext - Datalab sur mesure
La datascience comme outil de valorisation de la donnée
Data Lake
Une offre de formation en mouvement.
Machine Learning
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Matinale - Levez la malédiction du passage de l'IA en production
IA C'EST MON DADA : Conference introduction machine learning et IA
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)
02 big data definition
02 big data definition
Big Data by Soft Computing - Lille
How AI metyourcomex
ebiznext - Datalab sur mesure
Publicité

Plus de OCTO Technology (20)

PDF
Comptoir OCTO - Agents IA : Tout ce qu'il faut savoir.
PDF
Comment l’IA générative peut-elle moderniser efficacement vos SI Brownfield ?
PPTX
La Grosse Conf - IA générative et mésinformation comprendre les mécanisme...
PPTX
La Grosse Conf - Data et Humanité, un bilan mitigé - Frédéric Duvivier
PPTX
La Grosse Conf - LLMOps, on s'y met tout de suite ? - Ali El Moussawi
PPTX
La Grosse Conf - Déployer des modèles d'IA à l'edge : live coding et bonne...
PDF
Le Comptoir OCTO - Transformer son organisation sans peur et sans douleur
PDF
Duck Conf 2025 - Déjouer les pièges de Conway dans l'agilité à l'échelle
PDF
Duck Conf 2025 - L’architecture continue par la pratique
PDF
Duck Conf 2025 - Des millisecondes contre des millions d'euros
PPTX
Duck Conf 2025 - Du chaos au flow : faut-il miser sur la DevEx ?
PDF
Duck Conf 2025 - Les pièges des plateformes : apprenez à les reconnaitre et à...
PDF
Duck Conf 2025 - Le micro-frontend décomplexé : les dessous d’une migration i...
PDF
Duck Conf 2025 - Tests Pragmatiques : Comment j'ai (presque) arrêté de faire...
PDF
Duck Conf 2025 - "Modern Software Engineering & Architecture" : Les Tech Tren...
PPTX
La Grosse Conf 2025 - Baptiste Courbe - Model Platform : industrialiser et go...
PPTX
La Grosse Conf 2025 - Jean-Baptiste Larraufie - 30% plus rapide : notre recet...
PPTX
La Grosse Conf 2025 - Yannick Drant - Prototyper l’innovation : framework et ...
PPTX
La Grosse Conf 2025 - Karim Sayadi - Construire une data plateforme : entre m...
PPTX
La Grosse Conf 2025 - Laure Constantinesco - Mettez de l’UX dans votre IA
Comptoir OCTO - Agents IA : Tout ce qu'il faut savoir.
Comment l’IA générative peut-elle moderniser efficacement vos SI Brownfield ?
La Grosse Conf - IA générative et mésinformation comprendre les mécanisme...
La Grosse Conf - Data et Humanité, un bilan mitigé - Frédéric Duvivier
La Grosse Conf - LLMOps, on s'y met tout de suite ? - Ali El Moussawi
La Grosse Conf - Déployer des modèles d'IA à l'edge : live coding et bonne...
Le Comptoir OCTO - Transformer son organisation sans peur et sans douleur
Duck Conf 2025 - Déjouer les pièges de Conway dans l'agilité à l'échelle
Duck Conf 2025 - L’architecture continue par la pratique
Duck Conf 2025 - Des millisecondes contre des millions d'euros
Duck Conf 2025 - Du chaos au flow : faut-il miser sur la DevEx ?
Duck Conf 2025 - Les pièges des plateformes : apprenez à les reconnaitre et à...
Duck Conf 2025 - Le micro-frontend décomplexé : les dessous d’une migration i...
Duck Conf 2025 - Tests Pragmatiques : Comment j'ai (presque) arrêté de faire...
Duck Conf 2025 - "Modern Software Engineering & Architecture" : Les Tech Tren...
La Grosse Conf 2025 - Baptiste Courbe - Model Platform : industrialiser et go...
La Grosse Conf 2025 - Jean-Baptiste Larraufie - 30% plus rapide : notre recet...
La Grosse Conf 2025 - Yannick Drant - Prototyper l’innovation : framework et ...
La Grosse Conf 2025 - Karim Sayadi - Construire une data plateforme : entre m...
La Grosse Conf 2025 - Laure Constantinesco - Mettez de l’UX dans votre IA

Dernier (7)

PDF
Tendances tech 2025 - SFEIR & WENVISION.pdf
PPTX
Presentation_Securite_Reseaux_Bac+2.pptx
PDF
L'évolution de la création de contenu (2020-2025) : L'impact de l'IA générati...
PDF
FORMATION COMPLETE EN EXCEL DONE BY MR. NYONGA BRICE.pdf
PDF
FORMATION EN Programmation En Langage C.pdf
PDF
Modems expliqués- votre passerelle vers Internet.pdf
PDF
presentation_with_intro_compressee IEEE EPS France
Tendances tech 2025 - SFEIR & WENVISION.pdf
Presentation_Securite_Reseaux_Bac+2.pptx
L'évolution de la création de contenu (2020-2025) : L'impact de l'IA générati...
FORMATION COMPLETE EN EXCEL DONE BY MR. NYONGA BRICE.pdf
FORMATION EN Programmation En Langage C.pdf
Modems expliqués- votre passerelle vers Internet.pdf
presentation_with_intro_compressee IEEE EPS France

La Duck Conf - Initier un Datalab : rien à voir avec ce que j'imaginais !

  • 1. @Madgicweb #LaDuckConf Initier un Datalab : rien à voir avec ce que j’imaginais ! La Duck Conf – 29/01 #LaDuckConf
  • 2. @Madgicweb #LaDuckConf 2 Frédéric @Madgicweb Responsable du département ARCHITECTURE & DONNEES @mutuelleMNT @Groupe_VYV D’ENTREPRISED’ENTREPRISE
  • 4. @Madgicweb #LaDuckConf 4 Des indicateurs « Rétroviseur » au « prédictif » Ordonnancé (Mensuel / Hebdomadaire) Extract-Transform-Load Intelligence Biologique Temps réel (Indicateur / Calcul) Extract-Load-Transform Intelligence Artificielle
  • 7. @Madgicweb #LaDuckConf 7 Le maillon faible Pourquoi ? Quoi ? Quel but ? Avec qui ? Quelles données ? Quelle valeur ? En phase avec la stratégie ? Le ROI ? … Comment ?
  • 8. @Madgicweb #LaDuckConf 8 Back to basic Des bases à maitriser ! MACHINE LEARNING (Apprentissage) DATA GOUVERNANCE Data Mining (Corrélation) Data Analysis (Analyse) Data Analyitics (Collecte) BIG DATA (Passage à l’échelle) DATA SCIENCE
  • 9. @Madgicweb #LaDuckConf 9 C’est parti !!! Ihssane RSA Anne-Marie Décisionnel Wiame Data Scientiste Brieuc Data Scientist Patrice Décisionnel Philippe RDE DATALAB …
  • 10. @Madgicweb #LaDuckConf 10 Définir les fondamentaux du Datalab Former : Se familiariser avec les outils de « Data Science » proposés par la communauté Opensource. Explorer les algorithmes. Coder. Expérimenter : Collecter, analyser et estimer l’effort de traitement des données de l’entreprise (Accès, qualité, utilité…). Evaluer leurs potentiels. Valoriser : Communiquer régulièrement sur la valeur apportée par nos travaux et nos initiatives. Développer : Fonder une communauté pluridisciplinaire autour de cas concrets estampillés « Data Driven ». 1 Quel but ? Quoi ? Avec qui ? Quelle valeur ?
  • 11. @Madgicweb #LaDuckConf 11 Identifier des cas d’usage stratégiques Offres MNT Recommandation Attrition Fraude 2
  • 12. @Madgicweb #LaDuckConf 12 Obtenir l’outillage minimum nécessaire 256 GO RAM 1 To Disque 32 vCPU R Studio Jupyter Spark CSV Connecteur BDD 3
  • 13. @Madgicweb #LaDuckConf 13 Le grand principe GO Sources Big Matrice Algorithme Machine learning Matrice de normalité et détection d’atypisme Local Outlier Factor (Unspervised / Dimensionality Reduction) Variationnal Auto-Encoder (Supervised / Regression) Isolation Forest (Supervised /Classification) Spectral Ranking Anomaly (Unsupervised / Clusturing)
  • 14. @Madgicweb #LaDuckConf 14 Premières difficultés • Accessibilité des données (BASES PROGICIEL, DÉMATÉRIALISATION, RÉGLEMENTATION, …) • Qualité des données (GARDAGE IN – GARBAGE OUT) • Véracité de la donnée (NON MISE À JOUR, SYSTÈME AUTORITAIRE) • Historiser les changements des modèles de donnée (SAVOIR FAIRE UN LIEN D’UNE DONNÉE SUR PLUSIEURS ANNÉES D’HISTORIQUE) • Disponibilité des intervenants (LE DATALAB N’EST PAS UN PROJET MAIS UNE EXPÉRIMENTATION) • Consommer des « Data Set » de plus en plus volumineux (NOTRE SIMPLE SERVEUR N’EST PAS PÉRENNE)
  • 15. @Madgicweb #LaDuckConf 15 Premiers échecs enseignements Recommandation Attrition Fraude Choix des algorithmes Qualité de la donnée L’intelligence artificielle ne fait pas tout
  • 16. @Madgicweb #LaDuckConf 16 • Identifier les données de chaque système applicatif. • Corréler une même donnée présente dans plusieurs systèmes applicatifs. • Analyser les traitements intra-système applicatif afin d'estimer la fraîcheur de la donnée et l’autorité du système applicatif sur cette donnée. Lier les données brutes aux informations générées. • Estampiller les données (métadonnées) afin de cadrer leurs utilisations (Ex : RGPD). • Déterminer les règles d’accès suivant l’appelant et le traitement. S’appuyer sur la gouvernance de donnée Initiative 1
  • 17. @Madgicweb #LaDuckConf 17 Se focaliser sur un seul sujet : LA FRAUDE S’appuyer sur les règles de gestion existantes Augmenter les performances à l’aide d’intelligence Artificielle Interpréter les résultats, adapter les processus d’investigation et améliorer le dispositif global 1 2 3 > > > Initiative 2
  • 18. @Madgicweb #LaDuckConf 18 Bilan Former : Lancement de la Datalab Academy et formation des équipes aux fondamentaux de la « Data Science ». Expérimenter : Identification des sources utiles, application d’une gouvernance de la donnée. Création d’algorithmes d’extraction, de raffinage et de traitement de la donnée. Valoriser : L’outil facilite l’identification d’atypisme part la cellule de fraude. Le taux de détection, de comportements abusifs avérés, augmente. Développer : Collaboration forte avec les métiers. (Itératif) Sensibilisation au travers de présentations. Quel but ? Quoi ? Avec qui ? Quelle valeur ?
  • 19. @Madgicweb #LaDuckConf 19 Timeline Juin Juillet Août Septembre Octobre Novembre Décembre Janvier < Sensibilisation au BigData Equipe Décisionnel motivée COMEX Approche #DALAKE (Data-Platform) Appel d’offre BigData Projet de gouvernance de donnée débuté COMEX Approche #DATALAB Lancement du DATALAB Identification des besoins métiers Livraison du serveur Extraction et raffinage des données identifiées pour les cas d’usage POC Churn V2 Etude d’algorithme de Data-Science & Datalab Academy Focaliser sur la Fraude Premier succès. Présentation COMEXArrêts Lancement de la Data-Platform DIVE Gouvernance de donnée Session spécifique
  • 20. @Madgicweb #LaDuckConf 20 Création de la Data Platform Restitution DataMart Services Processing Jobs Datalake Services Extraction Sources Gouvernance DataLab HDFS DIVE* * Données et indicateurs de la vie de l’entreprise Dictionnaire des données ?
  • 21. @Madgicweb #LaDuckConf 21 Une approche Data-Centric malgré nous Data is the center of the universe; applications are ephemeral. Réétudier la conception : • Formaliser la structure d’un objet métier (création d’un modèle unique partagé VERSUS un modèle spécifique à chaque système applicatif). • Identifier chaque fonctionnalité et le système applicatif en charge du traitement de cette règle métier. Assurer l’intégrité : • Gouverner des sources de données faisant autorités sur l’information afin d’établir une source unique de vérité. Augmenter sa part de responsabilité : • Sécuriser l’accès à la donnée. • Être en capacité de se justifier. Adapter ses interfaces de restitution : • Donner l'accès à la donnée sous plusieurs formats et méthodes (Pull, Push, Evènementiel, Extraction par fichier) http://datacentricmanifesto.org/
  • 22. @Madgicweb #LaDuckConf 22 Take Away Si je pouvais conseiller le Frédéric que j’étais ! • La plateforme n’est pas la priorité (Mais sans, ça va être compliqué) • Fait le avec le métier • Identifie rapidement la matière première dont tu disposes et sa complexité de raffinage en t’appuyant sur la gouvernance de la donnée • Focalise-toi sur un seul sujet afin d’éviter de transformer tes « data-set » en « data-swamp » • Ne t’attends pas à un miracle, la data-science c’est pas magique • Utilise des méthodes pragmatique car par définition le « Datalab » expérimente et se trompe@Madgicweb