Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Cet exposé donnera un aperçu du paysage NoSQL et une classification pour les différentes catégories architecturales, clarifiera les concepts de base et la terminologie, et fournira une comparaison des caractéristiques, des forces et des inconvénients des projets les plus populaires (CouchDB, MongoDB , Riak, Redis, Membase, Neo4j, Cassandra, HBase, Hypertable).
Les bases de données NoSQL bénéficient d'une large couverture médiatique, mais il semble y avoir beaucoup de confusion autour de celles-ci, comme dans quelles situations elles fonctionnent mieux qu'une base de données relationnelle, et comment choisir l'une plutôt qu'une autre.
Architecture web aujourd'hui, besoin de scalabilité des bases de données relationnelles, découverte des bases de données NoSQL et des différents types de celles-ci. La vidéo de présentation peut être consultée à l'adresse suivante : http://youtu.be/oIpjcqHyx2M
Quand utiliser MongoDB … Et quand vous en passer…MongoDB
> Qu'est-ce que MongoDB ?
> À quoi sert MongoDB ?
> Les points forts de MongoDB... Les points à améliorer
> Ce que les clients peuvent faire et ne pas faire avec MongoDB
> Cas d'utilisation inhabituels
> Quand utiliser MongoDB
BigData_TP1: Initiation à Hadoop et Map-ReduceLilia Sfaxi
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
C'est une presentation sur les ETL. On explique pourquoi il faut utiliser un ETL et non créer des routines à la main. On présente Talend Open Studio qui est un projet open source et quelques exemples
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Hatim CHAHDI
Ce cours introduit les bases de données orientées colonnes et leurs spécificités. Il détaille par la suite l'architecture d'HBase et explique les moyens nécessaires à sa mise en place et à son exploitation.
CNES - CCT SIL - Traitement et Manipulation de la donnée à l‘aide des technologies Big Data
Présentation du 30 Juin 2017
Les CCT sont des espaces d'échanges techniques mis en place par le CNES il y a 20 ans, dans le but de réunir différents acteurs industriels et public pour s'enrichir mutuellement.
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Une introduction au Big Data, NoSQL et Open Data.
Il présente les avantages de NoSQL.
Une présentation des différents types des bases de données NoSQL.
Elastic search
Moteur de recherche
Crée en 2010 par Shay Banon
Basé sur Apache Lucene (+multi-nodes)
Développé en Java
Open source (Licence Apache)
La société a été crée en 2012
La version courante est 2.0
Site officiel: https://www.elastic.co/
Presentation about Docker:
2016 Trends:
* Microservices: load balancing and orchestration
* Cloud
* Continuos integration
* Environment-less deployment
What are containers?
Why Docker?
Docker project
Docker. Inc
Docker VS VM
Docker basics
Some statistics about Docker and some Docker use case insights
Docker compose configuration file:
http://www.mediafire.com/download/lfmfzrkgn9wzegm/docker-compose.yml
Présentation link:
https://docs.google.com/presentation/d/1x11EgUqBVLAl70p53rZ-nJoLlL6FoZd2KbvTRxyVp1g/pub?start=false&loop=false&delayms=3000
BigData_TP1: Initiation à Hadoop et Map-ReduceLilia Sfaxi
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
C'est une presentation sur les ETL. On explique pourquoi il faut utiliser un ETL et non créer des routines à la main. On présente Talend Open Studio qui est un projet open source et quelques exemples
Cours HBase et Base de Données Orientées Colonnes (HBase, Column Oriented Dat...Hatim CHAHDI
Ce cours introduit les bases de données orientées colonnes et leurs spécificités. Il détaille par la suite l'architecture d'HBase et explique les moyens nécessaires à sa mise en place et à son exploitation.
CNES - CCT SIL - Traitement et Manipulation de la donnée à l‘aide des technologies Big Data
Présentation du 30 Juin 2017
Les CCT sont des espaces d'échanges techniques mis en place par le CNES il y a 20 ans, dans le but de réunir différents acteurs industriels et public pour s'enrichir mutuellement.
Pour accéder aux fichiers nécessaires pour faire ce TP, visitez: https://drive.google.com/folderview?id=0Bz7DokLRQvx7M2JWZEt1VHdwSE0&usp=sharing
Pour plus de contenu, Visitez http://liliasfaxi.wix.com/liliasfaxi !
Une introduction au Big Data, NoSQL et Open Data.
Il présente les avantages de NoSQL.
Une présentation des différents types des bases de données NoSQL.
Elastic search
Moteur de recherche
Crée en 2010 par Shay Banon
Basé sur Apache Lucene (+multi-nodes)
Développé en Java
Open source (Licence Apache)
La société a été crée en 2012
La version courante est 2.0
Site officiel: https://www.elastic.co/
Presentation about Docker:
2016 Trends:
* Microservices: load balancing and orchestration
* Cloud
* Continuos integration
* Environment-less deployment
What are containers?
Why Docker?
Docker project
Docker. Inc
Docker VS VM
Docker basics
Some statistics about Docker and some Docker use case insights
Docker compose configuration file:
http://www.mediafire.com/download/lfmfzrkgn9wzegm/docker-compose.yml
Présentation link:
https://docs.google.com/presentation/d/1x11EgUqBVLAl70p53rZ-nJoLlL6FoZd2KbvTRxyVp1g/pub?start=false&loop=false&delayms=3000
A Gentle Introduction To Docker And All Things ContainersJérôme Petazzoni
Docker is a runtime for Linux Containers. It enables "separation of concern" between devs and ops, and solves the "matrix from hell" of software deployment. This presentation explains it all! It also explains the role of the storage backend and compares the various backends available. It gives multiple recipes to build Docker images, including integration with configuration management software like Chef, Puppet, Salt, Ansible. If you already watched other Docker presentations, this is an actualized version (as of mid-November 2013) of the thing!
Docker is a system for running applications in isolated containers. It addresses issues with traditional virtual machines by providing lightweight containers that share resources and allow applications to run consistently across different environments. Docker eliminates inconsistencies in development, testing and production environments. It allows applications and their dependencies to be packaged into a standardized unit called a container that can run on any Linux server. This makes applications highly portable and improves efficiency across the entire development lifecycle.
Este documento proporciona una introducción a GNU Privacy Guard (GnuPG), incluyendo qué es GnuPG, por qué es útil, y cómo configurarlo y usarlo. GnuPG es un fork libre de PGP que permite cifrar archivos y comunicaciones de forma segura generando y intercambiando llaves criptográficas asimétricas entre usuarios. El documento explica cómo generar llaves, cifrar y firmar archivos, y configurar opciones como el servidor de llaves y el agente GPG.
Este documento describe varias herramientas web 2.0 como CmapTools para crear y compartir mapas conceptuales, Flickr para compartir fotos, SlideShare para compartir presentaciones, YouTube para compartir videos, Blogger para crear blogs, Wikipedia como enciclopedia colaborativa, Wikispaces para trabajo colaborativo basado en wikis, Digg para noticias sobre ciencia y tecnología, Google Groups para crear grupos de discusión, Technorati para buscar blogs, Skype para video y audio conferencias, WizIQ para salones de clase virtuales, y bancos
El documento habla sobre los desafíos del management en la era de la colaboración. Explica que las prácticas de gestión tradicionales ya no serán viables debido a los cambios tecnológicos y la innovación abierta. También describe las oportunidades que brindan las redes sociales y la web 2.0 para la innovación y la acción colectiva. Finalmente, presenta seis aprendizajes clave sobre cómo las organizaciones pueden aprovechar mejor estas nuevas tendencias.
Infographie : Utilisation des réseaux sociaux par les grandes écoles de commerceYupeek
Les grandes écoles sont de plus en plus présentes et actives sur les réseaux sociaux. Yupeek a analysé la présence des 30 plus grandes écoles de commerce de France sur les réseaux sociaux.
Sobre economía digital y como esta esta ayudando a obtener una mejor plataforma para contruir un futuro economico solido basado en la red como entidad de confianza.
El documento habla sobre conceptos de tecnología e investigación y desarrollo para acceder a nuevas técnicas de producción como círculos de calidad, control de calidad total, justo a tiempo, tarjeta Kanban, planificación de necesidades materiales, y análisis de valor. También discute comprar patentes, marcas, y alternativas tecnológicas como producción mecánica, humana, o automatizada. Finalmente, explica matrices tecnológicas para decidir la tecnología a aplicar y los costos asociados
Este documento habla sobre cómo mantener un cerebro saludable y mejorar la memoria a través de actividades que estimulen las neuronas. Recomienda realizar tareas cotidianas de maneras no habituales para sacar al cerebro de su rutina y forzarlo a crear nuevas conexiones neuronales. También sugiere aprender cosas nuevas, cambiar rutas y ubicaciones de objetos para mantener al cerebro flexible y produciendo neurotrofinas.
Algunos ejemplos sobre la colocación verbal en sustantivos como oscuridad, cielo, recuerdo y otros. Además breves explicaciones sobre cómo se construyen metáforas por una transgresión en la colocación verbal habitual.
Los toltecas se desarrollaron en Mesoamérica a partir del siglo VIII d.C. Fundaron la ciudad de Tula, donde crearon un estado militar y una avanzada cultura. Construyeron grandes templos como el de la Estrella Matutina, decorado con atlantes de casi 5 metros. La cultura tolteca dominó hasta el siglo XII, cuando Tula fue destruida. Algunos toltecas luego conquistaron Chichén Itzá. Según algunos, un grupo de toltecas desarrolló técnicas cognitivas avanzadas
El profesor les ofreció café a un grupo de exitosos profesionales que se quejaban del estrés. Les pidió escoger una taza para servirse, notando que escogieron las más bonitas primero. Explicó que aunque la taza no cambia la calidad del café, buscan lo mejor para sí mismos, causando problemas. La vida es el café, mientras que trabajos y posiciones son las tazas que no definen realmente la calidad de vida. Aconsejó vivir de forma sencilla y disfrutar el café en lugar de enfoc
1-Problématique
2-Définition du Big Data
3-Big Data et 3V
4-Data wahrehouse VS Big Data
5-Domaines d’utilisations
6-Les techniques de traitement
7-Big Data et Aspect Mobile
8-Conclusion
1/ initiation avec le big Data
2/ Data warehouse VS Big Data
3/ Domaines d’utilisations
4/ Des connaissances importantes sur Hadoop
5/ Big Data et Aspect Mobile
Introduction au web des données (Linked Data)BorderCloud
L'Open Data, le Big Data, le Web des données, le Web sémantique, les ontologies, le NoSql et le SPARQL sont autant de notions qu'il faut comprendre pour ne pas rater la prochaine rupture technologique du Web.
Cette présentation est l'introduction de la formation sur le Web sémantique que donne la société BorderCloud pour prendre un peu de recule sur les buzzwords du moment et savoir si vous avez besoin de faire du Big Data ou bien du Linked Data.
Why docker is taking over the world (docker birthday 2019)JEMLI Fathi
This document discusses trends in software development over the last 5 years including microservices, cloud computing, serverless development, and DevOps. It notes the need for technologies to run in optimized environments without concerns for compatibility, testing, integration or portability. Containerization solutions like Docker addresses these needs by allowing software and dependencies to be packaged into standardized and portable containers that can run anywhere. The document outlines how Docker has evolved from 2013 for building and shipping virtual containers to its current role as a Container as a Service platform enabling secure application environments for developers through infrastructure and content management.
Gitlab CI/CD provides continuous integration and continuous delivery capabilities. It allows automating the building, testing, and deployment of code changes. At Proxym, Gitlab is used to host Git repositories and manage the complete DevOps lifecycle including CI/CD. It integrates with other tools and uses multiple runners to test code changes and deliver new features to customers quickly in an automated way.
This document provides an introduction to the MEAN stack for beginners. It discusses JavaScript standards and Node.js for the backend using Express.js. It also covers MongoDB as a NoSQL database and its advantages over relational databases. Finally, it discusses Angular as a frontend framework for building single page applications, its core concepts and advantages over other frameworks. The document aims to give beginners an overview of each technology that makes up the MEAN stack.
Les ressources disponibles produites par le Réseau Équin :
Vous êtes 👩💼👨💼 Conseillers entreprise, installation-transmission, chargés de mission économie ou élevage, vous accompagnez des porteurs de projet en lien avec la filière équine ce webinaire est fait pour vous !
Le Réseau Équin produit des ressources clés et des références sur le fonctionnement technico-économique des exploitations et vous donne des outils concrets à mobiliser dans vos accompagnements.
Vous trouverez dans ce replay des chiffres clés sur la filière équine, des ressources produites par le Réseau et un témoignage de conseiller qui illustre comment il utilise ces documents au quotidien dans son métier d’accompagnement.
Part des demandeurs d'emploi indemnisables : situation au 30 septembre 2024France Travail
Fin septembre 2024, 70,0 % des personnes inscrites à France Travail en catégories A, B, C ont un droit ouvert à l’indemnisation. Parmi celles-ci, 70,0 % sont indemnisées.
Ainsi, 49,0% des personnes inscrites à France Travail en catégories A, B, C sont indemnisées.
Enquête besoins en main d’oeuvre 2025 Région Provence-Alpes-Côte d'AzurFrance Travail
Pour l'année 2025, les intentions d'embauche des employeurs s'élèvent à plus de 220 800 projets de recrutement pour la région Provence-Alpes-Côte d'Azur et la Principauté de Monaco, représentant 9 % des estimations nationales (2,4 millions de projets, soit une baisse de 12,5 % par rapport à 2024).
4. Définition du Big Data
90% des données d'aujourd'hui
ont été crée dans les 2
dernières années.
Loi de Moore: le volume des
données double tous les 18
mois.
YouTube: 13 millions d'heures et
700 milliards de vues en 2010.
Facebook: 20 To / jour
(compressé).
CERN / LHC: 40 TB / jour (15PB /
an).
Wikipédia:
Les big data, littéralement les "grosses
données", ou méga-données, désignent
des ensembles de données qui
deviennent tellement volumineuses
qu'ils en deviennent difficiles à
travailler avec des outils classiques de
gestion de base de données ou de
gestion de l'information.
5. Les Big Data sont caractérisées par:
Le volume: de l'ordre de Péta-Octets.
La variété: ils viennent de sources hétéroclites.
La vélocité: ils exigent un temps record pour les explorer et les analyser.
6. Les centres de données (Data center)
Un data center est un emplacement physique ou ils sont regroupés des
équipements informatiques (des serveurs, des "mainframes"...).
Il permet pour l'entreprise de stocker des données, les traiter et les protéger.
Cet espace doit être protégé contre les incendies, équipé d'un système
d'alimentation d'urgence, et surveillé par des spécialistes pour éviter les
intrusions et agir rapidement en cas de panne.
Les centres de données sont très gourmands en énergie (2% de la consommation
mondiale).
12. Le plus grand centre de données dans le monde (en 2012)
13. Google
Données traitées:
Des pages Web.
Les données stockées sur les différents services
offerts par Google(Drive, Calendar, Gmail...).
Besoin:
Gérer un volume de données de l'ordre de Péta-octets.
Indexer et chercher des mots spécifiques dans
des milliards de pages Web.
Générer du contenu Web dans un temps très réduit.
Historique
14. La problématique
Les données stockées et les
traitements demandés ne peuvent
pas être satisfaits sur une seule
machine quelque soit sa puissance,
même en utilisant un réseau de
machines, les communications
entre les machines rendent les
traitements très lents.
15. Solution: approche centralisée
Map Reduce: 2003
Map:
Distribuer le travail sur plusieurs machines
Reduce:
Récupérer le résultat de chaque machine
et le regrouper
16. Les limites de la solution adoptée
A l'époque, ni les systèmes de
fichiers, ni les bases de données
permettent l'implémentation d'un
tel patron d'architecture.
18. Big Table
Une base de données pour stocker
les fichiers structurés et qui est
adaptée à GFS.
19. L'architecture innovante adoptée
par Google a inspiré beaucoup de
personnes et a été suivie par
plusieurs solutions, par
exemple(Hadoop, Accumulo,
Cassandra...).
22. NoSQL: c'est quoi?
NoSQL(Not Only SQL) ≠ SGBDR.
L'unité logique n'y est plus la table.
Les données ne sont en général pas manipulées avec SQL.
23. Les systèmes NoSQL sont conçues pour répondre
aux contraintes suivantes:
Cohérence : tous les nœuds du système voient exactement les mêmes données
au même moment.
Haute disponibilité (Availability) : en cas de panne, les données restent
accessibles.
Tolérance au Partitionnement : le système peut être partitionné
24. Pourquoi le NoSQL?
Des opérateurs, des sites et des entreprises qui ont un besoin excessif pour stocker
et gérer des données massives => il faut trouver de nouvelles solutions!
25. Des solutions pour gérer les données
Les contraintes des moteurs relationnels les rendent très lourdes.
L'évolution du matériel(serveurs...).
La charge associée à l'usage du Web ou du Mobile qui est impossible à prévoir.
26. Des solutions pour faciliter la tache des
développeurs
Le "Web Scale": pouvoir mettre à l'échelle des applications.
Eviter les jointures pour pouvoir distribuer les données.
Eviter le langage SQL qui est un langage déclaratif difficile à maîtriser.
Esprit "Open Source": solutions NoSQL gratuits en les comparant avec les SGBD
relationnels très coûteux.
Les solutions NoSQL sont bâtis pour être distribués.
Utilisation de la mémoire vive pour stocker les données => rapidité d’accès.
28. Les types des moteurs NoSQL
Les moteurs à clé/valeur
Les données sont représentés par des couples clé-valeur
La valeur peut être une simple chaîne de caractères, un objet sérialisé…
La communication avec la BD se résume aux opérateursGET, PUT, DELETE...
Les solutions les plus connues sont Redis(Salvatore Sanfilippo et Pieter Noordhuis),
Riak(Apache) et Voldemort(LinkedIn).
29. Les types des moteurs NoSQL
Les moteurs orienté document
Ce modèle est basé sur le paradigme clé-valeur, sauf que la valeur ici est un fichier
JSON ou XML.
Les implémentations les plus populaires sont CouchDB (Apache), RavenDB (destiné
aux plateformes .NET/Windows) et MongoDB(10Gen).
30. Les types des moteurs NoSQL
Les moteurs orienté colonne
Ce modèle ressemble à une table dans un SGBDR, mais un nombre de colonnes
dynamique.
=>Le nombre de colonnes varie d'un enregistrement à un autre, ce qui évite les
valeurs nulles.
Comme solutions, on retrouve principalement HBase (solution inspirée par Google
BigTable) ainsi que Cassandra (solution inspirée par Dynamo d’Amazon et BigTable
de Google).
31. Les types des moteurs NoSQL
Les moteurs orienté graphe
Ce modèle est basé sur la théorie des graphes.
Il s'appuie sur les notions de nœuds, de relations et de propriétés.
Il facilite la modélisation du monde réel.
La principale solution est Neo4J.
32. Perspective pour l'avenir du Big Data
Apparition de plusieurs métiers et disciplines en relation directe avec les Big
Data, par exemple "Data Analyst", "Data Scientist"...
Les Etats-Unis, en 2017, auront besoin de 500 000 Data Scientist
supplémentaires.
Le marché du Big Data: 125 milliards de dollars en 2015.
Dans les 3 prochaines années, toutes les entreprises auront intégré des solutions
data en Cloud.