Description
Ce programme de formation sur le big data vise à fournir une compréhension approfondie des concepts fondamentaux, des technologies et des outils associés. Il aborde l'histoire et les caractéristiques du big data, ainsi que les sources de données variées, telles que celles provenant des entreprises et des réseaux sociaux. Les participants apprendront des techniques de data mining et se familiariseront avec des outils comme Hadoop et MongoDB. Destiné aux professionnels souhaitant se certifier dans le domaine, ce cursus prépare également à l'examen "Big Data Foundation".
Objectifs
- Connaître les fondamentaux du Big Data, ses origines et ses caractéristiques
- Comprendre ce qu'est le Data Mining
- Appréhender les technologies les plus populaires du Big Data
Récapitulatif
Public
Connaître les fondamentaux du Big Data, ses origines et ses caractéristiques
Comprendre ce qu'est le Data Mining
Appréhender les technologies les plus populaires du Big Data
Prérequis
Connaissances de base des architectures techniques
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction
Les fondamentaux du big data
- Un peu d'histoire…
- Définition, caractéristiques et bénéfices
- Les dimensions (volume, variété, vélocité)
- Les technologies les plus populaires (Hadoop, MongoDB)
- Ethique et vie privée
Les sources du big data
- Les données de l'entreprise (Oracle, SAP, Microsoft, Data Warehouses, données nonstructurées)
- Réseaux sociaux (Facebook, Twitter, autres)
- Données publiques (économiques, financières, comportementales, etc.)
Data mining
- Définition
- Les techniques descriptives et prédictives (Classification, association, segmentation, etc.)
- Exemples d'outils (Weka, KNIME, R)
Zoom sur Hadoop
- Présentation de Hadoop (Les principaux composants, les extensions)
- Installation et configuration
- MapReduce
- Data Processing avec Hadoop
Zoom sur MongoDB
- Présentation de MongoDB
- Réplication et sharding
- Ecosystèmes (langages, drivers, outils, intégration avec Hadoop)
- Installation et configuration
- Base de données de documents
- Modèle de données de documents
Certification Big Data Foundation
- Préparation à l'examen « Big Data Foundation »
- Passage de l'examen « Big Data Foundation »