Description
Ce programme de formation sur le Big Data et Hadoop vise à former les participants à la mise en œuvre et à la gestion des environnements Hadoop. Il couvre des sujets essentiels tels que la configuration de l'environnement, la gestion des utilisateurs via Ambari, et l'utilisation du système HDFS. Les apprenants découvriront également la gestion des ressources avec YARN, les configurations de haute disponibilité, ainsi que le suivi et la sauvegarde des clusters. Ce programme s'adresse aux professionnels de l'informatique souhaitant approfondir leurs compétences en gestion de données massives.
Objectifs
- Maîtriser l'administration des clusters Hortonworks
- Apprendre à élaborer une architecture Hadoop
- Apprendre à mettre en oeuvre un cluster Hadoop
- Configurer et monitorer le cluster avec Ambari
- Savoir gérer la maintenance des noeuds dans un cluster
Récapitulatif
Public
Administrateurs système, consultants SI
Prérequis
Maîtriser les commandes Shell
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Présentation
- Big Data et Hadoop
Mise en œuvre
- Configuration de l'environnement
- Installation de HDP
Gestion des droits utilisateurs
- Gestion des utilisateurs et des groupes d'Ambari
La couche services
- Gestion des services Hadoop
Le système HDFS (Hadoop Distributed File System)
- Utilisation du stockage HDFS
- Utilisation de Hadoop Storage
- Utilisation de WebHDFS
- Utilisation des listes de contrôle d'accès HDFS
- Gestion du stockage HDFS
- Gestion du stockage Hadoop
- Gestion des quotas HDFS
- Ajout, remplacement et suppression de noeuds de travail
Gestion des racks
- Configuration de la prise en compte des racks (rack awareness)
Gestion des ressources avec Yarn
- Présentation et architecture de YARN
- Gestion du service YARN à l'aide de l'interface utilisateur Web Ambari
- Gestion du service YARN à l'aide de l'interface ligne de commande CLI
- Applications YARN
- Exécution d'exemples d'applications YARN
- Planificateur de capacité YARN
- Configuration de planificateur de capacité (Capacity Scheduler)
- Gestion des conteneurs et files d'attente de YARN
- Gestion des listes de contrôle d'accès (ACL) de YARN et des droits utilisateurs
Haute disponibilité
- Configuration de HDFS et YARN en haute disponibilité (High Availability)
- Configuration d'un NameNode en HA
- Configuration de ResourceManager en HA
Monitoring
- Suivi d'un cluster
- Gestion des alertes d'Ambari
Système de backup
- Protéger un cluster avec des sauvegardes
- Gestion des photos instantanées HDFS
- Utilisation de DistCp