Description
Le programme de formation sur Cassandra vise à initier les participants aux fondamentaux de cette base de données distribuée, notamment son historique, ses fonctionnalités et sa capacité à traiter de grands volumes de données avec une haute disponibilité. Les apprenants découvriront l'installation, la configuration et l'utilisation du Cassandra Query Language (CQL) pour interroger les données. La gestion des grappes, la supervision avec des outils comme OpsCenter, ainsi que l'intégration avec Hadoop et Spark seront également abordées. Ce programme s'adresse aux professionnels souhaitant approfondir leurs compétences en gestion de bases de
Objectifs
- Découvrir l'architecture du SGBD NoSQL Apache Cassandra
- Installer et configurer Apache Cassandra
- Créer une base de données et manipuler ses objets
- Découvrir les principes de l'optimisation et du développement
Récapitulatif
Public
Chefs de projets et gestionnaires de bases de données
Prérequis
Avoir les connaissances générales sur les bases de données
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction à Cassandra
- Historique
- Fonctionnalités de Cassandra
- Licence
- Format des données
- "Key-value"
- Traitement de volumes importants
- Haute disponibilité
- Système réparti de base de données...
Installation et configuration
- Prérequis
- Plateformes supportées
- Etude du fichier de configuration : conf/cassandra.yaml
- Répertoire de travail, de stockage des données
- Gestion de la mémoire
- Démarrage d'un nœud et test de l'interface Cassandra-Cli
Interrogation des données, CQL (Cassandra Query Language)
- Commandes de base : connexion au système de base de données
- Création de colonnes
- Insertion
- Modification
- Recherche
- Exécution de scripts
- Comment écrire des requêtes
- Approches
Gestion de la grappe
- Principe et préparation du premier nœud : adresse d'écoute
- Configuration de nouveaux nœuds
- Notion de "Bootstrapping" et "Token"
- Paramètres listen_address et rpc_address
- Réplication (Topologie du réseau et EndpointSnitch / Stratégie de réplication)
- Ajout de nœuds et suppression
- Cassandra dans un Cloud
- Mise en oeuvre avec OpenStack
Supervision et exploitation
- OpsCenter (Installation, Lancement, Utilisation de base)
- Supervision avec nodetool cfstats
- Export JMX vers des outils de supervision comme Nagios
- Sauvegardes
- Import / export au format JSON
Support Hadoop et Spark
- Principe de MapReduce
- Implémentation Hadoop
- Mise en oeuvre depuis Cassandra
- Description rapide de l'architecture Spark
- Mise en oeuvre depuis Cassandra
- Exécution de travaux Spark s'appuyant sur une grappe Cassandra