Description
Ce programme de formation sur les bases de données et les ETL vise à fournir une compréhension approfondie des concepts fondamentaux et avancés liés à la gestion des données. Il aborde les types de bases de données, les structures de tables, les jointures, la normalisation, ainsi que les techniques d'optimisation comme les index et les vues. Les participants apprendront également à utiliser les ETL pour le traitement des données, en explorant des thèmes tels que la qualité des données, la gestion des erreurs et les bonnes pratiques de développement. Cette
Objectifs
- Comprendre les modèles de bases de données
- Comprendre l'architecture SGBD (Système de Gestion de Base de Données) et ETL
- Faire un tour d'horizon des SGBD
- Explorer le marché des ETL
- Aprendre à utiliser un ETL avec un exemple pratique
Récapitulatif
Public
Toute personne appelée à travailler sur un projet décisionnel d'entreprise (développeur, responsable de projet décisionnel, etc.)
Prérequis
Maîtriser les bases de l'informatique bureautique (Excel, etc.)
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction aux bases de données
- Qu'est-ce qu'une base de données ?
- Les éditeurs de bases de données du marché (Oracle, Microsoft...)
- Les différents types de bases de données (en ligne, colonnaire, vectorielle....)
Les concepts de base
- Les tables
- Les attributs et les colonnes
- Les différents types de données (chaîne de caractère, numérique, date, booléenne)
- Une valeur particulière : NULL
- Les contraintes des colonnes
- Les clefs primaires et étrangères
- Les clefs de substitution (SK)
- La résolution de relations
- Les contraintes d'intégrité
Les jointures
- Croisée
- Interne
- Externe (Gauche / Droite)
- Naturelle
- Le produit cartésien
La normalisation
- 1ère Forme Normale
- 2ème Forme Normale
- 3ème Forme Normale
- Forme normale de BOYCE-CODD
- Normalisation / Dé-normalisation : quel impact sur les performances, les volumétries ?
Les concepts avancés
- Les indexes : un levier d'optimisation
- Les vues / les vues matérialisées
- Les fonctions
- Les procédures stockées
- Les triggers
Introduction aux ETL
- Qu'est-ce qu'un ETL ?
- Comparatif avec un script SQL ?
- L'architecture fonctionnelle
- Les différents ETL du marché
- Les liens avec les SGBD
Les concepts de base
- ETL compilant en SQL
- ETL compilant en C / JAVA
- Types de données
- Orchestration / Gouvernance
Algorithmie
- La décomposition en éléments simples
- Les boucles
- La gestion des flux de données
- Orchestration
- Normalisation / Dé-normalisation
- Routines
La qualité des données
- La gestion des rejets
- Les contraintes d'intégrité des données
- Les formats des données
Les jointures
- Les jointures internes
- Les jointures externes
- Avec et sans rejets
Les modalités de chargement
- Insert / Update
- Update / Insert
- Delete / Insert
- Truncate / Insert
- Orchestration / Ordonnancement
La gestion des erreurs
- Les erreurs techniques
- Les erreurs fonctionnelles
- Monitoring
Les concepts avancés
- Le suivi de l'exploitation
- Savoir choisir entre script et ETL
- Choisir son ETL
- Optimisation : ELT / Bulk
- Historisation : SCD
- Bonnes pratiques de développement (Design, nommage, découpage technique / fonctionnel)