Description
Ce programme de formation vise à initier les participants aux outils ETL et à la gestion des données à l'aide de Talend. Il aborde la définition des besoins, l'échange inter-applications, l'installation de l'environnement de développement, ainsi que la modélisation et le développement de flux de données. Les apprenants découvriront également la manipulation des métadonnées, l'utilisation avancée des composants, la gestion des erreurs et des logs, ainsi que la préparation au déploiement des solutions. Ce cursus s'adresse principalement aux professionnels souhaitant améliorer leurs compétences en intégration de données.
Objectifs
- Comprendre la philosophie d'un ETL
- Créer des flux de données
- Transformer et gérer la donnée
- Comprendre et corriger les erreurs
Récapitulatif
Public
Professionnels de l'Informatique et développeurs ayant besoin d'implémenter des flux de données inter-applications ou devant alimenter un entrepôt de données
Prérequis
Etre familiarisé avec le langage SQL ainsi que les modèles relationnels d'architecture de tables de base de données
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction
- Définition du besoin
Eai/EtL
- Échange inter application
- L'ETL dans un projet décisionnel
- Mise en place de l'outil
- Installation du JDK (kit de développement JAVA)
- Astuces et remarques (premier démarrage)
Environnement de développement
- Découverte de l'interface graphique Eclipse (Écran de démarrage, Connexion au workspace, Création d'un projet, Ouverture d'un projet, Présentation des éléments d'interface, Définition des éléments de référentiel projet
- Initiation aux composants (palette, Énumération des grandes familles de composants)
Développer les premiers flux
- La modélisation de flux par le Business Model
- Le développement de jobs
- Conventions et règles de développement
- tRowGenerator
- tFileOutputExcel
- tFileInputExcel
- tMsgBox
- tSendMail
- Lier les composants entre eux
- Exécuter un job
Transformer et gérer les données
- tFilterRow
- tUniqRow
- tAgregateRow
- tSortRow
- tMap
Mise en place et utilisation des métadonnées
- Définition du concept
- Créer une métadonnée Excel
- Utiliser une métadonnée Excel
- Créer une métadonnée de base de données
- Récupérer les informations d'une base de données
Manipuler une base de données avec Talend
- Définition des composants liés aux bases de données
- tAccessInput / tMySQLInput
- tAccessOutput / tMySQLOuput
Notions et composants avancés
- Définition et utilisation des variables globales
- tBuffer
- tSystem
- tServerAlive
- tUnite
- tReplicate
Les boucles dans Talend
- tFileList
- tInfiniteLoop
- tLoop
- tPOP
- tFlowToIterate
Mise en place de la gestion des logs et des erreurs
- tLogRow
- tDie et tLogCatcher
- tWarn
- tStatCatcher
- tFlowMeter et tFlowMeterCatcher
Gestion des environnements et transformations réutilisables
- Définition de la notion de contexte
- Créer une variable de contexte
- Utiliser une variable de contexte
- Modifier une variable de contexte
- Développement et utilisation de routines
Préparation au déploiement de la solution
- Définition et développement d'un séquenceur
- Génération la documentation du projet
- Construction et automatisation du projet