Description
Ce programme de formation se concentre sur l'analyse des données, en abordant des concepts clés comme la préparation des données, le data munging, et le rôle du data scientist. Il inclut une étude de cas pratique pour illustrer les étapes de nettoyage, d'enrichissement et d'organisation des données. Les participants découvriront les fondements de l'apprentissage automatique, ainsi que les méthodes et algorithmes associés. Enfin, l'importance de la visualisation des données sera soulignée, avec des exemples concrets utilisant R et Python. Ce programme s'adresse aux professionnels souhaitant approfondir leurs compétences en science
Objectifs
- Définir les étapes de préparation des données et les algorithmes de Machine Learning
- Découvrir les différentes méthodes d'apprentissage automatique
- Préparer vos données avant de les exploiter
Récapitulatif
Public
Chefs de projets, développeurs, data scientists, architectes ou toute personne souhaitant comprendre comment organiser le traitement des données et structurer les processus de Machine Learning
Prérequis
Avoir connaissance des principes du Big Data et des architectures techniques mises en oeuvre
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction
- Zoom sur les données
- - Format
- - Volumes
- - Structures
- Requêtes
- Attentes
- Utilisateurs
- Etapes de la préparation des données
- Définitions
- Présentation du Data Munging
- Le rôle du data scientist
Étude de cas
- Mise en oeuvre pratique des différentes phases
- - Nettoyage
- - Enrichissement
- - Organisation des données
Apprentissage automatique
- Définition
- Les attentes
- Les valeurs d'observation et les variables cibles
- Ingénierie des variables
Apprentissage automatique
- Les méthodes
- - Apprentissage supervisé et non supervisé
- Classification des données
- Algorithmes
- - Régression linéaire
- - k-voisins
- - Classification naïve bayésienne
- - Arbres de décision...
Les risques et écueils
- Importance de la préparation des données
- L'écueil du "surapprentissage"
Visualisation des données
- L'intérêt de la visualisation
- Outils disponibles
- Exemples de visualisation avec R et Python