Description
Ce programme de formation de 8 à 16 heures par module vise à former des professionnels aux enjeux de l'intelligence artificielle (IA) et à la gestion des données. Les participants apprendront à concevoir des jeux de données, à traiter et évaluer les performances des modèles d'IA, ainsi qu'à intégrer des retours utilisateurs. Des notions de risques éthiques, de menaces et de bonnes pratiques en MLOps seront également abordées. Cette formation s'adresse à des professionnels souhaitant approfondir leurs compétences en développement et déploiement de solutions IA.
Objectifs
- <ul style="color: #222a35; font-size: 15px;">
- <li>Documenter les jeux de données (datasheet, documentation technique)</li>
- <li>Documenter le flux de traitement des données (donnée source jusqu'à l'exploitation, chaine d'approvisionnement des données) </li>
- <li>Documenter le cycle de vie de la donnée </li>
- <li>Prendre en compte les techniques de génération de données (données synthétiques, confidentialité différentielle, etc.)</li>
- <li>Maitriser les techniques d'augmentation de données </li>
- <li>Comprendre les impacts de la solution par rapport au destinataire direct et indirect</li>
- <li>Connaître, identifier et intégrer les différents risques éthiques et sociétaux associés à l'utilisation de l'IA en fonction du cas d'usage</li>
- <li>Connaître la réglementation en lien avec la confidentialité et utilisation des données et de l'IA pour les usages sensibles</li>
- <li>Choisir et documenter le modèle de stockage adapté en fonction du cas d'usage et des données sources</li>
- <li>Maitriser les techniques de versionnage et de mise en production des modèles</li>
- <li>Maitriser les techniques de Mlops et frameworks associés (MLFlow, …), conteneurisation (docker) et les articuler avec les techniques de Devops</li>
- <li>Développer des tableaux de bord pour le suivi des performances et les métriques associées</li>
- <li>Intégrer les retours utilisateurs et les limites d'utilisation (retour du contrôle vers un humain)</li>
- <li>Connaître les menaces qui pèsent sur l'élaboration d'une solution d'IA et comprendre l'état de l'art des mécanismes d'atténuation (adversarial example) et évaluer les risques résiduels </li>
- <li>Comprendre les modèles d'IA et leurs champs d'application</li>
- <li>Maîtriser les outils (Tensorflow, Keras, ...) pour faire de L'IA</li>
- <li>Compréhension, prise de recul par rapport des cas d'usage</li>
- <li>Intégrer les contraintes opérationnelles (accès aux données, SI, etc…)</li>
- <li>Sensibilisation Écoconception (ex-gestion de flux de données vertueuse, code optimisé, …)</li>
- <li>Connaissance des différents modèles d'IA et de leurs spécificités (ex. contraintes liées aux différentes formes d'apprentissage</li>
- <li>Optimiser les méthodes d'apprentissage au regard du jeu de données</li>
- <li>Elargir les connaissances sur les bibliothèques du marché. </li>
- <li>Bonnes pratiques Mlops, versionning, dév. Continu, CI/CD… </li>
- <li>Savoir « exposer » l'IA (API, web service, events, etc)</li>
- <li>Développement d'IHM basiques pour première retitution MVP (Tkinter, Flask, Django, …)</li>
- <li>Avoir une bonne connaissance des principaux éléments d'architectures impliquées pour l'IA</li>
- <li>Être capable de challenger les propositions techniques sous les contraintes performance, économique, écologique, …)</li>
- </ul>
Récapitulatif
Public
Professionnels dont les missions, en termes de traitement de données, sont plus avancées (notamment l'exploration de données avancée, la modélisation statistique et l'utilisation de techniques d'apprentissage automatique et d'intelligence artificielle pour résoudre des problèmes complexes) et qui disposent de compétences déjà solides en mathématiques et statistiques.
Prérequis
- Exercer un emploi comportant des activités orientées vers la création d'infrastructures, de logiciels, vers le traitement et l'analyse de données ou encore vers la maintenance des systèmes ;
- Des connaissances en mathématiques et statistiques, en particulier dans l'exploitation de données (statistiques descriptives, probabilités, statistiques inférentielles, analyse exploratoire des données, modélisation statistique) ;
- Justifier d'une expérience en programmation (1er niveau de maîtrise des langages de programmation, connaissances algorithmes et structures de données, architecture logicielle, systèmes d'exploitation).
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
- Documentation
- Durée : 8 heures
- Conception de jeu de donnée
- Technique de traitement de donnée
- Durée : 12 heures
- Technique de traitement de donnée
- Evaluation de connaissance
- Adaptation de la solution aux enjeux sociétaux et besoins clients
- Durée : 14 heures
- Identifier les risques éthiques et sociétaux
- Identifier et corriger les dérives du modèle
- Analyser et réévaluer de manière périodique les indicateurs de performance
- Intégrer les retours utilisateurs et les limites d'utilisation
- Mesure et suivi de performance
- Durée : 16 heures
- Analyser et réévaluer de manière périodique les indicateurs de performance
- Comprendre les objectifs et les domaines d'applications de l'IA
- L'automatisation des corrections des modèles
- Outils de monitoring d'entrainement
- Evaluation de connaissance
- Menaces
- Durée : 8 heures
- Introduction aux menaces
- Attaques adversariales
- Empoisonnement des données
- Stockage de la donnée
- Fuites d'informations
- Évaluer les risques résiduels après l'application des mécanismes de défenses
- Evaluation de connaissance
- Connaissance générales liés aux modèles IA
- Durée : 14 heures
- Introduction aux différents modèles d'IA
- Développer des modèles d'IA en python
- Développer des réseaux de neurones
- Evaluation de connaissance
- Modélisation IA
- Durée : 8 heures
- Prise de recul par rapport à des cas d'usage
- Sensibilisation à l'ecoconception et au code optimisé
- Apprendre les bonnes pratiques pour gérer un projet d'IA
- Maîtriser les bases et les bibliothèques de Python pour l'IA
- Comprendre les objectifs et les domaines d'application de l'IA
- Intégration d'agents dans la conception
- Evaluation de connaissance
- Les Méthodes d'apprentissage
- Durée : 8 heures
- Maîtriser les environnements de développement
- L'optimisation du code
- Optimiser les méthodes d'apprentissage en fonction du jeu de donnée
- Evaluation de connaissance
- L'industrialisation et architecture
- Durée : 16 heures
- Introduction aux bonnes pratiques MLOps
- Exposer un modèle IA
- Maîtriser les techniques de versionnage et de mise en production des modèles
- Optimisation du cycle de vide des composents
- Intégrer les retours utilisateurs et les limites d'utilisations
- Évaluation de la qualité et de la pertinence des donnés
- Intégration et déploiement continue
- Evaluation de connaissance