Introduction au NLP (traitement automatique du langage) avec Python

2.2 (4 avis)

Découvrez les fondamentaux du traitement du langage naturel (NLP) avec Python.

Partager cette formation :

4 jours (28 heures)

Référence :

MOD_2024518

Formation Inter

3950 € ^HT

4 jours (28 heures)

Référence :

MOD_2024518

Formation Intra

Description Récapitulatif Programme détaillé

Description

Ce programme de formation en traitement du langage naturel (NLP) vise à initier les participants aux concepts fondamentaux et aux applications pratiques du NLP, notamment à travers des outils comme Python et ses bibliothèques. Les apprenants découvriront la préparation des données textuelles, la représentation vectorielle, ainsi que des techniques de classification et d'analyse de sentiments. Destiné aux professionnels et étudiants intéressés par l'intelligence artificielle et l'analyse de données, le programme inclut des projets pratiques pour renforcer l'apprentissage et une introduction aux modèles avancés tels que les réseaux de neurones.

Récapitulatif

Public

Développeurs, data scientists et professionnels du domaine de l'intelligence artificielle intéressés par l'apprentissage des bases du traitement automatique du langage naturel (NLP) avec Python

Prérequis

Maitrise avancée de la programmation Python
Connaissance approfondie du machine learning
Connaissance de statistiques et d'algorithmique
Intérêt pour le traitement des données textuelles

Méthodes et modalités pédagogiques

Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.

Moyens et supports pédagogiques

Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation

Modalités de suivi et d'évaluations

Auto-positionnement des stagiaires avant la formation

Émargement des stagiaires et formateur par 1/2 journée

Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires

Auto-évaluation des acquis de la formation par les stagiaires

Questionnaire de satisfaction à chaud et à froid à l'issue de la formation

Programme détaillé

Présentation du NLP et de ses applications

Définition et enjeux du NLP
Son importance dans diverses applications
Exemples d'applications : chatbots, analyse de sentiments...
Exploration de cas concrets où le NLP est utilisé

Prise en main de Python et de ses librairies pour le NLP

Installation de Python, NLTK, SpaCy : Guide étape par étape pour installer Python et les principales bibliothèques NLP
Bases de la manipulation de texte en Python
Introduction aux manipulations de base de texte en utilisant Python

Préparation des données textuelles

Problématiques de format, d'encodage
Défis liés aux formats et à l'encodage des données textuelles
Segmentation en phrases et en mots
Techniques pour segmenter du texte en phrases et en mots
Nettoyage : suppression des stopwords, stemming, lemmatisation
Méthodes pour nettoyer le texte, y compris la suppression des stopwords, le stemming et la lemmatisation
Projet pratique : nettoyage et préparation d'un corpus de textes

Limites des approches symboliques

Sacs de mots et pondération TF-IDF : Introduction aux sacs de mots et à la pondération TF-IDF pour représenter le texte
Création de représentations vectorielles simples
Techniques pour créer des représentations vectorielles de base du texte
Mesure de la similarité entre documents

Représentations distribuées : Word2Vec

Principe des plongements lexicaux (word embeddings)
Explication des plongements lexicaux et leur importance
Entraînement de word2vec sur un corpus : Guide pratique pour entraîner le modèle word2vec
Exploration des analogies et des similarités générées par word2vec
Projet pratique : analyse de similarité dans des descriptions de films en utilisant des descriptions de films

Classification de documents

Représentation par sacs de mots : Utilisation des sacs de mots pour représenter des documents
Entraînement de classifieurs (Naive Bayes, régression logistique)
Entraînement de modèles de classification comme Naive Bayes et la régression logistique
Techniques pour évaluer les performances des modèles de classification

Analyse de sentiments

Approches lexicales et par apprentissage
Introduction aux approches lexicales et basées sur l'apprentissage pour l'analyse de sentiments
Détection de la polarité et des émotions
Méthodes pour détecter la polarité et les émotions dans le texte
Projet pratique : classification de critiques de films positives/négatives

Reconnaissance d'entités nommées

Détection de personnes, lieux, organisations... : Techniques pour détecter les entités nommées dans le texte
Utilisation des bibliothèques NLTK et SpaCy pour la reconnaissance des entités nommées

Extraction de relations entre entités

Patrons syntaxiques simples : Utilisation de patrons syntaxiques pour extraire des relations entre entités
Visualisation de graphes de relations
Techniques pour visualiser les relations entre entités sous forme de graphes
Projet pratique : extraction d'informations à partir de descriptions de produits à partir de descriptions de produits

Projet final et introduction aux modèles avancés

Collecte de données sur Twitter
Préparation des données et extraction des caractéristiques nécessaires
Entraînement de divers modèles de classification
Techniques pour interpréter les résultats obtenus

Présentation des modèles avancés

Réseaux de neurones récurrents (RNN, LSTM)
Introduction aux réseaux de neurones récurrents et aux LSTM
Transformers et modèles pré-entraînés (BERT)
Présentation des transformers et des modèles pré-entraînés comme BERT
Application au résumé automatique et au question-answering : Exploration des applications avancées telles que le résumé automatique et le question-answering

Conclusion et perspectives

Récapitulatif des principaux concepts couverts pendant la formation
Suggestions de ressources pour approfondir les connaissances en NLP

Toutes les formations

Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Programmation Python (préparation des pré-requis au développement d'IA)

Maîtrisez les bibliothèques incontournables de l’écosystème Python pour analyser, visualiser et exploiter efficacement les données.

5 jours

En savoir plus
Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Programmation SQL

Maîtrisez les bases des données et SQL grâce à une formation complète, alliant théorie et pratique.

5 jours

En savoir plus
Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Programmation R

Maîtrisez le langage R à travers une formation complète, abordant de l'importation de données à la visualisation, en passant par les statistiques et le machine…

5 jours

En savoir plus
Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Introduction au Machine Learning non supervisé appliqué au business : clustering et knn

Maîtrisez le machine learning non supervisé avec des concepts clés, des algorithmes en Python, et des cas pratiques comme la segmentation client.

2 jours

En savoir plus
Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Introduction aux modèles de machine learning supervisé : régressions et classification

Maîtrisez les fondamentaux de la régression et de la classification en machine learning.

3 jours

En savoir plus
Intelligence Artificielle, Data Intelligence Artificielle Machine Learning, Deep Learning

Python, web scraping et extraction de données

Structurez et industrialisez vos collectes de données pour produire des datasets exploitables.

4 jours

En savoir plus

Les données saisies dans ce formulaire sont conservées par nos soins afin de pouvoir répondre au mieux à votre demande. Nous accordons de l’importance à la gestion de vos données, en savoir plus sur notre démarche Données Personnelles.

Introduction au NLP (traitement automatique du langage) avec Python

Description