Description
Le programme de formation sur les fondamentaux de la recherche d'information aborde des concepts essentiels tels que la recherche d'information sur le web et en entreprise, les modèles booléens et vectoriels, ainsi que l'indexation des données. Les participants découvriront également l'état de l'art des moteurs de recherche, en se concentrant sur des solutions open source comme Apache Lucene et Solr. Ce cursus vise les professionnels souhaitant maîtriser les techniques d'indexation et de recherche, tout en optimisant les performances des systèmes de recherche.
Objectifs
- Démarrer un projet de recherche d'information
- Modéliser les unités d'indexation
- Développer les services de recherche
- Analyser les performances de votre moteur de recherche
- Déployer le moteur de recherche suivant différentes topologies
Récapitulatif
Public
Architectes et développeurs
Prérequis
Avoir une expérience de développement informatique
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Fondamentaux de la recherche d'information (RI)
- Définitions
- RI Web vs RI Entreprise
- Concepts de base
- Structure et construction de l'index
- Modèle booléenne de recherche d'information
- Recherche ordonnée
- Modèle vectoriel de recherche d'information
Indexation du web - un état de l'art
- Historique de l'innovation des principaux moteurs de recherche
- Organisation des documents du Web
- Construction du dictionnaire des termes
- Stockage de l'index
- Répondre à une requête de l'utilisateur
- Mise à l'échelle du moteur de recherche
- Le cas Google Search Engine
Solutions open source Lucene / Solr
- Présentation de la librairie Apache Lucene
- Présentation du serveur Apache Solr
Indexation avec Solr
- Structure du répertoire d'installation de Solr
- Comprendre le concept Solr Core
- Les fichiers de configuration
- Schéma des documents et analyse des textes
- Les modes de communication avec Solr
- Le framework Data Import Handler (DIH) de Solr
- Indexer les fichiers avec Solr Cell
Recherche avec Solr
- Les paramètres de recherche
- La syntaxe des requêtes
- Parseur de requête Lucene vs parseur de requête Dismax
- Recherche géospatiale
- Influencer la pertinence des résultats
- Recherche par facettes pour une meilleure expérience de l'utilisateur
- Les composants Highlight et MoreLikeThis
- Aller au-delà de la recherche par mots-clés
Mise à l'échelle de Solr
- Evaluer les performances de Solr avec SolrMeter
- Optimiser une instance unique de Solr
- Passer à plusieurs serveurs avec Solr Replication et/ou Solr Cloud