Description
Ce programme de formation sur l'environnement R vise à initier les participants aux fondamentaux du logiciel R, en abordant ses fonctionnalités, son installation et son interface. Les notions principales incluent la manipulation d'objets, la création de fonctions, ainsi que la gestion et la visualisation des données. Les participants apprendront également à réaliser des analyses statistiques à l'aide de packages spécifiques. Ce cours s'adresse principalement aux débutants souhaitant acquérir des compétences en programmation R pour des applications en analyse de données et statistiques.
Objectifs
- Installer l'environnement d'analyse R
- Utiliser la console de R, et les environnements de travail Tinn-R et R Studio
- Créer et regrouper plusieurs types d'objets de R
- Créer des programmes d'analyse avec R
- Elaborer des graphiques avec R
- Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques
Récapitulatif
Public
Statisticiens
Analystes type Data Miner
Acteurs impliqués dans l'analyse/fouille des données
Prérequis
Connaissances de base en statistiques (régressions, analyse en composantes principales, classification) et des concepts de programmation
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Environnement R : introduction
- Présentation du logiciel R et de ses fonctionnalités
- Avantages et inconvénients
- Accès au site de téléchargement de l'outil et installation
- Environnement de base (console, script)
- Utilisation de la console
- Création et sauvegarde d'un script
- Le répertoire sous R Installation
- Aide et commentaires
- Les autres éditeurs Tinn-R et R Studio
Objets et notions de programmation R
- Les objets de type vecteurs, matrix, array, factor, dataframe, list
- Manipulation des objets, classe d'objet, fonctions spécifiques, jointure
- Sauvegarde, suppression de mémoire
- Notions de boucle (for et while), condition (if), switch
Création et utilisation de fonctions
- Structure d'une fonction
- Fonctions de type mathématique
- Fonctions de type chaîne de caractères
- Fonctions liées au temps/date
- Opérations ensemblistes
- Les tables de contingences
Génération, gestion et visualisation des données
- Les données : séquences régulières et aléatoires
- Données exemples de R
- Importation et exportation de données
- Modifier les données d'un objet
- Exemples de graphiques construits avec R
- Création des graphiques de base
- Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique
Analyses statistiques
- Présentation de la notion de package (librairie)
- Télécharger/charger des packages
- Quelques packages utiles
- Cas de la régression non linéaire multiple
- Cas de l'analyse en composantes principales ACP
- Cas de la classification CAH