R programmation Niveau 2, Utiliser R pour le data mining
Objectifs
- Le logiciel Open Source R propose une palette complète de modules permettant de couvrir la plupart des besoins en Data science
- Lors de la formation R niveau 1, nous avons abordé l’analyse de données sous R
- Cette seconde formation de trois jours vous permettra d’intégrer le logiciel R dans votre environnement et de l’utiliser comme une solution Data science la plus exhaustive possible en fonction de vos besoins
Programme
Rappels sur R
- Principe et Apports des techniques de Prévision
- Exemples d’application dans différents secteurs d’activités
- Les différents types de données pouvant être prises en compte dans les Prévisions pour augmenter la précision
La data science sous R
- Introduction : Différence entre machine learning et data mining
- Les différentes étapes d’un projet Datamining
Mise en place d’un projet data mining sous R et R studio
- Les données sous R : génération, importation (texte, dbf, excel, SAS, SPSS, mySQL, ODBC, …), manipulation (calculs simples et matriciels, découpages en classes, tri, …)
- Analyse exploratoire sous R : tableaux croisés, statistiques de bases, fonctions graphiques
- La modélisation sous R (avec utilisation de Rattle) : les régressions (dont logistiques), la segmentation, l’analyse d’associations, les arbres de décisions, l’algorithme génétique
- La validation : critères AIC, courbe de LIFT, de ROC …
- L’utilisation des modèles
- Mise en place de machine learning sous R : méthodes de boosting dont random forest, réseaux de neurones, SVM, …
Cas pratique
- Rappels sur le Scoring notamment sur le score d’appétence
- Contexte métier du projet
- Utilisation de R pour construire le score
- Définition de Best Practices
MOYENS PÉDAGOGIQUES ET TECHNIQUES D’ENCADREMENT DES FORMATIONS
Modalités pédagogiques :
- Évaluation des besoins et du profil des participants.
- Apport théorique et méthodologique : séquences pédagogiques regroupées en différents modules.
- Contenus des programmes adaptés en fonction des besoins identifiés pendant la formation.
- Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de travaux pratiques, étude de cas et mise en situation.
- Méthodes expositive, active et participative.
- Réflexion et échanges sur cas pratiques.
- Retours d'expériences.
- Corrections appropriées et contrôles des connaissances à chaque étape, fonction du rythme de l’apprenant mais également des exigences requises au titre de la formation souscrite.
Éléments matériels :
- Mise à disposition des outils nécessaires au bon déroulement des travaux pratiques.
- Support de cours au format numérique projeté sur écran et transmis au participant en fin de la formation.
Référent pédagogique et formateur :
- Chaque formation est sous la responsabilité du directeur pédagogique de l’organisme de formation.
- Le bon déroulement est assuré par le formateur désigné par l’organisme de formation.
MOYENS PERMETTANT LE SUIVI ET L’APPRÉCIATION DES RÉSULTATS
- Feuilles de présences signées des participants et du formateur par demi-journée.
- Attestation de fin de formation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation.
Please login to get access to the quiz
Back to Data Science