R programmation Niveau 2, Utiliser R pour le data mining
Objectifs
- Le logiciel Open Source R propose une palette complète de modules permettant de couvrir la plupart des besoins en Data science
- Lors de la formation R niveau 1, nous avons abordé l’analyse de données sous R
- Cette seconde formation de trois jours vous permettra d’intégrer le logiciel R dans votre environnement et de l’utiliser comme une solution Data science la plus exhaustive possible en fonction de vos besoins
Programme
Rappels sur R
- Principe et Apports des techniques de Prévision
- Exemples d’application dans différents secteurs d’activités
- Les différents types de données pouvant être prises en compte dans les Prévisions pour augmenter la précision
La data science sous R
- Introduction : Différence entre machine learning et data mining
- Les différentes étapes d’un projet Datamining
Mise en place d’un projet data mining sous R et R studio
- Les données sous R : génération, importation (texte, dbf, excel, SAS, SPSS, mySQL, ODBC, …), manipulation (calculs simples et matriciels, découpages en classes, tri, …)
- Analyse exploratoire sous R : tableaux croisés, statistiques de bases, fonctions graphiques
- La modélisation sous R (avec utilisation de Rattle) : les régressions (dont logistiques), la segmentation, l’analyse d’associations, les arbres de décisions, l'algorithme génétique
- La validation : critères AIC, courbe de LIFT, de ROC …
- L’utilisation des modèles
- Mise en place de machine learning sous R : méthodes de boosting dont random forest, réseaux de neurones, SVM, …
Cas pratique
- Rappels sur le Scoring notamment sur le score d’appétence
- Contexte métier du projet
- Utilisation de R pour construire le score
- Définition de Best Practices
Please login to get access to the quiz
Back to Data Science