Le logiciel Open Source R propose une palette complète de modules permettant de couvrir la plupart des besoins en Data science
Lors de la formation R niveau 1, nous avons abordé l’analyse de données sous R
Cette seconde formation de trois jours vous permettra d’intégrer le logiciel R dans votre environnement et de l’utiliser comme une solution Data science la plus exhaustive possible en fonction de vos besoins
Programme
Rappels sur R
Principe et Apports des techniques de Prévision
Exemples d’application dans différents secteurs d’activités
Les différents types de données pouvant être prises en compte dans les Prévisions pour augmenter la précision
La data science sous R
Introduction : Différence entre machine learning et data mining
Les différentes étapes d’un projet Datamining
Mise en place d’un projet data mining sous R et R studio
Les données sous R : génération, importation (texte, dbf, excel, SAS, SPSS, mySQL, ODBC, …), manipulation (calculs simples et matriciels, découpages en classes, tri, …)
Analyse exploratoire sous R : tableaux croisés, statistiques de bases, fonctions graphiques
La modélisation sous R (avec utilisation de Rattle) : les régressions (dont logistiques), la segmentation, l’analyse d’associations, les arbres de décisions, l'algorithme génétique
La validation : critères AIC, courbe de LIFT, de ROC …
L’utilisation des modèles
Mise en place de machine learning sous R : méthodes de boosting dont random forest, réseaux de neurones, SVM, …
Cas pratique
Rappels sur le Scoring notamment sur le score d’appétence
Pas de commentaires