Data Science

R programmation Niveau 2, Utiliser R pour le data mining

Objectifs

  • Le logiciel Open Source R propose une palette complète de modules permettant de couvrir la plupart des besoins en Data science
  • Lors de la formation R niveau 1, nous avons abordé l’analyse de données sous R
  • Cette seconde formation de trois jours vous permettra d’intégrer le logiciel R dans votre environnement et de l’utiliser comme une solution Data science la plus exhaustive possible en fonction de vos besoins

Programme

Rappels sur R
  • Principe et Apports des techniques de Prévision
  • Exemples d’application dans différents secteurs d’activités
  • Les différents types de données pouvant être prises en compte dans les Prévisions pour augmenter la précision
La data science sous R
  • Introduction : Différence entre machine learning et data mining
  • Les différentes étapes d’un projet Datamining
Mise en place d’un projet data mining sous R et R studio
  • Les données sous R : génération, importation (texte, dbf, excel, SAS, SPSS, mySQL, ODBC, …), manipulation (calculs simples et matriciels, découpages en classes, tri, …)
  • Analyse exploratoire sous R : tableaux croisés, statistiques de bases, fonctions graphiques
  • La modélisation sous R (avec utilisation de Rattle) : les régressions (dont logistiques), la segmentation, l’analyse d’associations, les arbres de décisions, l'algorithme génétique
  • La validation : critères AIC, courbe de LIFT, de ROC …
  • L’utilisation des modèles
  • Mise en place de machine learning sous R : méthodes de boosting dont random forest, réseaux de neurones, SVM, …
Cas pratique
  • Rappels sur le Scoring notamment sur le score d’appétence
  • Contexte métier du projet
  • Utilisation de R pour construire le score
  • Définition de Best Practices
Machine Leaning, les fondamentaux (Prev Lesson)
(Formation suivante) IBM SPSS modeler niveau 2 _ modélisation
Retour à Data Science

Pas de commentaires

Donner un commentaire