Solutions Bigdata avec Microsoft

Réaliser des analyses Big Data avec Microsoft R

Objectifs

  • Pouvoir expliquer comment Microsoft R Server et Microsoft R Client fonctionnent
  • Apprendre à utiliser R Client avec R Server pour explorer des données contenues dans différents magasins de données
  • Être capable de visualiser les données en utilisant des graphiques
  • Comprendre comment transformer et nettoyer des ensembles de données
  • Savoir mettre en oeuvre des options pour diviser les travaux d'analyse en tâches parallèles
  • Pouvoir construire et évaluer les modèles de régression générés à partir des données
  • Être en mesure de créer, marquer et déployer des modèles de partition générés à partir de données
  • Apprendre à utiliser R dans les environnements SQL Server et Hadoop

Programme

Microsoft R Server et R Client
  • Qu'est-ce qu'un serveur Microsoft R
  • Utilisation du client Microsoft R
  • Les fonctions ScaleR
Explorer de grandes données
  • Comprendre les sources de données ScaleR
  • Lecture de données dans un objet XDF
  • Résumer des données dans un objet XDF
Visualisation d'un grand nombre de données
  • Visualisation des données en mémoire
  • Visualisation d'un grand nombre de données
Traitement d'un grand nombre de données
  • Transformer un grand nombre de données
  • Gestion d'un ensemble de données
Opérations d'analyse en parallèle
  • Utilisation du contexte de calcul RxLocalParallel avec rxExec
  • Utilisation du package revoPemaR
Création et évaluation de modèles de régression
  • Clustering Big Data
  • Générer des modèles de régression et faire des prédictions
Création et évaluation de modèles de partitionnement
  • Création de modèles de partitionnement basés sur des arbres de décision
  • Tester les modèles de partitionnement en effectuant et en comparant des prédictions
Traitement d'un grand nombre de données dans SQL Server et Hadoop
  • Utilisation de R dans SQL Server
  • Utilisation de Hadoop Map / Reduce
  • Utilisation de Hadoop Spark
Please login to get access to the quiz
(Next Lesson) Réaliser de l’ingénierie de données avec Microsoft HDInsight
Back to Solutions Bigdata avec Microsoft
Public

Toute personne qui souhaite analyser de grands ensembles de données dans un environnement Big DataDéveloppeur qui doit intégrer les analyses R dans ses solutions

Pré-requis

Avoir suivi la formation ""Les fondamentaux de l'analyse statistique avec R"" ou disposer des connaissances équivalentes