Big Data Analytics

Environnement R, traitement de données et analyse statistique

Objectifs de la formation

  • Savoir installer et utiliser l'environnement d'analyse R
  • Savoir importer et exporter des données
  • Savoir reconnaître les différents types d'objets de R
  • Créer des programmes d'analyse avec R
  • Être en mesure de réaliser des analyses statistiques basiques avec R
  • Comprendre comment manipuler des données avec R
  • Savoir restituer des résultats à l'aide de graphiques


Programme de la formation

Introduction

  • Présentation du logiciel R et de ses fonctionnalités.
  • Avantages et inconvénients.
  • Accès au site de téléchargement de l'outil et installation.

Travaux pratiques

Installation de l'environnement d'analyse.

Premiers pas

  • Environnement de base (console, script).
  • Utilisation de la console.
  • Création et sauvegarde d'un script.
  • Le répertoire sous R Installation.
  • Aide et commentaires.
  • Les autres éditeurs Tinn-R et R Studio.

Travaux pratiques

Manipulations de la console. Ecriture de scripts.

Objets et notions de programmation R

  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d'objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.

Travaux pratiques

Ecriture de programmes R manipulant des types d’objets.

Création et utilisation de fonctions

  • Structure d'une fonction.
  • Fonctions de type mathématique.
  • Fonctions de type chaîne de caractères.
  • Fonctions liées au temps/date.
  • Opérations ensemblistes.
  • Les tables de contingences.

Travaux pratiques

Création de fonctions et utilisation de celles-ci dans les programmes R.

Génération, gestion et visualisation des données

  • Les données : séquences régulières et aléatoires.
  • Données exemples de R.
  • Importation et exportation de données.
  • Modifier les données d'un objet.
  • Exemples de graphiques construits avec R.
  • Création des graphiques de base.
  • Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique.

Travaux pratiques

Exercices d'application sur les données, restitution des résultats avec des graphiques.

Analyses statistiques

  • Présentation de la notion de package (librairie).
  • Télécharger/charger des packages.
  • Quelques packages utiles.
  • Cas de la régression linéaire multiple.
  • Cas de l'analyse en composantes principales ACP.
  • Cas de la classification CAH.

Travaux pratiques

Poursuite d’écriture de programmes statistiques, intégration des packages.

Please login to get access to the quiz
 Data Analytics avec Python (Prev Lesson)
(Next Lesson) Spark Avancé
Back to Big Data Analytics
Public

Ingénieurs, Data analysts, statisticiens, développeurs en environnement statistique ou toute personne intéressée par l'analyse statistique avec R.

Pré-requis

Être familier avec l'environnement Microsoft Windows et avoir des connaissances de base en statistiques.