Les fondamentaux de l’analyse statistique avec R
Objectifs
- Savoir installer R
- Comprendre comment manipuler des données avec R
- Savoir importer et exporter des données
- Etre en mesure de réaliser des analyses statistiques basiques avec R
- Savoir restituer des résultats à l'aide de graphiques
Programme
Introduction
- Qu'est ce que R
- Avantages et inconvénients
- Solutions concurrentes gratuites ou payantes
Installation
- Installation de R ou Microsoft R Open sur MS Windows ou Scientific Linux
- Découverte de l’environnement
- Utiliser l’historique des commandes
- Exemple d’environnement superposé (R-Studio)
- Comment citer le logiciel dans une publication scientifique
- Comment citer des packages dans une publication scientifique
Utilisation
- Vider la console de commande
- Utilisation de l’aide
- Changer la langue de l’interface
- Quitter en ligne de commande
- Changer le dossier de travail par défaut temporairement ou à chaque session (*.Rprofile)
- Changer définitivement le dossier par défaut des packages (*.Rprofile)
- Sauver/Charger l’espace de travail (*.Rdata)
- Sauver/Charger/Exécuter un historique des commandes (*.Rhistory)
- Sauver les commandes et sorties dans un fichier (*.txt)
- Sauver/Charger un script (*.R)
Manipulation de packages
- Installer/Désinstaller/Mettre à jour des packages
- Obtenir des informations systèmes sur les packages
- Écrire plusieurs commandes sur une ligne
- Ajouter des commentaires
Types de données
- Manipulations de scalaires (réels)
- Manipulations de nombres complexes
- Manipulations de variables
- Manipulations de vecteurs
- Manipulations de matrices
- Manipulations de textes
- Manipulations de dates et de durées
- Création/Édition de données en ligne de commande
- Gérer les variables dans la mémoire
Import et export de données
- Importer/Exporter des données d’Excel
- Importer/Exporter des données en *.csv et gestion du passage d’encodageLinux/Windows
- Importer/Exporter des fichiers SAS
- Importer des données *.csv du web
- Fusionner des fichiers *.csv
- Importer de données de MS Access
- Importer des données *.xml du web
- Importer des données de MySQL
- Importer des données d’Oracle (Express)
- Importer des fichiers *.json
Manipulation de données
- Utiliser le SQL
- Quelques Data set
- Manipuler les data frames
- Accélérer l’accès au colonnes
- Renommer les colonnes
- Appliquer des rangs
- Trier des données
- Filtrer des données
- Réaliser des sous-sélections
- Fusionner des données
- Supprimer les doublons
- Échantillonnage
- Empiler/Désempiler des données
Analyse de données
- Synthétiser des données (tables de contingence)
- Travailler avec des valeurs absentes
- Définir le nombre de décimales de chaque sortie
- Générer des variables pseudo-aléatoires
- Statistiques descriptives simples (comptage, éléments uniques, moyenne, max, min, centiles, somme, écart-type biaisé/non biaisé, cv, médiane, etc.)
- Plotter (tracer) des fonctions algébriques
- Racines d’équations univariées
- Intégration numérique
- Intégration algébrique
- Dérivation algébrique/numérique
- Optimisation linéaire uni ou multidimensionnelle
- Optimisation sous contrainte
- Programmation linéaire
Please login to get access to the quiz
Back to Solutions Bigdata avec Microsoft