Data Science

Modélisation statistique, l’essentiel

Objectifs de la formation

  • Connaître les fondamentaux de l'analyse statistique appliquée
  • Maîtriser l'utilisation des formules et tests statistiques fondamentaux
  • Savoir concevoir un rapport d'analyse basé sur les faits
  • Valider la précision d'une estimation, à l'aide des intervalles de confiance
  • Découvrir des outils comme R et Excel pour la mise en œuvre des modèles étudiés
  • Exploiter les paramètres statistiques pour comprendre une série de données
  • Être en mesure de prévoir les comportements à venir
  • Savoir vérifier l'adéquation à un modèle


Programme de la formation

Rappels des fondamentaux de la statistique descriptive

  • Définition de la statistique descriptive.
  • Analyse d'une population.
  • Méthodes d'échantillonnage.
  • Variables qualitatives et quantitatives.
  • Effectifs et calcul des fréquences.
  • Effectifs cumulés croissants et décroissants.
  • Représentation graphique des variables qualitatives et quantitatives.

Etude de cas

Application pratique sur excel d'analyses statistiques et interprétation

Démarche et modélisation d'une analyse statistique

  • Statistique descriptive.
  • Phase d'apprentissage.
  • Statistique prédictive pour estimer et anticiper.
  • Modélisation statistique d'un phénomène.

Paramètre de position et de dispersion

  • Mode, valeur modale, valeur la plus probable.
  • Moyenne d'une population (ou d'un échantillon).
  • Médiane, partager une série numérique.
  • Etendue, différence entre valeurs extrêmes.
  • Utiliser les quantiles.
  • Ecart-Type, calculer la dispersion d'un ensemble de données.
  • Calcul de la variance et de la covariance.

Etude de cas

Calcul de paramètres de position et de dispersion sur différents échantillonnages et comparaisons des résultats.

Tests et intervalle de confiance

  • Lois statistiques et intervalle de confiance.
  • Tests statistiques courants (Test de Student, Analyse de variances, Khi²).
  • Valider la précision d'une estimation. Amplitude de l'intervalle.

Etude de cas

Exercices sur le logiciel R.

Panorama des outils

  • Zoom sur le logiciel Open Source "R".
  • Initiation au logiciel Open Source "R".

Travaux pratiques

Utilisation de packages pour faire les analyses statistiques.

Please login to get access to the quiz
Python Data Science, manipuler et visualiser les données (Prev Lesson)
(Next Lesson) Data Science, les fondamentaux
Back to Data Science