Data Science

Statistiques, les bases avec Excel

Objectifs

  • Python est aujourd’hui devenu un incontournable dans le développement de projet en data science
  • Cette seconde formation abordera toutes les étapes de la Data Science depuis la récupération de données jusqu’à la mise en place opérationnelle

Programme

La manipulation des données
  • Import de données : importation / exportation de fichiers texte délimités, requêtes sur SGBD et sur Internet
  • La base de données sous Excel et les manipulations possibles (BDSOMME, BDMAX, BDMIN, BDMOYENNE, BDPRODUIT, BDNB, BDNBVAL, BDLIRE)
  • Notion de matrice sous Excel et manipulation de matrice (TRANSPOSE, PRODUITMAT, INVERSEMAT, FREQUENCE, utilisation de conditions dans une matrice)
  • D’autres fonctions utiles de manipulation : RECHERCHEV et RECHERCHEH, NB.SI, SOMME.SI, INDEX, EQUIV, INDIRECT
L’exploration de données
  • Les tableaux croisés dynamiques
  • Les statistiques de base
  • Les graphiques complexes
L’analyse de données / modélisation
  • Tests statistiques et affectation d’une série de données à une loi
  • Liaison entre variables : corrélation, régression
  • Traitement des chroniques et prévision
  • Optimisation d’une fonction sous contrainte : programmation linéaire première, deuxième et troisième catégorie
Cas pratique
Analyse des données non structurées texte (Prev Lesson)
(Formation suivante) Python Niveau 1, les bases
Retour à Data Science

Pas de commentaires

Donner un commentaire