Data Science

Analyse des données non structurées texte

Objectifs

  • L’analyse textuelle permet de traiter de grandes quantités de données textuelles non structurées (corpus de documents)
  • Les méthodes d’analyse permettent de dégager et structurer le contenu d’un corpus, les principales thématiques pour trouver des informa

Programme

Pourquoi l’analyse textuelle ?
  • Le poids du texte dans l’entreprise, sur internet, dans les sites sociaux
  • Les objectifs de l’analyse textuelle
Méthodologie de l’analyse textuelle
  • Nettoyage du corpus
  • Tokenisation, i.e. découpage en mots-clés ou termes
  • Algorithme d’analyse : matrice de documents-termes, clustering, détection de topic (algorithmes K-means, CAH, LDA, pLSA, …)
  • Visualisation par word cloud, ...
Cas pratiques et best practises
Perform Cloud Data Science with Azure Machine Learning (Prev Lesson)
(Formation suivante) Statistiques, les bases avec Excel
Retour à Data Science

Pas de commentaires

Donner un commentaire