Data Science

Analyse des données non structurées texte

Objectifs

  • L’analyse textuelle permet de traiter de grandes quantités de données textuelles non structurées (corpus de documents)
  • Les méthodes d’analyse permettent de dégager et structurer le contenu d’un corpus, les principales thématiques pour trouver des informa

Programme

Pourquoi l’analyse textuelle ?
  • Le poids du texte dans l’entreprise, sur internet, dans les sites sociaux
  • Les objectifs de l’analyse textuelle
Méthodologie de l’analyse textuelle
  • Nettoyage du corpus
  • Tokenisation, i.e. découpage en mots-clés ou termes
  • Algorithme d’analyse : matrice de documents-termes, clustering, détection de topic (algorithmes K-means, CAH, LDA, pLSA, …)
  • Visualisation par word cloud, ...
Cas pratiques et best practises
Please login to get access to the quiz
Perform Cloud Data Science with Azure Machine Learning (Prev Lesson)
(Next Lesson) Statistiques, les bases avec Excel
Back to Data Science