Big Data

Data Mining et Machine Learning

Objectifs

  • Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
  • Savoir transformer un gros volumes de données à priori hétérogène en information utile
  • Maîtriser l’utilisation d’algorithmes d'auto-apprentissage adaptés à une solution d'analyse
  • Comprendre comment exploiter de gros volumes de données textuelles
  • Être capable d'appliquer ces différentes techniques aux projets Big Data

Programme

Introduction
  • Data Mining vs Big Data
  • Data Mining vs Machine Learning vs Deep Learning
  • Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage
Ingénierie de la décision
  • Analyse procédurale hiérarchique
  • Problème d’association stable (algorithme de Lloy Shaply)
  • Chaîne de Markov discrète (DTMC)
  • Jeu d’entraînement et jeu de test
Sélection d’instances
  • Échantillonnage balancé
  • Échantillonnage stratifié (probabilité non égales)
Data Mining (fouille de données)
  • Analyse en composantes principales
  • Analyse d'affinité
  • Agglomération hiérarchique et dendrogrammes
  • Bagging de dendrogrammes (bootstrop aggregating)
  • Positionnement multidimensionnel
  • K-means
  • SVM (Support Vector Machines)
Machine Learning
  • Régression logistique binaire
  • GLM
  • One-R (technique de règle unique de regroupement)
  • Regroupement ID-3
  • Liste de décision
  • Regroupement par régression d’arbres (CRT)
  • Arbres aléatoires (CRT bootstrap)
  • K plus proches voisins (K-NN)
  • Classification bayésienne naïve
  • Détections automatiques d’interactions par le chi-2 (CHAID)
  • Analyse discriminante linéaire et quadratique (LDA/QDA)
  • Réseaux de neurones
Text Mining
  • Analyse statistique de corpus
  • Détection automatique de langues
  • Noms/Prénoms et détection automatique de genres
  • Nuage de mots
  • Table de contingence de mots
  • Matrice d’adjacence de mots dans un corpus
  • Exploration dynamique d’un graphe connexe de mots
  • Analyse de sentiments
  • Analyse Sémantique Latente (LSA)
Big Data
  • Gestion de gros volumes de données
Please login to get access to the quiz
Big Data Foundation Certifiant (Prev Lesson)
(Next Lesson) NoSQL – Introduction
Back to Big Data