Data Mining et Machine Learning
Objectifs
- Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
- Savoir transformer un gros volumes de données à priori hétérogène en information utile
- Maîtriser l’utilisation d’algorithmes d'auto-apprentissage adaptés à une solution d'analyse
- Comprendre comment exploiter de gros volumes de données textuelles
- Être capable d'appliquer ces différentes techniques aux projets Big Data
Programme
Introduction
- Data Mining vs Big Data
- Data Mining vs Machine Learning vs Deep Learning
- Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage
Ingénierie de la décision
- Analyse procédurale hiérarchique
- Problème d’association stable (algorithme de Lloy Shaply)
- Chaîne de Markov discrète (DTMC)
- Jeu d’entraînement et jeu de test
Sélection d’instances
- Échantillonnage balancé
- Échantillonnage stratifié (probabilité non égales)
Data Mining (fouille de données)
- Analyse en composantes principales
- Analyse d'affinité
- Agglomération hiérarchique et dendrogrammes
- Bagging de dendrogrammes (bootstrop aggregating)
- Positionnement multidimensionnel
- K-means
- SVM (Support Vector Machines)
Machine Learning
- Régression logistique binaire
- GLM
- One-R (technique de règle unique de regroupement)
- Regroupement ID-3
- Liste de décision
- Regroupement par régression d’arbres (CRT)
- Arbres aléatoires (CRT bootstrap)
- K plus proches voisins (K-NN)
- Classification bayésienne naïve
- Détections automatiques d’interactions par le chi-2 (CHAID)
- Analyse discriminante linéaire et quadratique (LDA/QDA)
- Réseaux de neurones
Text Mining
- Analyse statistique de corpus
- Détection automatique de langues
- Noms/Prénoms et détection automatique de genres
- Nuage de mots
- Table de contingence de mots
- Matrice d’adjacence de mots dans un corpus
- Exploration dynamique d’un graphe connexe de mots
- Analyse de sentiments
- Analyse Sémantique Latente (LSA)
Big Data
- Gestion de gros volumes de données
Please login to get access to the quiz
Back to Big Data