Data Mining et Machine Learning
Objectifs
- Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
- Savoir transformer un gros volumes de données à priori hétérogène en information utile
- Maîtriser l’utilisation d’algorithmes d’auto-apprentissage adaptés à une solution d’analyse
- Comprendre comment exploiter de gros volumes de données textuelles
- Être capable d’appliquer ces différentes techniques aux projets Big Data
Programme
Introduction
- Data Mining vs Big Data
- Data Mining vs Machine Learning vs Deep Learning
- Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage
Ingénierie de la décision
- Analyse procédurale hiérarchique
- Problème d’association stable (algorithme de Lloy Shaply)
- Chaîne de Markov discrète (DTMC)
- Jeu d’entraînement et jeu de test
Sélection d’instances
- Échantillonnage balancé
- Échantillonnage stratifié (probabilité non égales)
Data Mining (fouille de données)
- Analyse en composantes principales
- Analyse d’affinité
- Agglomération hiérarchique et dendrogrammes
- Bagging de dendrogrammes (bootstrop aggregating)
- Positionnement multidimensionnel
- K-means
- SVM (Support Vector Machines)
Machine Learning
- Régression logistique binaire
- GLM
- One-R (technique de règle unique de regroupement)
- Regroupement ID-3
- Liste de décision
- Regroupement par régression d’arbres (CRT)
- Arbres aléatoires (CRT bootstrap)
- K plus proches voisins (K-NN)
- Classification bayésienne naïve
- Détections automatiques d’interactions par le chi-2 (CHAID)
- Analyse discriminante linéaire et quadratique (LDA/QDA)
- Réseaux de neurones
Text Mining
- Analyse statistique de corpus
- Détection automatique de langues
- Noms/Prénoms et détection automatique de genres
- Nuage de mots
- Table de contingence de mots
- Matrice d’adjacence de mots dans un corpus
- Exploration dynamique d’un graphe connexe de mots
- Analyse de sentiments
- Analyse Sémantique Latente (LSA)
Big Data
- Gestion de gros volumes de données
MOYENS PÉDAGOGIQUES ET TECHNIQUES D’ENCADREMENT DES FORMATIONS
Modalités pédagogiques :
- Évaluation des besoins et du profil des participants.
- Apport théorique et méthodologique : séquences pédagogiques regroupées en différents modules.
- Contenus des programmes adaptés en fonction des besoins identifiés pendant la formation.
- Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de travaux pratiques, étude de cas et mise en situation.
- Méthodes expositive, active et participative.
- Réflexion et échanges sur cas pratiques.
- Retours d'expériences.
- Corrections appropriées et contrôles des connaissances à chaque étape, fonction du rythme de l’apprenant mais également des exigences requises au titre de la formation souscrite.
Éléments matériels :
- Mise à disposition des outils nécessaires au bon déroulement des travaux pratiques.
- Support de cours au format numérique projeté sur écran et transmis au participant en fin de la formation.
Référent pédagogique et formateur :
- Chaque formation est sous la responsabilité du directeur pédagogique de l’organisme de formation.
- Le bon déroulement est assuré par le formateur désigné par l’organisme de formation.
MOYENS PERMETTANT LE SUIVI ET L’APPRÉCIATION DES RÉSULTATS
- Feuilles de présences signées des participants et du formateur par demi-journée.
- Attestation de fin de formation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation.
Please login to get access to the quiz
Back to Big Data