Big Data

Data Mining et Machine Learning

Objectifs

  • Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
  • Savoir transformer un gros volumes de données à priori hétérogène en information utile
  • Maîtriser l’utilisation d’algorithmes d’auto-apprentissage adaptés à une solution d’analyse
  • Comprendre comment exploiter de gros volumes de données textuelles
  • Être capable d’appliquer ces différentes techniques aux projets Big Data

Programme

Introduction
  • Data Mining vs Big Data
  • Data Mining vs Machine Learning vs Deep Learning
  • Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage
Ingénierie de la décision
  • Analyse procédurale hiérarchique
  • Problème d’association stable (algorithme de Lloy Shaply)
  • Chaîne de Markov discrète (DTMC)
  • Jeu d’entraînement et jeu de test
Sélection d’instances
  • Échantillonnage balancé
  • Échantillonnage stratifié (probabilité non égales)
Data Mining (fouille de données)
  • Analyse en composantes principales
  • Analyse d’affinité
  • Agglomération hiérarchique et dendrogrammes
  • Bagging de dendrogrammes (bootstrop aggregating)
  • Positionnement multidimensionnel
  • K-means
  • SVM (Support Vector Machines)
Machine Learning
  • Régression logistique binaire
  • GLM
  • One-R (technique de règle unique de regroupement)
  • Regroupement ID-3
  • Liste de décision
  • Regroupement par régression d’arbres (CRT)
  • Arbres aléatoires (CRT bootstrap)
  • K plus proches voisins (K-NN)
  • Classification bayésienne naïve
  • Détections automatiques d’interactions par le chi-2 (CHAID)
  • Analyse discriminante linéaire et quadratique (LDA/QDA)
  • Réseaux de neurones
Text Mining
  • Analyse statistique de corpus
  • Détection automatique de langues
  • Noms/Prénoms et détection automatique de genres
  • Nuage de mots
  • Table de contingence de mots
  • Matrice d’adjacence de mots dans un corpus
  • Exploration dynamique d’un graphe connexe de mots
  • Analyse de sentiments
  • Analyse Sémantique Latente (LSA)
Big Data
  • Gestion de gros volumes de données
MOYENS PÉDAGOGIQUES ET TECHNIQUES D’ENCADREMENT DES FORMATIONS

Modalités pédagogiques :

  • Évaluation des besoins et du profil des participants.
  • Apport théorique et méthodologique : séquences pédagogiques regroupées en différents modules.
  • Contenus des programmes adaptés en fonction des besoins identifiés pendant la formation.
  • Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de travaux pratiques, étude de cas et mise en situation.
  • Méthodes expositive, active et participative.
  • Réflexion et échanges sur cas pratiques.
  • Retours d'expériences.
  • Corrections appropriées et contrôles des connaissances à chaque étape, fonction du rythme de l’apprenant mais également des exigences requises au titre de la formation souscrite.

Éléments matériels :

  • Mise à disposition des outils nécessaires au bon déroulement des travaux pratiques.
  • Support de cours au format numérique projeté sur écran et transmis au participant en fin de la formation.

Référent pédagogique et formateur :

  • Chaque formation est sous la responsabilité du directeur pédagogique de l’organisme de formation.
  • Le bon déroulement est assuré par le formateur désigné par l’organisme de formation.
MOYENS PERMETTANT LE SUIVI ET L’APPRÉCIATION DES RÉSULTATS
  • Feuilles de présences signées des participants et du formateur par demi-journée.
  • Attestation de fin de formation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation.
Please login to get access to the quiz
Big Data Foundation Certifiant (Prev Lesson)
(Next Lesson) NoSQL – Introduction
Back to Big Data
Public

<li>Ingénieurs, analystes, responsables marketing</li><li>Data Analysts, Data Scientists, Data Steward</li><li>Toute personne intéressée par les techniques de Data Mining et de Learning Machine</li>

Pré-requis

Connaître l’utilité du Data Mining et les problématiques du Big Data dans le ciblage économique

Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en effectuant le test disponible en bas de cette page.

Lieu de formation

Intra-entreprise/à distance

Dates ou période

À définir. Nous consulter

Tarif

Sur devis. Merci de nous contacter

Modalités

Pour s’inscrire à notre formation, veuillez nous contacter par mail ou téléphone.

Démarrage de la formation sous deux semaines (délai indicatif).

Nous contacer
Informations complémentaires

Pour toute réclamation, aléas ou difficultés rencontrés pendant la formation, veuillez prendre contact avec notre organisme par téléphone ou par e-mail. Nous mettrons tout en œuvre pour trouver une solution adapter.

Formation synchrone, réalisée à distance en visioconférence via l’application Microsoft Teams ou en présentiel dans les locaux du client.

Sur le même thème