Big Data

Big data : passer de la donnée brute à la décision stratégique

Objectifs de la formation

  • Comprendre les concepts et l’apport du big data par rapport aux enjeux métiers
  • Comprendre l’écosystème technologique nécessaire pour réaliser un projet big data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d’analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques


Programme de la formation

Comprendre les concepts et les enjeux du big data

  • Origines et définition du big data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du big data : Return on investment (ROI), organisation, confidentialité des données.
  • Un exemple d’architecture big data.

Les technologies du big data

  • Description de l’architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm…
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le big data (Tableau, Talend, QlikView…).

Travaux pratiques

Installation d’une plateforme big data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec Hive.
  • Utiliser Pig pour traiter la donnée.
  • Le principe des ETL (Talend).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm…)

Travaux pratiques

Implémentation de flux de données massives.

Technique et méthodes big data analytics

  • machine learning, une composante de l’intelligence artificielle.
  • Découvrir les trois familles : régression, classification et clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning…

Exercice

Mise en place d’analyses avec un des outils étudiés.

Data visualisation et cas d’usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la dataviz ?
  • Les outils dataviz du marché.

Travaux pratiques

Installation et utilisation d’un outil de data visualisation pour constituer des analyses dynamiques.

Conclusion

Bibliographie.

Ce qu’il faut retenir.

Synthèse des bonnes pratiques.

MOYENS PÉDAGOGIQUES ET TECHNIQUES D’ENCADREMENT DES FORMATIONS

Modalités pédagogiques :

  • Évaluation des besoins et du profil des participants.
  • Apport théorique et méthodologique : séquences pédagogiques regroupées en différents modules.
  • Contenus des programmes adaptés en fonction des besoins identifiés pendant la formation.
  • Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de travaux pratiques, étude de cas et mise en situation.
  • Méthodes expositive, active et participative.
  • Réflexion et échanges sur cas pratiques.
  • Retours d'expériences.
  • Corrections appropriées et contrôles des connaissances à chaque étape, fonction du rythme de l’apprenant mais également des exigences requises au titre de la formation souscrite.

Éléments matériels :

  • Mise à disposition des outils nécessaires au bon déroulement des travaux pratiques.
  • Support de cours au format numérique projeté sur écran et transmis au participant en fin de la formation.

Référent pédagogique et formateur :

  • Chaque formation est sous la responsabilité du directeur pédagogique de l’organisme de formation.
  • Le bon déroulement est assuré par le formateur désigné par l’organisme de formation.
MOYENS PERMETTANT LE SUIVI ET L’APPRÉCIATION DES RÉSULTATS
  • Feuilles de présences signées des participants et du formateur par demi-journée.
  • Attestation de fin de formation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation.
Please login to get access to the quiz
Concevoir et déployer une architecture Data Mesh (Prev Lesson)
Back to Big Data
Public

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

Pré-requis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la business intelligence.

Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en effectuant le test disponible en bas de cette page.

Lieu de formation

Intra-entreprise/à distance

Dates ou période

À définir. Nous consulter

Tarif

Sur devis. Merci de nous contacter

Modalités

Pour s’inscrire à notre formation, veuillez nous contacter par mail ou téléphone.

Démarrage de la formation sous deux semaines (délai indicatif).

Nous contacer
Informations complémentaires

Pour toute réclamation, aléas ou difficultés rencontrés pendant la formation, veuillez prendre contact avec notre organisme par téléphone ou par e-mail. Nous mettrons tout en œuvre pour trouver une solution adapter.

Formation synchrone, réalisée à distance en visioconférence via l’application Microsoft Teams ou en présentiel dans les locaux du client.

Sur le même thème