Big Data

Big Data, méthodes et solutions pratiques pour l’analyse des données

Objectifs de la formation

  • Comprendre les principaux concepts du Big Data ainsi que l'écosystème technologique d'un projet Big Data
  • Savoir analyser les difficultés propres à un projet Big Data
  • Déterminer la nature des données manipulées
  • Appréhender les éléments de sécurité, d'éthique et les enjeux juridiques
  • Exploiter les architectures Big Data
  • Mettre en place des socles techniques complets pour des projets Big Data


Programme de la formation

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.
  • Aspect éthique et juridique de la gestion des données.
  • La sécurité des données.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview...).

Exercice

Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice

Implémentation de flux de données massives.

Travaux pratiques

Les paramètres d'encodage.

Please login to get access to the quiz
Big Data, Tour d’horizon complet (Prev Lesson)
(Next Lesson) Big Data, synthèse technique
Back to Big Data