Apache Hadoop pour Administrateurs

Hadoop – Cloudera pour architectes et administrateurs

Objectifs

Cette formation Hadoop – Cloudera pour architectes et administrateurs vous permettra de savoir :

  • Comment élaborer une architecture Hadoop
  • Comment Hadoop Distributed File System (HDFS) et YARN/MapReduce fonctionnent
  • Comment exploiter et gérer un cluster Hadoop
  • Comment configurer Hadoop et ses outils
  • Comment mettre en œuvre un cluster Hadoop
  • Comment gérer la maintenance des nœuds dans un cluster
  • Comment déplacer et gérer les données dans un cluster
  • Comment administrer un cluster Hadoop

Programme

INTRODUCTION
  • Présentation générale d’Hadoop
  • Exemples d’utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?
  • Les possibilités d’implantation de l’infrastructure et les coûts associés
L’ECOSYSTEME D’HADOOP
  • Le système de fichier HDFS
  • Le paradigme MapReduce et l’utilisation à travers YARN
  • Le garant des informations : Zookeeper
  • Le système de stockage de la donnée basé sur le socle : HBase
  • La présentation de l’architecture globale : où installer les services ?
  • La définition du dimensionnement pour un cluster Hadoop
  • Les particularités de MapR
INSTALLATION DU SOCLE D’HADOOP
  • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase
MANIPULATION DES DONNEES DANS UN CLUSTER HADOOP
  • Architecture, Objectif et fonctionnement de : Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
  • Mise en pratique sur les différents outils
EXPLOITATION D’UN CLUSTER HADOOP
  • Architecture, objectif et fonctionnement du Manager : MapR Control System
  • Mise en pratique
CONCEPTS D’ARCHITECTURE COMPLEXE
  • Architecture en rack : les avantages et fonctionnement et paramétrage du rack awareness
  • Scalabilité et performances : le Namenode Federation
  • High Availability des serveurs maitres
  • Utilisation des snapshots : sauvegarde et restauration
Please login to get access to the quiz
Certification Hadoop Administrateurs de Cloudera (Prev Lesson)
(Next Lesson) Hadoop, installation et administration
Back to Apache Hadoop pour Administrateurs
Public

Cette formation Hadoop - Cloudera pour architectes et administrateurs est destinée aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de dév| Cette formation Hadoop - Cloudera pour architectes et administrateurs est destinée aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de dév

Pré-requis

Cette formation Hadoop - Cloudera pour architectes et administrateurs nécessite de savoir naviguer et modifier des fichiers dans Linux. Une connaissance préliminaire d’Hadoop n’est pas exigée.| Cette formation Hadoop - Cloudera pour architectes et administrateurs nécessite de savoir naviguer et modifier des fichiers dans Linux. Une connaissance préliminaire d’Hadoop n’est pas exigée.