Certification Hadoop avec Spark pour Développeurs de Cloudera
Objectifs
Cette formation Certification Spark avec Hadoop pour Développeurs de Cloudera vous permettra de :
- Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
- Comment utiliser Sqoop et Flume pour intégrer les données ?
- Comment enregistrer des données distribuées avec Apache Spark ?
- Comment modéliser des données structurées en tant que tableau dans Impala et Hive ?
- Comment choisir le meilleur format de stockage de données pour différents patterns d’utilisation de données ?
- Les meilleures pratiques pour le stockage de données.
Programme
- Introduction
- Présentation de Hadoop et de son écosystème
- L’architecture Hadoop et HDFS
- Importer des données relationnelles avec Apache Sqoop
- Introduction à Impala et Hive
- Les formats de données
- La partition des données
- Les données Apache Flume
- Les bases de Spark
- Rédiger et déployer des applications Spark
- La programmation parallèle avec Spark
- Spark : mise en cache et persistence
- Le traitement de données avec Spark et « Common patterns »
- Spark SQL et DataFrames
- Conclusion
Please login to get access to the quiz
Back to Apache Hadoop pour Développeurs