Big Data

Apache NiFi, gérer vos flux de données

Objectifs de la formation

  • Vue d'ensemble de l’écosystème Big Data
  • Présentation de Apache NiFi
  • Utilisation des processeurs
  • Utilisation avancée
  • Composants de NIFI


Programme de la formation

Vue d'ensemble de l’écosystème Big Data

  • Architecture HDFS et MapReduce
  • Apache NiFi en producteur de données
  • Apache NiFi en consommateur de données
  • Pourquoi intégrer NiFi avec Kafka ?

Présentation de Apache NiFi

  • Présentation d'Apache NiFi
  • Comprendre le traitement des flux de données
  • Architecture d'Apache NiFi
  • Processeurs et flow files
  • Connecteurs et processeurs
  • Comprendre l'UI
  • Classes de processeurs
  • Installation et configuration du programme
  • Gestion du parallélisme dans un cluster NiFi

Utilisation des processeurs

  • Générateur FlowFile
  • Lecture et traitement des fichiers de données
  • Utilisation de SplitRecord
  • Utilisation de UpdateRecordProcessor
  • Traitement de la duplication des fichiers
    • Processeurs liés à JSON
    • InvokeHTTP
    • EvaluateJsonPath
    • FlattenJson
    • SplitJson

Utilisation avancée

  • Traitement des doublons
  • Utilisation de SQL Query dans NiFi
  • Processeur NiFi HandleHttpRequest et HandleHttpResponse
  • Templates NiFi
  • Surveillance de NiFi
  • Provenance des données et recherche d'événements
  • Relations avec les processeurs
  • Debugging et gestion des erreurs
  • Utiliser MiniFi pour gérer les IOTs

Composants de NIFI

  • NiFi Registry
  • Versioning du flow dans NiFi
  • Schéma Registry
  • Simplification de l'intégration avec des schémas de données

Please login to get access to the quiz
Big Data, synthèse technique (Prev Lesson)
(Next Lesson) Apache Airflow, prise en main
Back to Big Data
Public

Développeurs, Professionnels du Big Data, Architectes, Administrateurs systèmes, DevOps

Pré-requis

Connaissances de base des systèmes Unix, connaissances de base en Java