Big Data

Les techniques d’analyse et de visualisation

Objectifs

Cette formation Les techniques d’analyse et de visualisation vous permettra de :

  • Définir et identifier le contexte spécifique des projets Big Data
  • Connaitre le panorama technologique et enjeux socio-économiques
  • Mesurer l’impact des choix technologiques en matière d’analyse et de visualisation
  • Gérer la structure des données (structurées – non structurées ; internes – acquises)
  • Intégrer des données par les techniques de collecte
  • Mettre en œuvre un entrepôt et le stockage de données
  • Maîtriser les méthodes d’analyse et de visualisation
  • Consolider ses connaissances à travers un cas d’usage

Programme

PANORAMA TECHNOLOGIQUE ET ENJEUX SOCIO-ECONOMIQUES
  • Bâtir une vision Data Centric pour l’entreprise
  • Etudier l’environnement concurrentiel de l’entreprise
  • Comment créer de la valeur ou apporter de la valeur complémentaire aux données
  • Comment utiliser les Big Data qui doivent être un levier technologique pour accompagner les enjeux métiers et non l’inverse
  • Comprendre les acteurs du Big Data et leur positionnement
  • Quelle vision à 3 ans
  • Propriété de la donnée, environnement juridique du traitement, sécurité
  • La nécessité de la gouvernance des données
  • Qu’est-ce qu’un CDO
ASPECTS JURIDIQUES ET ETHIQUES : QUELLES DONNEES POUR QUELS USAGES ?
  • Données objectives
  • Données à caractère personnel
  • Quelle gestion des données personnelles ? (donnée se rapportant à une personne physique, qui peut être identifiée quel que soit le moyen utilisé)
  • Quels Impact sur la vie privée
  • Surveillance et sanction de la CNIL
  • Déclaration préalable
  • Exemples
  • Présentation du socle (la finalité du traitement) et de 4 conditions
  • Finalité explicite et légitime
  • Loyauté dans la mise en œuvre du traitement
  • Données pertinentes
  • Durée de conservation non excessive
  • Sécurité
IMPACT DES CHOIX TECHNOLOGIQUES EN MATIERE D’ANALYSE ET DE VISUALISATION
  • Fonctionnement des solutions d’analyse et de visualisation aujourd’hui dans un environnement BI
  • Qu’implique la mise en place d’une solution de type Big Data
  • Quels outils utiliser pour l’analyse et la visualisation ?
  • Les nouveaux outils natifs au Big Data
  • Les outils classiques de Datavisualisation
  • Quelles performances pour quels outils ?
  • Les nouvelles solutions tout en un pour packager des applications Big Data (de l’intégration de la donnée à leur visualisation)
GERER LA STRUCTURE DES DONNEES (STRUCTUREES – NON STRUCTUREES ; INTERNES – ACQUISES)
  • Le Data Lake
  • Retour sur le La Datawarehouse historique : en tirer partie.
  • Nouvelles approches Big Data : le Data Lake.
  • Intégrer toutes les données avec le Data Lake
  • Pourquoi faut-il vraiment tout conserver ?
  • La nécessaire gouvernance de la donnée.
  • Structuration des données (structurées – non structurées ; internes – acquises)
  • Température des données (froides, tièdes, chaudes)
  • Coloration des données (données blanches, données grises, données sombres)
  • Quelle valeur par typologie de données
LA COLLECTE DE DONNEES
  • Intégration de données hétérogènes
  • Intégration réelle (DataWarehouse) ou virtuelle (fédérateur de données).
  • Médiateur, adaptateur et ETL.
  • Intégration de schémas et d’ontologies : les conflits sémantiques, le problème de la résolution d’entité.
  • Modèles de données pour l’intégration : relationnel, XML, JSON, clé-valeur.
  • L’offre produits et services.
  • Intégration des données du SI avec big data
  • Besoins : acquisition, organisation, analyse.
  • Place de Hadoop et Spark dans une architecture d’intégration
  • Exemples de plateformes d’intégration : Microsoft HDInsight, IBM InfoSphere BigInsights, Oracle Bigdata Appliance.
L’ENTREPOT / LE STOCKAGE DE DONNEES
  • Stockage d’objets
  • Stockage en fichiers distribués
  • Systèmes de fichiers distribués : Hadoop HDFS, Google File System, IBM GPFS, GlusterFS, Lustre.
  • Stockage clé-valeur
  • Systèmes clé-valeur : Amazon DynamoDB, Amazon SimpleDB, Apache Cassandra, Linkedin Voldemort.
METHODES D’ANALYSE ET DE VISUALISATION
  • La Data Visualisation
  • La Data Discovery
  • Le self-service BI
  • Les nouveaux enjeux
  • Marchés mouvants et volatiles
  • Accélération du cycle de décision
  • Populations métiers plus matures
  • Intégration avec le Big Data
  • Que visualiser ?
  • Exploration de données.
  • Performance de modèles.
  • Prédictions des modèles.
  • Comment visualiser ?
  • Types de représentations : courbes, histogrammes, diagrammes 3D ….
  • Statique vs interactif.
  • Outils et technologies
  • La montée du JavaScript.
  • Les solutions du marché
  • Les solutions intégrées aux plateformes Big Data
ETUDES DE CAS
  • Mise en place d’une architecture Big Data orientée analyse des données et visulatisation
MOYENS PÉDAGOGIQUES ET TECHNIQUES D’ENCADREMENT DES FORMATIONS

Modalités pédagogiques :

  • Évaluation des besoins et du profil des participants.
  • Apport théorique et méthodologique : séquences pédagogiques regroupées en différents modules.
  • Contenus des programmes adaptés en fonction des besoins identifiés pendant la formation.
  • Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de travaux pratiques, étude de cas et mise en situation.
  • Méthodes expositive, active et participative.
  • Réflexion et échanges sur cas pratiques.
  • Retours d'expériences.
  • Corrections appropriées et contrôles des connaissances à chaque étape, fonction du rythme de l’apprenant mais également des exigences requises au titre de la formation souscrite.

Éléments matériels :

  • Mise à disposition des outils nécessaires au bon déroulement des travaux pratiques.
  • Support de cours au format numérique projeté sur écran et transmis au participant en fin de la formation.

Référent pédagogique et formateur :

  • Chaque formation est sous la responsabilité du directeur pédagogique de l’organisme de formation.
  • Le bon déroulement est assuré par le formateur désigné par l’organisme de formation.
MOYENS PERMETTANT LE SUIVI ET L’APPRÉCIATION DES RÉSULTATS
  • Feuilles de présences signées des participants et du formateur par demi-journée.
  • Attestation de fin de formation mentionnant les objectifs, la nature et la durée de l’action et les résultats de l’évaluation des acquis de la formation.
Please login to get access to the quiz
Architecture et infrastructure (Prev Lesson)
(Next Lesson) Big Data – Les fondamentaux de l’analyse des données
Back to Big Data
Public

Cette formation Les techniques d'analyse et de visualisation est destinée aux Data Analysts, Business Analysts, Analystes Business Intelligence, Dataminers.| Cette formation Les techniques d'analyse et de visualisation est destinée aux Data Analysts, Business Analysts, Analystes Business Intelligence, Dataminers.

Pré-requis

Cette formation Les techniques d'analyse et de visualisation nécessite de connaître les principes de programmation et avoir une expérience dans le développement. Connaissance du langage SQL.| Cette formation Les techniques d'analyse et de visualisation nécessite de connaître les principes de programmation et avoir une expérience dans le développement. Connaissance du langage SQL.

Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en effectuant le test disponible en bas de cette page.

Lieu de formation

Intra-entreprise/à distance

Dates ou période

À définir. Nous consulter

Tarif

Sur devis. Merci de nous contacter

Modalités

Pour s’inscrire à notre formation, veuillez nous contacter par mail ou téléphone.

Démarrage de la formation sous deux semaines (délai indicatif).

Nous contacer
Informations complémentaires

Pour toute réclamation, aléas ou difficultés rencontrés pendant la formation, veuillez prendre contact avec notre organisme par téléphone ou par e-mail. Nous mettrons tout en œuvre pour trouver une solution adapter.

Formation synchrone, réalisée à distance en visioconférence via l’application Microsoft Teams ou en présentiel dans les locaux du client.

Sur le même thème