Big Data

Les techniques d’analyse et de visualisation

Objectifs

Cette formation Les techniques d'analyse et de visualisation vous permettra de :

  • Définir et identifier le contexte spécifique des projets Big Data
  • Connaitre le panorama technologique et enjeux socio-économiques
  • Mesurer l’impact des choix technologiques en matière d’analyse et de visualisation
  • Gérer la structure des données (structurées – non structurées ; internes – acquises)
  • Intégrer des données par les techniques de collecte
  • Mettre en œuvre un entrepôt et le stockage de données
  • Maîtriser les méthodes d’analyse et de visualisation
  • Consolider ses connaissances à travers un cas d’usage

Programme

PANORAMA TECHNOLOGIQUE ET ENJEUX SOCIO-ECONOMIQUES
  • Bâtir une vision Data Centric pour l'entreprise
  • Etudier l'environnement concurrentiel de l'entreprise
  • Comment créer de la valeur ou apporter de la valeur complémentaire aux données
  • Comment utiliser les Big Data qui doivent être un levier technologique pour accompagner les enjeux métiers et non l'inverse
  • Comprendre les acteurs du Big Data et leur positionnement
  • Quelle vision à 3 ans
  • Propriété de la donnée, environnement juridique du traitement, sécurité
  • La nécessité de la gouvernance des données
  • Qu'est-ce qu'un CDO
ASPECTS JURIDIQUES ET ETHIQUES : QUELLES DONNEES POUR QUELS USAGES ?
  • Données objectives
  • Données à caractère personnel
  • Quelle gestion des données personnelles ? (donnée se rapportant à une personne physique, qui peut être identifiée quel que soit le moyen utilisé)
  • Quels Impact sur la vie privée
  • Surveillance et sanction de la CNIL
  • Déclaration préalable
  • Exemples
  • Présentation du socle (la finalité du traitement) et de 4 conditions
  • Finalité explicite et légitime
  • Loyauté dans la mise en œuvre du traitement
  • Données pertinentes
  • Durée de conservation non excessive
  • Sécurité
IMPACT DES CHOIX TECHNOLOGIQUES EN MATIERE D’ANALYSE ET DE VISUALISATION
  • Fonctionnement des solutions d’analyse et de visualisation aujourd'hui dans un environnement BI
  • Qu'implique la mise en place d'une solution de type Big Data
  • Quels outils utiliser pour l’analyse et la visualisation ?
  • Les nouveaux outils natifs au Big Data
  • Les outils classiques de Datavisualisation
  • Quelles performances pour quels outils ?
  • Les nouvelles solutions tout en un pour packager des applications Big Data (de l'intégration de la donnée à leur visualisation)
GERER LA STRUCTURE DES DONNEES (STRUCTUREES – NON STRUCTUREES ; INTERNES – ACQUISES)
  • Le Data Lake
  • Retour sur le La Datawarehouse historique : en tirer partie.
  • Nouvelles approches Big Data : le Data Lake.
  • Intégrer toutes les données avec le Data Lake
  • Pourquoi faut-il vraiment tout conserver ?
  • La nécessaire gouvernance de la donnée.
  • Structuration des données (structurées – non structurées ; internes – acquises)
  • Température des données (froides, tièdes, chaudes)
  • Coloration des données (données blanches, données grises, données sombres)
  • Quelle valeur par typologie de données
LA COLLECTE DE DONNEES
  • Intégration de données hétérogènes
  • Intégration réelle (DataWarehouse) ou virtuelle (fédérateur de données).
  • Médiateur, adaptateur et ETL.
  • Intégration de schémas et d’ontologies : les conflits sémantiques, le problème de la résolution d’entité.
  • Modèles de données pour l’intégration : relationnel, XML, JSON, clé-valeur.
  • L’offre produits et services.
  • Intégration des données du SI avec big data
  • Besoins : acquisition, organisation, analyse.
  • Place de Hadoop et Spark dans une architecture d’intégration
  • Exemples de plateformes d’intégration : Microsoft HDInsight, IBM InfoSphere BigInsights, Oracle Bigdata Appliance.
L’ENTREPOT / LE STOCKAGE DE DONNEES
  • Stockage d’objets
  • Stockage en fichiers distribués
  • Systèmes de fichiers distribués : Hadoop HDFS, Google File System, IBM GPFS, GlusterFS, Lustre.
  • Stockage clé-valeur
  • Systèmes clé-valeur : Amazon DynamoDB, Amazon SimpleDB, Apache Cassandra, Linkedin Voldemort.
METHODES D’ANALYSE ET DE VISUALISATION
  • La Data Visualisation
  • La Data Discovery
  • Le self-service BI
  • Les nouveaux enjeux
  • Marchés mouvants et volatiles
  • Accélération du cycle de décision
  • Populations métiers plus matures
  • Intégration avec le Big Data
  • Que visualiser ?
  • Exploration de données.
  • Performance de modèles.
  • Prédictions des modèles.
  • Comment visualiser ?
  • Types de représentations : courbes, histogrammes, diagrammes 3D ….
  • Statique vs interactif.
  • Outils et technologies
  • La montée du JavaScript.
  • Les solutions du marché
  • Les solutions intégrées aux plateformes Big Data
ETUDES DE CAS
  • Mise en place d'une architecture Big Data orientée analyse des données et visulatisation
Please login to get access to the quiz
Architecture et infrastructure (Prev Lesson)
(Next Lesson) Big Data – Les fondamentaux de l’analyse des données
Back to Big Data
Public

Cette formation Les techniques d'analyse et de visualisation est destinée aux Data Analysts, Business Analysts, Analystes Business Intelligence, Dataminers.| Cette formation Les techniques d'analyse et de visualisation est destinée aux Data Analysts, Business Analysts, Analystes Business Intelligence, Dataminers.

Pré-requis

Cette formation Les techniques d'analyse et de visualisation nécessite de connaître les principes de programmation et avoir une expérience dans le développement. Connaissance du langage SQL.| Cette formation Les techniques d'analyse et de visualisation nécessite de connaître les principes de programmation et avoir une expérience dans le développement. Connaissance du langage SQL.