Big Data

NoSQL – Introduction

Objectifs

  • Connaître les caractéristiques techniques des bases de données NoSQL
  • Savoir quelles sont les différentes solutions disponibles sur leur marché
  • Apprendre à identifier les critères de choix

Programme

Introduction
  • Origine des bases de données, les notions de transaction, les SGBD, la standardisation SQL,
  • L'arrivée de nouveaux besoins : volumes importants liés aux technologies et aux nouveaux usages, traitements optimisés de flux de données au fil de l'eau
  • Développement des techniques sur différents aspects : stockage, indexation/recherche, calcul
  • Définition ETL : Extract Transform Load
Caractéristiques NoSQL
  • Structure de données proches des utilisateurs, développeurs : sérialisation, tables de hachage, JSON
  • Priorité au traitement du côté client
  • Protocoles d'accès aux données, interfaces depuis les langages classiques
  • Données structurées et non structurées, documents, images
  • Stockage réparti : réplication, sharping, gossip protocl, hachage,...
  • Parallélisation des traitements : implémentation de MapReduce
  • Cohérence des données et gestion des accès concurrents :"eventual consistancy" et multi-version concurrency control
Principaux acteurs
  • Les solutions NoSQL et leurs choix techniques : CouchDB, MongoDB, Cassandra, HBase (Hadoop), ElasticSearch, ...
  • Démonstrations avec Cassandra et couchDB
  • Critères de choix
Mise en oeuvre
  • Points à vérifier : méthode d'utilisation des données
  • Format de stockage JSON, XML,
  • Choix de la clé, notion de clé composite, ...
  • Aspects matériels, besoins en mémoire, disques, répartition, ...
  • Import des données : outils et méthodes selon les moteurs NoSQL
Please login to get access to the quiz
Data Mining et Machine Learning (Prev Lesson)
(Next Lesson) Big Data – Enjeux et perspectives
Back to Big Data