Logo de l'organisme de formation

Conseil et Formation en informatique / numérique

Représentation de la formation : Les fondamentaux des bases de données NoSQL

Les fondamentaux des bases de données NoSQL

Découvrez l'univers du NoSQL : enjeux & solutions

Formation mixte
Accessible
Durée : 14 heures (2 jours)
Durée :14 heures (2 jours)
HT
S'inscrire
Durée :14 heures (2 jours)
HT
S'inscrire
Durée :14 heures (2 jours)
HT
S'inscrire

Besoin d’adapter cette formation à vos besoins ?

N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure !

Formation créée le 19/02/2025.

Version du programme : 1

Programme de la formation

Avec l’émergence du Big Data et les applications web temps réel, la puissance et l’agilité des bases de données NoSQL en ont fait un standard pour la gestion de vastes volumes de données. Ces bases de données ne suivent pas le modèle relationnel, permettent de stocker les données sans avoir nécessairement défini un schéma (schema-less) et se reposent sur une architecture distribuée permettant l’auto-scaling et le fail-over. Il existe différents types de bases de données NoSQL et il est important de bien comprendre leurs particularités pour choisir la base de données adéquates à chaque cas d’usage. A l'issue de cette formation, vous connaîtrez les différentes familles de bases NoSQL, leurs architectures, leurs caractéristiques techniques et les principales solutions du marché. Vous serez capable d’évaluer les avantages et les inconvénients inhérents pour chaque modèle de données. Durée : 2 jours (formation possible en présentiel ou distanciel)

Objectifs de la formation

  • Comprendre les différences entre SGBD SQL et SGBD NoSQL
  • Évaluer les avantages et les inconvénients inhérents aux technologies NoSQL
  • Analyser les principales solutions du monde NoSQL pour chaque modèle de données
  • Identifier les champs d'application des SGBD NoSQL en opérationnel et en analytique
  • Comprendre les différentes architectures

Profil des bénéficiaires

Pour qui
  • Chef de projet technique
  • DBA
  • Architectes et Développeurs
Prérequis
  • Des connaissances générales des systèmes d’information et en bases de données sont souhaitables.

Contenu de la formation

  • Introduction au NoSQL
    • L'historique du mouvement NoSQL.
    • Les différentes approches de gestion de SGBD à travers le temps : hiérarchiques, relationnelles, objets, XML, NoSQL.
    • Les cinq « V » du big data : Volume, Variété, Vélocité, Véracité, Validité.
    • Données non structurées : activité web, échange de documents, réseaux sociaux, open data, IoT.
    • Les grands acteurs à l'origine du mouvement NoSQL et du big data analytique : Google et Amazon.
    • Vue synoptique des différents types de moteurs NoSQL du point de vue du modèle de données.
    • Le NoSQL, le big data et les architectures cloud : principes d'architecture communs et divergents.
    • Les modes de distribution : avec maître et décentralisé.
    • Transactions distribuées, failover, points de sauvegarde, parallélisation des requêtes, équilibrage de charge.
    • Le positionnement du NoSQL au sein du big data analytique : de l'ère de la transaction à l'ère de l'interaction.
  • Le relationnel et le NoSQL
    • Les bases de données relationnelles : leurs forces et leurs limites.
    • Structuration forte des données (schéma explicite) versus structure souple (schéma implicite) et la modélisation Agile.
    • Des qualités ACID aux qualités BASE.
    • Théorème CAP (cohérence, disponibilité, tolérance au partitionnement).
    • Les différents niveaux de cohérence.
    • Le langage SQL, la performance des jointures. L'accès par la clé en NoSQL.
    • L'évolution vers le distribué : extensibilité verticale et horizontale.
    • Comprendre le NoSQL par le modèle de l'agrégat et de la centralité de la donnée.
  • Les mondes du NoSQL
    • Monde du NoSQL à travers ses choix techniques et différentes bases NoSQL libres (du moins structuré au plus structuré).
    • L'architecture distribuée : principes, le shared-nothing.
    • Disponibilité et cohérence différée : gossip, timestamps, la règle de majorité, l'arbre de Merkle.
    • Les patterns et les modèles. Comment modéliser et travailler efficacement en NoSQL.
    • Les bases orientées clé-valeur et en mémoire : Redis, Riak, Aerospike.
    • Les bases orientées documents : le format JSON. Couchbase Server, MongoDB.
    • Les bases orientées colonnes distribuées pour le big data opérationnel : Hbase, Cassandra, ScyllaDB...
    • Les moteurs orientés graphes : Neo4j, OrientDB...
    • Les moteurs de recherche JSON : Elasticsearch, SOLR.
    • Les bases de données de séries de temps : InfluxDB, KDB, Prometheus.
  • Choisir et mettre en place
    • À quels usages correspondent les bases NoSQL ?
    • Comment aborder la migration ?
    • Comment développer efficacement avec des bases NoSQL ?
    • Quels outils de supervision et comment les choisir ?
    • Quelle est la complexité administrative et la courbe d’apprentissage ?
    • Cas d’utilisation dans des entreprises existantes.
    • Gérer les interactions avec les bases de données relationnelles.
    • Implémenter des stratégies NoSQL avec des moteurs relationnels. L’exemple de PostgreSQL et ses extensions.
    • Implémenter le NoSQL dans les clouds publics. Les pratiques et les offres de bases de données en tant que service.
  • NoSQL et Big Data
    • Big data analytique : l'écosystème Hadoop.
    • Stockage et traitement. Les différentes formes de stockage dans HDFS : SequenceFile, Apache Parquet.
    • Fonctions et usages : moteurs de recherche, outils de suggestion commerciale, détecteurs d'intrusion...
    • Différents types de traitements : MapReduce, graphe orienté acyclique, flux, machine learning, graphes distribués...
    • L'outil intégré : Apache Spark.
    • Connexion avec les moteurs opérationnels : ETL, Apache Sqoop.
Équipe pédagogique

Alexia, véritable passionnée de la data est une experte en intelligence artificielle et en science des données. Avec plus de 15 ans d'expérience, elle maîtrise un spectre de compétences étendu : Big Data, Data Science, Data Visualisation, Machine Learning, Deep Learning, Intelligence Artificielle, etc. Son parcours, marqué par des contributions significatives dans le domaine de l'apprentissage machine, l'a propulsée au rang des experts mondiaux. En témoignent son titre de Google Developer Expert en machine learning depuis 2019 et sa présence dans le classement des personnalités les plus influentes de l'IA en France. Auteure reconnue et formatrice inspirante, elle démocratise l'IA et partage sa vision d'un futur où l'homme et la machine collaborent harmonieusement. Son premier livre est une collaboration sur l'intelligence artificielle et les neurosciences ("Apprendre demain" - édition Dunod). Son second ouvrage, plus technique, aborde le Deep Learning ("Machine Learning using TensorFlow cookbook" - édition Packt). Pour Alexia, l'IA est bien plus qu'une simple technologie : c'est un levier pour repenser notre société et notre rapport au travail.

Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence
  • Une évaluation quotidienne de l’acquisition des connaissances de la veille est effectuée.
  • Une synthèse est proposée en fin de formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Accueil des apprenants dans une salle dédiée à la formation (si présentiel)
  • Présentation du support via vidéoprojecteur (ou partage visio)
  • Séminaire avec de nombreuses démonstrations.
  • Une évaluation quotidienne de l’acquisition des connaissances de la veille est effectuée.
  • Une synthèse est proposée en fin de formation.
  • Un support de cours sera remis à chaque participant comprenant les slides sur la théorie, les exercice
  • Un suivi et un échange avec les participants seront mis en place quelques jours après la formation.

Capacité d'accueil

Entre 2 et 8 apprenants

Délai d'accès

4 semaines

Accessibilité

Pour plus d'informations sur les modalités d'accessibilité pour cette formation, vous pouvez contacter directement adeschamps@confor.tech .