BIG DATA : Ingestion et Stockage

  • Vous vous lancez dans un projet Big Data.
  • Vous souhaitez approfondir les technologies et best practices liées à la gestion de la donnée et plus particulièrement sur le stockage (HDFS, Hive) et l’ingestion (Kafka, Spark).
  • Comprendre les concepts avancés du Big Data.
  • Approfondir les technologies et des best practices :
                          1) Stockage de la donnée (Hive).
                          2) Data Ingestion.

Les formations Big Data sont présentées par un expert, via des supports de présentation et de travaux pratiques.

Exercices tout au long de la formation.

À QUI S’ADRESSE CETTE FORMATION ?

Public
Pré-requis
Compétences visées

MOE / Technique.

Afin d’assurer le bon déroulement des formations,
il est indispensable d’avoir des connaissances en développement.

Maitrise des technologies Hive
 et Data Ingestion.

PROGRAMME DÉTAILLÉ

OBJECTIF PÉDAGOGIQUE

THÈMES À ABORDER

JOUR 1

Introduction
Utilisation et bonnes pratiques

  • Architecture hadoop
  • Composants de base de Hadoop – Hortonworks 
  • HDFS
  • Data locality
  • MapReduce
  • Spark / Tez
  • Yarn
  • Zookeeper
  • Processing
  • Type d’architecture distribuée
  • Key Knowledges Check

Hive
Utilisation et bonnes pratiques

  • Introduction
  • Architecture et modèle des données

JOUR 2

Hive
Utilisation et bonnes pratiques

  • Fichier et compression
  • Commandes de base
  • Requêtage
  • Hive2 LLAP

JOUR 3

Hive

Utilisation et bonnes pratiques

  • UDF
  • Best practice et points de vigilance
  • Key Knowledges Check

Ingestion des données
Utilisation et bonnes pratiques

  • Sqoop
  • Oozie
  • Best practice et points de vigilance
  • Key Knowledges Check

Architecte de plus de 10 ans d’expérience, intervenant chez nos clients grands comptes.

CETTE FORMATION VOUS INTERESSE ?