Vous souhaitez approfondir les technologies et best practices liées à la gestion de la donnée et plus particulièrement sur le stockage (HDFS, Hive) et l’ingestion (Kafka, Spark).
LES OBJECTIFS DE LA FORMATION
Comprendre les concepts avancés du Big Data.
Approfondir les technologies et des best practices : 1) Stockage de la donnée (Hive). 2) Data Ingestion.
MOYENS PÉDAGOGIQUES
Les formations Big Data sont présentées par un expert, via des supports de présentation et de travaux pratiques.
MODALITES D’ÉVALUATION
Exercices tout au long de la formation.
À QUI S’ADRESSE CETTE FORMATION ?
Public
Pré-requis
Compétences visées
MOE / Technique.
Afin d’assurer le bon déroulement des formations, il est indispensable d’avoir des connaissances en développement.
Maitrise des technologies Hive et Data Ingestion.
PROGRAMME DÉTAILLÉ
OBJECTIF PÉDAGOGIQUE
THÈMES À ABORDER
JOUR 1
Introduction Utilisation et bonnes pratiques
Architecture hadoop
Composants de base de Hadoop – Hortonworks
HDFS
Data locality
MapReduce
Spark / Tez
Yarn
Zookeeper
Processing
Type d’architecture distribuée
Key Knowledges Check
Hive Utilisation et bonnes pratiques
Introduction
Architecture et modèle des données
JOUR 2
Hive Utilisation et bonnes pratiques
Fichier et compression
Commandes de base
Requêtage
Hive2 LLAP
JOUR 3
Hive
Utilisation et bonnes pratiques
UDF
Best practice et points de vigilance
Key Knowledges Check
Ingestion des données Utilisation et bonnes pratiques
Sqoop
Oozie
Best practice et points de vigilance
Key Knowledges Check
LE FORMATEUR
Architecte de plus de 10 ans d’expérience, intervenant chez nos clients grands comptes.