Hadoop - Hortonworks pour Développeurs

Objectifs

  • Développer des applications de gestion et de traitement des données sur des cluster Hadoop
  • Définir et à développer des applications MapReduce(Yarn), Hive et Pig efficaces et pertinentes avec Hadoop
  • Exploiter toute la puissance d'Hadoop pour manipulation, analyse et exécution des calculs sur leur cluster Hadoop
  • Stage / Presentiel
  • 1 995 € (HT)
  • 4 Jours (28 Heures)
  • Code: IBD74

Programme Détaillé

développeurs amener à développer, maintenir et optimiser des applications MapReduce
Les technologies Hadoop et leur implémentation
Fonctionnement de « Hadoop Distributed File System » et «MapReduce »
Principes de développement d'applications « MapReduce »
Exemples d’utilisation dans différents secteurs
HDFS : interfaçage avec Java
Le système de fichier Hadoop Distributed File System (HDFS)
Lecture et écriture sur le HDFS
Manipulation des types de fichier SequenceFile
Qu’est-ce que le DistributedCache et comment partager les références ?
MapReduce/Yarn : principe et développement Java
Le paradigme MapReduce et l’utilisation à travers YARN
Implémentation de problématiques réelles avec le paradigme MapReduce
Implémentation de problématiques plus complexes
Utilisation des combinateurs et partitionners
Les bonnes pratiques pour le développement des applications MapReduce
Manipulation des données avec un query language et Java
Présentation et fonctionnement de HBase, Hive et Pig
HBase et Hive : JDBC et requêtes
Extension du HiveQL avec des fonctionnalités développées : UDF (User-Defined Functions)
Pig : Développement et intégration avec JAVA
Extension de Pig avec des fonctionnalités développées : UDF (User-Defined Functions)
expérience dans le développement (si possible avec Java), la bonne compréhension des algorithmes est un plus
Consultant-formateur expert big data et développement
Les sessions "A distance" sont réalisées avec l'outil de visioconférence Teams, permettant au formateur d'adapter sa pédagogie.