Rechercher

Les formations BIG DATA

Les autres formations EMGS

ADMINISTRER LA PLATEFORME HADOOP 2.X HORTONWORKS – NIVEAU 1

0jours
28 heures de cours
0
Tarif Inter-entreprise*/Hors taxes

*Pour obtenir le tarif « Intra-entreprise », merci de nous contacter.

Description

Cette session prépare au rôle d’administrateur au sein d’un contexte technologique innovant et en particulier au cours d’un projet Big Data. A travers des exercices concrets, vous apprendrez à installer, configurer et maintenir un cluster Hadoop.

A la fin de cette formation, vous aurez une compréhension solide de comment Hadoop fonctionne avec le Big Data et, à travers nos mises en pratique, vous saurez déployer tout le cycle de vie pour des clusters multi-nœuds.

Objectifs pédagogiques

– Dimensionner un cluster Hadoop
– Installer un cluster Hadoop
– Configurer un cluster Hadoop
– Sécuriser un cluster Hadoop
– Maintenir un cluster Hadoop

Publics

  • Architecte, administrateur

Pré-requis

Connaissances de l’environnement Linux.

Méthode pédagogique

Formation avec apports théoriques, échanges sur les contextes des participants et retours d’expérience pratique du formateur, complétés de travaux pratiques et de mises en situation. Cette formation prépare à la certification éditeur Hortonworks.

Programme

Jour 1

• Les produits de la HDP

• Qu’est-ce que Hadoop ?

• Une architecture de cluster type

• Introduction à Ambari

• Gérer les users et les groupes

• Gérer les permissions

• Mise en pratique : « Gestion des utilisateurs avec Ambari »

• Configuration des services

• Surveillance des services

• Maintenance des services

• Mise en pratique : « Gestion des services Hadoop »

• Accéder aux données

• Gestion des fichiers

• Mise en pratique : « Utiliser le stockage HDFS »

Jour 2

• Les web services d’HDFS

• Mise en pratique : « Utiliser WebHDFS »

• Protéger les accès

• Mise en pratique : « Utiliser les ACLs HDFS »

• Architecture HDFS

• Assurer l’intégrité de la donnée

• Mise en pratique : « Gestion du stockage sur HDFS »

• Les quotas HDFS

• Mise en pratique : « Gestion des quotas sur HDFS »

• Architecture de Yarn

• Utilisation de Yarn

• Les différentes façons de gérer Yarn

• Mise en pratique : « Configurer et gérer Yarn »

• Mise en pratique : « Gestion de Yarn sans Ambari »

Jour 3

• Les bases d’une application Yarn

• Mise en pratique : « Démarrer une application Yarn »

• Ajouter, enlever un nœud du cluster

• Déplacer des composants

• Mise en pratique : « Ajouter, décommissionner et recommissionner un nœud »

• Contrôler la répartition des ressources grâce aux queues Yarn

• Contrôler les accès sur les queues Yarn

• Mise en pratique : « Configuration des utilisateurs et des groupes pour Yarn »

• Mise en pratique : « Configurer les ressources avec les queues »

• Mise en pratique : « Tuning de la gestion des ressources »

• Les bénéfices de la « rack awareness »

• Configurer la « rack awareness »

• Mise en pratique : « Configurer la rack awareness »

Jour 4

• Les principes de la haute disponibilité

• Haute disponibilité du Namenode

• Haute disponibilité du Resource manager

• Mise en pratique : « Configurer la haute disponibilité du namenode »

• Mise en pratique : « Configurer la haute disponibilité du resource manager »

• Surveillance avec Ambari

• Lever des alertes avec Ambari

• Mise en pratique : « Configurer les alertes avec Ambari »

• De l’importance des backups

• Les snapshots HDFS

• Utiliser DistCP

• Mise en pratique : « Gestion des snapshots HDFS »

• Mise en pratique : « Utiliser DistCP »

• Identifier les options de déploiement de cluster

• Planifier un déploiement de cluster

• Faire une installation avec Ambari

• Mise en pratique : « Installer la HDP »

Prochaines sessions

  • Contactez-nous pour les prochaines sessions.

Contactez-nous

Aides financières

Demande d’informations

    Votre nom (obligatoire)

    Votre prénom (obligatoire)

    Votre entreprise

    Votre fonction

    Votre email (obligatoire)

    Votre téléphone

    Formations

    Votre message