Retour en haut de la page

Les Fondamentaux du Big Data

3 jours - 21 heures

Objectifs

Présenter les enjeux de l'analyse des données numériques à grande échelle. Comprendre l’impact du Big Data dans l'entreprise. Comment utiliser le Big Data pour son activité. Identifier la plateforme technologique sur laquelle s'appuyer.

Participants

Chefs de projet, consultants fonctionnel, responsables marketing, développeurs "Big Data", ingénieurs d'études.

Prérequis

Aucune connaissance sur Hadoop n’est requise. La connaissance du SQL et des langages de programmation serait un plus.

Pédagogie

La pédagogie est basée sur le principe de la dynamique de groupe avec alternance d'apports théoriques, de phases de réflexion collectives et individuelles, d'exercices, d'études de cas et de mises en situations observées. Formation / Action participative et interactive : les participants sont acteurs de leur formation notamment lors des mises en situation car ils s'appuient sur leurs connaissances, les expériences et mettront en œuvre les nouveaux outils présentés au cours de la session.

Spécificités pédagogiques de la session à distance

Formation dispensée en visio-formation avec un séquencement adapté. Configuration et accès à notre outil de visio-formation. Accès à la bibliothèque pédagogique virtuelle durant la formation afin de partager les exercices, contrôler les résultats obtenus et déployer l’ensemble du séquencement pédagogique. La durée exacte des modules définis ci-après est susceptible de varier en fonction de la vitesse d’appropriation des concepts enseignés de la part du stagiaire.

Remarques

 

Certification

 

Profil de l'intervenant

Consultant-formateur expert. Suivi des compétences techniques et pédagogiques assuré par nos services.

Moyens techniques

Encadrement complet des stagiaires durant la formation. Espace d’accueil, configuration technique des salles et matériel pédagogique dédié pour les formations en centre. Remise d’une documentation pédagogique papier ou numérique à échéance de la formation.

Moyens techniques relatifs aux sessions à distance

Encadrement complet des stagiaires durant la formation. Accès à notre service technique durant l’animation pour toute limite rencontrée. Accès à l’espace de conversation instantané durant la session pour interagir avec le formateur et les participants. Transmission d’un email de contact pour réaction privée durant la session. Remise d’une documentation pédagogique papier ou numérique à échéance de la formation.

Méthodes d'évaluation des acquis

Exercices individuels et collectifs durant la formation. La feuille d’émargement signée par demi-journée ainsi que l’évaluation des acquis de fin de stage sont adressées avec la facture.

Méthodes d'évaluation des acquis de la formation à distance

Exercices individuels et collectifs communiqués durant la formation via la bibliothèque pédagogique virtuelle mise à disposition ou directement par le formateur. Ces activités constituent les modalités de suivi et d’évaluation du Stagiaire de la part du formateur. Suivi permanent du formateur durant l’animation et durant les exercices pratiques.

Programme

Comprendre leBIG Data

  • Introduction
  • De la donnée au Big Data
  • Définition du Big Data
  • Les 3V du big Data

Les sources de données

  • Pourquoi capturer les données ?
  • Les données internes de l’entreprise
  • Les données externes : Web
  • Les données externes : Open Data
  • Les données externes : Les réseaux sociaux

Big data en entreprise

  • Les secteurs impactés
  • Cas d’usages du Big Data
  • La gouvernance des données

Les métiers du Big Data

  • Un “nouveau” métier : le Data Scientist
  • Les algorithmes utilisés en Data Science

Big Data vs Business Intelligence

  • Rappel du l’architecture décisionnelle
  • Les limites de la BI
  • Définition du Data Lake
  • Comparaison des deux approches ( BI vs Big Data )
  • Avantages et points de vigilance
  • ArchitectureBig Data
  • Big Data dans le cloud
  • Choix de solution Big Data Cloud

NOSQL

  • L’origine du NOSQL
  • Définition du NOSQL
  • ACID ( SQL ) vs CAP ( Big Data )
  • Les différentes approches NoSQL

L’écosystème Hadoop :

  • L’origine et pourquoi Hadoop
  • MapReduce , Yarn
  • HDFS
  • HIVE
  • PIG
  • Habse
  • Sqoop
  • ElasticSearch
  • Spark
  • Oozie
Datadock Microsoft TOSA Certification Robert Samsung partners

Grand-Est (Bar le duc, Chalons en champagne, Colmar, Epinal, Metz, Mulhouse, Nancy, Reims, Strasbourg, Troyes) Nouvelle-Aquitaine (Agen, Angouleme, Biarritz, Bordeaux, Brive, Compiegne, La rochelle, Limoges, Niort, Pau, Perigueux, Poitiers) Auvergne-Rhônes-Alpes (Annecy, Bourg en bresse, Chambery, Clermont ferrand, Grenoble, Lyon bron, Lyon masset, Lyon vendome, Saint etienne, Valence) Normandie (Caen, Le havre, Rouen) Bourgogne-Franche-Comté (Auxerre, Belfort, Dijon, Sens) Bretagne (Brest, Rennes) Centre-Val-de-Loire (Blois, Bourges, Chartres, Chateauroux, Orleans, Tours) Corse (Ajaccio, Bastia) Île de France (Aulnay sous bois, Groupe, La defense courbevoie, Nanterre, Paris nation, Paris ternes, Poissy) Occitanie (Cahors, Castres, Montauban, Montpellier, Narbonne, Nimes, Pamiers, Perpignan, Rodez, Toulouse) Pays de la Loire (La roche sur yon, Le mans, Montaigu, Nantes) Hauts de France (Amiens, Lille, Roubaix, Soissons) Provence-Alpes-Côte d'Azur (Aix en provence, Avignon, Marseille, Nice)