{! job.appellationlibelle !}
{! job.salaire.libelle !}
{! job.typeContrat !}
Comprendre ce qu'est le Big Data, son vocabulaire, les bénéfices attendus. - Connaître les enjeux éthiques et juridiques du Big Data. - Apprendre quels éléments et actions sont nécessaires à une infrastructure Big Data. - Savoir ce qu'implique le développement d'applications Big Data - Savoir comment analyser, visualiser et interpréter les données.
Contexte et opportunités du Big Data. Origines du Big Data. Données au coeur des enjeux. Explosion du nombre de données. La place des objets connectés dans le Big Data. Données structurées, semi-structurées, non structurées. Comment disposer de données de qualité ? Les limites des architectures actuelles. Définition d'un système Big Data. Différences entre BI, Big Data et Data Science ? Sécurité éthique et enjeux juridiques du Big Data. Données personnelles. Informations sensibles, interdites de collecte. La CNIL régule les données numériques. Accords intra-pays. Open data. Philosophie des données ouvertes et les objectifs. Bénéfices escomptés. Synergie avec le Big Data. Les projets Big Data en entreprise. Spécificités d'un projet Big Data. Enjeux stratégiques et organisationnels. L'innovation constante accélère le phénomène. Nouvelles technologies de transmission. Objets connectés et domotique. Zoom sur le marché des biens et services proposés aux consommateurs. Fusionner les données exogènes et endogènes pour mieux comprendre les usagers. Méthodes de traitement de l'information : du traitement batch, au traitement temps réel. Architectures décisionnelles d'aujourd'hui. Les lacs de données en pleine émergence. Exemple de cahier des charges. * Architecture et infrastructure Big Data. Cohabitation des solutions SGBDR et NoSQL. Outils permettant d'extraire les données (ETL) La nécessité de nettoyer les données (dataquality) Exemple de traitement avec un ETL dédié Big data. Apport d'un MDM (Master Data Manager) Stockage avec Hadoop. Solutions big data alternatives. L'analyse des données et la visualisation. Définition de l'analyse statistique. Requêter avec Hive. Analyser les données. Intégrer les données grâce à Sqoop. Le développement d'applications Big Data. La philosophie de MapReduce (clef, valeur) Apport d'Apache Spark. Machine learning et prédiction des données. Interconnexion avec les outils SPSS, R, SAS. Conclusion : Quelle famille et quel type de langage pour quel besoin ? La visualisation des données (Dataviz) Ce que les statistiques ne disent pas. Data visualisation et cas d'usage concrets. Quels graphes pour quels usages ? Représentation de données complexes. Savoir communiquer sur les analyses de données (Data Storytelling) Synthèse des principaux outils utilisés dans les projets. Démonstration d'un environnement distribué Hadoop. Moteurs de recherche de grande envergure. Présentation Lucene, Solr. Mécanisme de traitement. Gestion des journaux applicatifs. Mécanismes et architecture Apache Flume. Relation entre Cloud et Big Data. Motivation entre clouds publics et privés. Clouds de stockage. Se reconcentrer sur les problématiques métiers, grâce aux services managés. Cas d'usage et success-stories.
Coût de la formation : Consulter l'organisme
14 heures
En centre https://www.plb.fr/formation/aide-%E0-la-d%E9cision/formation-big-data,31-24887.php
Niveau d’entrée : Bac;Culture generale de base en informatique (OS, base de donnees, etc.).;
PLB Consultant
01 43 34 90 94
plb@plb.fr