Introduction à la formation Big Data Foundation
Définition du Big Data
Historique, évolutions technologiques derrière le Big Data
Apports et caractéristiques majeures
La règle des 3V : Volume, Velocity et Variety
Panorama des principaux acteurs et technologies du marché (Hadoop, MongoDB…)
Domaines d’application : secteur bancaire, marketing, internet des objets, people analytics…
Limites du Big Data
Notions de vie privée et éthique : conformité, défis et approche
Grands projets Big Data : enjeux et parties prenantes
Sources du Big Data
Différents types de données
Données d’entreprise : Oracle, SAP, Microsoft, entrepôt de données (data warehouse), données non-structurées
Réseaux sociaux : Facebook, Twitter, LinkedIn…
Données publiques : Opendata, économiques, financières, comportementales, organismes de réglementation…
Accéder aux sources de données
Obtenir les données
Data Mining
Définition du Data Mining
Principes fondamentaux
Méthodes prédictives et méthodes descriptives
Techniques de Data Mining : classification, association, clustering…
Algorithmes communément utilisés
Machine Learning
Outils (SAS, SPSS, Weka, KNIME, R)
Technologies Big Data – Zoom sur Hadoop et MongoDB
Apache Hadoop
Concepts de base
Composants principaux et extensions
Téléchargement, installation et configuration
Vue d’ensemble de l’architecture d’Hadoop
Configurer MapReduce
Traitement de données (Data Processing) avec Hadoop
MongoDB
Fondamentaux
Réplication et Sharding
Ecosystème : langages, drivers, intégration avec Hadoop, outils
Téléchargement, installation et configuration
Base de données de documents
Modèle de données de documents (Data Modelling)
Passage de l’examen de certification Big Data Foundation
Révisions, trucs et astuces pour réussir l’examen
Modalités : en ligne et en anglais, QCM de 40 questions, 60 minutes (15 minutes supplémentaires pour les non-anglophones), 65% de bonnes réponses nécessaires pour l’obtention de la certification