Introduction à la formation Dataiku
Présentation générale de la formation Dataiku
Tour de table, présentation des participants, des contextes professionnels…
Vue d’ensemble de la plateforme Dataiku
Les fonctionnalités Dataiku : nettoyage de données, création de dashboards, deep learning…
Dataiku DSS vs Dataiku Online
Positionnement de Dataiku dans la chaîne de traitement de la data
L’interface Dataiku DSS (Data Science Studio)
Installation et connexion
Page d’accueil
Collaboration
Importer des données
Schéma des données
Analyser les données
Graphiques
Jobs
Manipulation de données
Les Recipes (visual, code, plugin…)
Transformer les données avec le recipe Prepare
Formula
Formatter des dates
Group By
Jointures : inner, left, right, full
Mise en forme du flow
Compilation
Le Lab
Notebooks
Visualisations
Les visualisations de l’onglet Statistics
L’interface worksheet
Visualisations sous DSS
Cartographies
Dashboards
Machine Learning : les possibilités offertes par Dataiku
Les différents types d’algorithmes d’apprentissage : supervisé, non supervisé, par renforcement…
Apprentissage supervisé : régression, régression linéaire simple et classification (arbres de décisions, SVM linéaire)
Apprentissage non supervisé : segmentation ou clustering, analyse factorielle et association
Préparer un jeu de données pour le Machine Learning (feature selection, feature engineering…)
AutoML vs mode Expert
Amélioration et personnalisation d’un modèle avec MLFlow
ML Tools
Le projet MLLib : MLflow Tracking, MLflow Projects et MLflow Models
Installation et prise en main