Formation : Machine learning avec Python du POC à la production

Python au service de la data science

Machine learning avec Python du POC à la production

Python au service de la data science

4,5 / 5

New

Le cours vous enseigne l'utilisation de Python pour la Data Science : la préparation des données, l'entraînement et la mise à disposition du modèle et des résultats. Les participants apprennent à utiliser divers outils et bibliothèques Python pour effectuer des tâches courantes de data science et de machine learning.

INTER

INTRA

SUR MESURE

Cours pratique en présentiel ou à distance
Disponible en anglais, à la demande

Réf. PYD

3j - 21h00

Prix : 1910 € H.T.

Pauses-café et
déjeuners offerts

Dates, lieux et inscription

Télécharger le programme

Partager cette formation

Description
Programme
Financement
Dates

Objectifs pédagogiques

À l’issue de la formation, le participant sera en mesure de :

	Mettre en place les différentes étapes de préprocessing avec Python
	Savoir choisir le modèle approprié pour une problématique donnée
	Appliquer et évaluer des modèles sur des données réelles
	Mettre à disposition un modèle dans le cloud et permettre son interrogation par le biais du API

Public concerné

Toutes personnes intéressées par l'apprentissage de Python et son application à la data science et au machine learning.

Prérequis

Connaissance du langage Python. Connaissances théoriques sur le machine learning.

Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant ce test.

Méthodes et moyens pédagogiques

Travaux pratiques

La formation met l’accent sur la mise en pratique, afin d’assurer l’autonomie des participants.

Méthodes pédagogiques

Conçue par des experts, suite à leur retours d'expérience, cette formation passe en revue, les différentes étapes d'un projet de Machine Learning de sa conception à sa mise en production.

Modalités d'évaluation

Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…

Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Import des données et preprocessing

L'environnement de développement Python / Anaconda / Jupyter Notebook.
Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
Traitement des valeurs manquantes : imputation par la moyenne, médiane, interpolation, knn…
Traitement des Outliers : analyse graphique, méthode de l’IQR, Z-score.
Standardisation.
Normalisation : Skewness et Kurtosis.
Données non balancées : Undersampling, Oversampling, SMOTE.

Travaux pratiques

Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas. Mise en place de l’ensemble des pré-traitements à l’aide des librairies python spécifiques.

2
Entraînement de modèles et évaluation

Modèles d’apprentissage supervisés et non-supervisés les plus courants.
Entraînement de modèles avec Scikit-learn.
Méthodes d’évaluations : savoir choisir les bonnes métriques pour chaque problématique.

Travaux pratiques

Entraînement de plusieurs modèles supervisés et non supervisés, comparaison des performances et choix du meilleur modèle.

3
Optimisation des modèles et log des performances

Présentation des librairies Optuna, Hyperopt.
Présentation de l’approche Grid Search pour identifier les meilleurs hyper paramètres d’un modèle.
Log des hyper paramètres et des performances dans Mlflow.

Travaux pratiques

Optimisation des modèles élaborés dans la partie précédente et log des métriques / hyperparamètres dans Mlflow.

4
Modèle et Data Drift

Intérêt de vérifier le modèle Drift et le Data Drift.
Présentation des librairies Evidently et Streamlit.

Travaux pratiques

Mise en place d’un Dashboard Evidently pour monitorer le Drift des données.

5
Industrialisation : déploiement dans le cloud

Présentation du service AWS EC2.
Présentation de Flask pour le pour la mise à disposition d’un modèle de machine learning par le biais d’une API.
Présentation de divers outils de connexion à l’environnement virtuel tels que Putty, Visual Studio Code…
Déploiement du code par le biais de GitHub.

Travaux pratiques

Déploiement d’un modèle sur un environnement cloud avec la librairie Flask.

Parcours certifiants associés

Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Parcours certifiant intégrer des modèles et des services d’intelligence artificielle - Réf. ZIS

Solutions de financement

Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.

Avis clients

4,5 / 5

Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.

PEREZ JONATHAN C.

02/12/24

5 / 5

La formation correspond à mes attentes

LUC T.

02/12/24

4 / 5

formation très dense avec beaucoup de sujets à voir en un temps très court , du coup le formateur est obligé de sacrément élaguer une formation avec un contenu très riche/interessant

TRISTAN P.

02/12/24

5 / 5

Le contenu était très intéressant

> Afficher plus d’avis clients

Horaires

les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.

Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.

Dates et lieux

Sélectionnez votre lieu ou optez pour la classe à distance puis choisissez votre date.

Classe à distance

Dernières places

Date garantie en présentiel ou à distance

Session garantie

Formation : Machine learning avec Python du POC à la production

Machine learning avec Python du POC à la production

1 Import des données et preprocessing

2 Entraînement de modèles et évaluation

3 Optimisation des modèles et log des performances

4 Modèle et Data Drift

5 Industrialisation : déploiement dans le cloud

1
Import des données et preprocessing

2
Entraînement de modèles et évaluation

3
Optimisation des modèles et log des performances

4
Modèle et Data Drift

5
Industrialisation : déploiement dans le cloud