Sciences de données - Machine Learning

Durée

60 heures

Durée calendrier

8 semaines

Qu'est-ce que c'est?

Description

L'apprentissage automatique et l'intelligence artificielle (IA) sont partout! Si vous voulez savoir comment les entreprises extraient le sens et les idées de vastes ensembles de données, ce cours de science des données vous donnera les bases dont vous avez besoin. La science de données est une carrière enrichissante qui vous permet de résoudre certains des problèmes les plus intéressants du monde!

Objectifs

Avec ce cours, les participants comprendront les techniques utilisées par de vrais scientifiques des données et des praticiens de l’apprentissage automatique dans l’industrie de la technologie pour résoudre de vrais problèmes d’affaires, et les préparera à entrer dans cette carrière passionnante. Voici quelques éléments de contenu traités dans la formation :

  • Introduction à la programmation avec Python et R
  • Décrire et exécuter le processus de fouille de données
  • Appliquer une technique descriptive
  • Appliquer une technique prédictive
  • Décrire et exécuter des algorithmes de Machine Learning supervisé
  • Décrire et exécuter des algorithmes de Machine Learning non supervisé
  • Projet intégrateur en approche d’apprentissage non supervisé
  • Introduire des réseaux de neurones artificiels avec Tensorflow et Keras

Clientèle cible

Analystes et administrateurs de bases de données, analystes et consultants en informatique, programmeurs et développeurs, ingénieurs informaticiens, techniciens en informatique, ainsi que toute personne qui a des connaissances en informatique (algorithmiques, bases de données, statistiques).

Formule d'enseignement

  • En ligne

    Aucune date annoncée

Comment cette formation est-elle reconnue?

Une attestation de participation sera remise aux personnes qui auront assisté à 75 % des heures de formation.

Que vais-je apprendre?

Contenu

À l’issue du cours, les participants seront en mesure d’effectuer les tâches suivantes :


• Explorer des données avec R et Python

• Utiliser des pandas Data Frames pour résoudre des tâches complexes

• Nettoyer des données d'entrées pour supprimer les valeurs aberrantes

• Prétraiter des variables contenant des données manquantes

• Nettoyer et transformer les ensembles de données pour une construction réussie de modèles d'apprentissage automatique

• Manipuler et transformer des variables numériques pour extraire le pouvoir le plus prédictif

• Appliquer différentes techniques de transformations et de variables pour rendre les fonctionnalités plus prévisibles

• Utiliser matplotlib et seaborn, ggplot2 pour la visualisation de données

• Utiliser plotly pour des visualisations interactives

• Faire des prédictions à l'aide d'une régression linéaire, d'une régression polynomiale et d'une régression multivariée

• Classer les données en utilisant la mise en cluster K-Means, les machines à vecteurs de support (SVM), KNN, les arbres de décision, Naive Bayes et PCA

• Utiliser Spark (MLLib) pour l'analyse de données volumineuses (Big Data)

• Implémenter des algorithmes d'apprentissage automatique

• Utiliser train / test et la validation croisée K-Fold pour choisir et ajuster vos modèles  Comprendre à quoi ressemble la détérioration de modèle

• Appliquer trois niveaux de maintenance de modèle pour empêcher la détérioration de modèle

• Introduire des réseaux de neurones artificiels avec Tensorflow et Keras


Qui va m'accompagner?

Qui offre cette formation?