Passer au contenu principal

Traitement des données textuelles avec l’apprentissage automatique

Durée

20 heures

Qu'est-ce que c'est?

Description

Cette formation vise à permettre au professionnel de l’industrie d’être en mesure utiliser des techniques statistiques du traitement automatique de la langue naturelle (TALN). Elle se veut axée sur la pratique, afin d’outiller le professionnel et le rendre opérationnel rapidement.

Le traitement automatique de la langue naturelle (TALN), un sous-domaine de l'intelligence artificielle, est de plus en plus utilisé dans l’industrie, pour analyser des documents, extraire de l’information dans des textes ou créer des assistants virtuels (chatbots) par exemple.

Pour modéliser adéquatement un problème d’affaire pouvant être réglé à partir du TALN, après avoir préparé ses données, il faut en assurer la classification avant de pouvoir résoudre un problème d’affaire.

Cette formation en intelligence artificielle fait partie du Parcours Traitement du langage naturel (NLP).


Objectif général

Amener le participant à être en mesure de définir une procédure, incluant un choix d’algorithmes, pour l’entrainement d’un modèle statistique afin d’assurer la classification de texte en vue de résoudre un problème d’affaire.

Objectifs

  • Départager des problèmes de classification de texte des problèmes de classification de séquence et de modélisation de langue
  • Utiliser différents algorithmes de représentation de textes pour faire de la classification de textes
  • Expliquer un problème un problème de classification de séquence à l’aide de l’algorithme HMM
  • Utiliser une librairie utilisant l’apprentissage profond pour résoudre un problème de classification de séquence
  • Appliquer une technique statistique pour entraîner un modèle de langue

Clientèle cible

S’adresse aux professionnels de l’industrie œuvrant dans des postes liés à la programmation ou à l’exploitation de données, principalement des développeurs amenés à développer des outils de traitement automatique du langage.

Préalables

Formation Notions de base de l’apprentissage automatique, formation Notions de base de l’apprentissage profond et des réseaux de neurones, formation Préparation, nettoyage et visualisation des données textuelles ou connaissances équivalentes :

  • Connaissance de base en programmation (langage Python suggéré)
  • Connaître les notions de base de l'algèbre linéaire et du calcul différentiel

Formule d'enseignement

  • En ligne à votre rythme

    Offerte en tout temps

    Autoformation

    365 jours pour compléter la formation à partir du moment où vous la commencerez.

Que vais-je apprendre?

Contenu

Partie 0 : Introduction au traitement des données textuelles avec l'apprentissage automatique

Partie 1 : Classification de texte avec encodage simple

  • Module 1.1 : Classification avec modèle naïf bayesien
  • Module 1.2 : Classification par régression logistique
  • Module 1.3 : Sélection d’attributs dans la représentation de textes
  • Module 1.4 : TF-IDF
  • Module 1.5 : Représentation par n-grammes
  • Module 1.6 : Création d’attributs de représentation

Partie 2 : Modèle de langue

  • Module 2.1 : Modèle de langues statistique
  • Module 2.2 : Exemple - Modèles de langue et dictées trouées avec mots précédents comme contexte
  • Module 2.3 : Exemple - Modèles de langue et dictées trouées avec mots précédents et suivants comme contexte

Partie 3 : Classification de séquences

  • Module 3.1 : Classification de séquences statistique
  • Module 3.2 : Exemple - Entraînement de reconnaisseur d'entités nommées
  • Module 3.3 : Exemple - Classification de textes filtrés par classe grammaticale


Stratégies pédagogiques

Formation autonome en mode asynchrone par lectures, démonstration et exercices sur une plateforme d’apprentissage expérientielle (PAX).


PAX Expérience

PAX est une plateforme unique d’apprentissage novatrice, dite intelligente, qui regroupe des outils d’apprentissage adaptatifs et interactifs. Elle agit véritablement comme un tuteur intelligent permettant à l’apprenant d’apprendre par déduction en connaissant la nature et la source de ses erreurs.

Avantages distinctifs de PAX :

  • La théorie est exposée sous forme de modules multimédias interactifs
  • Des exercices interactifs permettent l'approfondissement des notions théoriques enseignées. Ceux-ci sont analysé par PAX, qui offre une rétroaction immédiate et individuelle afin d'aider le participant à corriger ses erreurs par déduction
  • Des quiz chronométrés permettent au participant de tester ses acquis autant de fois qu’il le désire
  • Un forum contextuel où les fils de discussions sont liés aux contenus (modules-exercices et quiz)
  • Un forum animé par des experts en Python

Découvrez tous les avantages de PAX Expérience : https://www.fsg.ulaval.ca/etudes/formation-continue/pax-experien

Qui va m'accompagner?

Marc Parizeau

Professeur titulaire

Pierre Gravel

Professionnel de recherche à l'Institut intelligence de données (IID) de l'Université Laval, Ph.D.

Et si je souhaite aller plus loin?

Ce cours est aussi offert dans un programme qui pourrait vous plaire. Développez davantage vos compétences sur le sujet en vous y inscrivant.

Qui offre cette formation?

Pour développer vos compétences et élargir vos horizons professionnels, la Formation continue de la Faculté des sciences et de génie vous propose une offre de formation en constante évolution. Nous offrons des formations pour tous les besoins : perfectionnement court, formations plus longues ainsi que des formations en entreprise et sur mesure. Profitez de la flexibilité de nos formations et mettez vos compétences à jour grâce à notre offre de perfectionnement.