Préparation, nettoyage et visualisation des données textuelles
À propos de cette formation
Durée
Description
Vous ne savez pas par quelle autoformation commencer? Consultez le cheminement proposé afin de maximiser le développement de vos connaissances.
Cette formation vise à permettre au professionnel de l’industrie d’être en mesure de préparer des données textuelles pour un projet de traitement automatique de la langue naturelle (TALN). Cette formation se veut axée sur la pratique, afin d’outiller le professionnel et le rendre opérationnel rapidement.
Le traitement automatique de la langue naturelle (TALN), un sous-domaine de l'intelligence artificielle et de l’apprentissage profond, est de plus en plus utilisé dans l’industrie pour analyser des documents, extraire de l’information dans des textes ou créer des assistants virtuels (chatbots) par exemple.
Cependant, pour réaliser un projet de TALN, il est essentiel de préparer ses données.
Objectif général
Amener le participant à être en mesure de définir une procédure de nettoyage et de préparation des données textuelles appropriée spécifique à un type de projet en traitement automatique du langage naturel.
Objectifs
- Appliquer des techniques de préparation de données textuelles
- Appliquer des techniques de visualisation de données textuelles
- Appliquer des techniques de normalisation de texte
- Créer une procédure de nettoyage de données textuelles
- Créer une procédure de visualisation de données textuelles
Clientèle cible
Cette formation s’adresse aux professionnels de l’industrie œuvrant dans des postes liés à la programmation ou à l’exploitation de données.
Préalables
Formation Notions de base de l'apprentissage automatique et formation Notions de base de l’apprentissage profond et des réseaux de neurones ou connaissances équivalentes :
- Connaissance de base en programmation (langage python suggéré)
Formule d'enseignement
En ligne à votre rythme
Offerte en tout temps
Autoformation
365 jours pour compléter la formation à partir du moment où vous la commencerez.
Comment cette formation est-elle reconnue?
Une attestation de participation reconnaissant les 20 heures de formation continue est décernée, après la formation, à chacun des participants qui respectent les conditions d'attestation.
Que vais-je apprendre?
Contenu
Partie 0 : Introduction
Partie 1 : Prétraitement des donnés
- Module 1.1 : Lecture de fichier et nettoyage de données
- Module 1.2 : Analyse de données textuelles
Partie 2 : Analyse de mots
- Module 2.1 : Introduction aux regex
- Module 2.2 : La tokenisation
- Module 2.3 : Fréquence d’apparition des tokens
- Module 2.4 : Introduction aux N-grammes
- Module 2.5 : Lemmatisation et Stemming
Partie 3 : Introduction aux librairies de NLP
- Module 3.1 : Introduction à Pandas
- Module 3.2 : Librairies de visualisation
- Module 3.3 : Introduction à SpaCy
- Module 3.4 : Introduction à NLTK
- Module 3.5 : Introduction au Spellchecking
Précisions sur la formation
Cette formation est une autoformation. Vous pouvez débuter votre apprentissage au moment où vous le souhaitez. La plateforme de la formation vous sera accessible pour une durée de 365 jours suivant votre première connexion à PAX.
PAX Expérience
PAX est une plateforme unique d’apprentissage novatrice, dite intelligente, qui regroupe des outils d’apprentissage adaptatifs et interactifs. Elle agit véritablement comme un tuteur intelligent permettant à l’apprenant d’apprendre par déduction en connaissant la nature et la source de ses erreurs.
Avantages distinctifs de PAX :
- La théorie est exposée sous forme de modules multimédias interactifs
- Des exercices interactifs permettent l'approfondissement des notions théoriques enseignées. Ceux-ci sont analysé par PAX, qui offre une rétroaction immédiate et individuelle afin d'aider le participant à corriger ses erreurs par déduction
- Des quiz chronométrés permettent au participant de tester ses acquis autant de fois qu’il le désire
- Un forum contextuel où les fils de discussions sont liés aux contenus (modules-exercices et quiz)
- Un forum animé par des experts en Python
Découvrez tous les avantages de PAX Expérience : https://www.fsg.ulaval.ca/etudes/formation-continue/pax-experience/
Qui va m'accompagner?
Antoine Prieur
Développeur IA
Charles-Antoine Parent
Scientifique de données, baccalauréat en actuariat et maîtrise en IA
Pierre Snell
Scientifique de données
Qui offre cette formation?
Pour développer vos compétences et élargir vos horizons professionnels, la Formation continue de la Faculté des sciences et de génie vous propose une offre de formation en constante évolution. Nous offrons des formations pour tous les besoins : perfectionnement court, formations plus longues ainsi que des formations en entreprise et sur mesure. Profitez de la flexibilité de nos formations et mettez vos compétences à jour grâce à notre offre de perfectionnement.
Pour tout savoir sur notre offre de formation
Pour plus d'informations
Formation continue de la Faculté des sciences et de génie
Pavillon Adrien-Pouliot, bureau 3120
418 656-2793
formation_continue@fsg.ulaval.ca