Ce module vise à donner aux étudiants une compréhension approfondie des techniques et applications du traitement automatique du langage (TAL). Il couvre les principes et méthodes clés de la manipulation des données textuelles, tout en offrant une mise en pratique à travers un travail pratique (TP). Le contenu est structuré autour des thèmes suivants :
Techniques du TAL : Introduction aux concepts de base du traitement automatique du langage naturel. Les étudiants découvriront les tâches fondamentales du TAL, telles que le prétraitement du texte, l'étiquetage morphosyntaxique, la reconnaissance des entités nommées, et la segmentation des phrases.
Représentation vectorielle du texte : Exploration des méthodes de représentation des textes sous forme vectorielle pour le traitement par les modèles de machine learning. Les approches traditionnelles comme Bag of Words (BoW) et TF-IDF seront présentées, avant de passer à des méthodes plus avancées telles que Word2Vec, GloVe, et les embeddings contextuels.
Niveaux de traitement du texte : Les étudiants apprendront à analyser le texte à différents niveaux, notamment le niveau lexical, syntaxique, sémantique, et pragmatique. Cette section mettra en lumière comment chaque niveau contribue à la compréhension automatique des textes.
Modèles de langue : Présentation des modèles de langue traditionnels (N-grammes) et des modèles modernes (transformers, LSTM, BERT). Les étudiants découvriront comment ces modèles sont construits et utilisés pour diverses tâches NLP telles que la traduction automatique, la génération de texte, et l’analyse contextuelle.
Application à l'analyse des sentiments : Cette partie se concentre sur l'utilisation des techniques NLP pour l'analyse des sentiments dans des textes (e-mails, commentaires, critiques). Les étudiants mettront en pratique les connaissances acquises en appliquant des modèles supervisés et non supervisés pour identifier et classifier les sentiments exprimés.
Le module comporte également des séances de travaux pratiques où les étudiants appliqueront les techniques étudiées. Ils utiliseront des outils et bibliothèques courants en NLP (comme NLTK, spaCy, et Hugging Face) pour des tâches allant du prétraitement du texte à l'analyse des sentiments.
Ce module combine l'apprentissage théorique et la pratique, permettant aux étudiants de développer des compétences complètes en NLP.
- Enseignant: LYDIA LAZIB