Le traitement automatique des langues

Publié par Gaël Lejeune le 05 avril, 2023

Image empruntée à Brewbooks sur Flickr, accessible en CC BY-SA 2.0.

Description

Ce dépôt Git vise à rassembler des supports de cours pouvant faire office de tutoriels sur différentes tâches de TAL (Traitement automatique des langues), qui peuvent être utilisés à différents niveaux.

Ces cours n’ont pas vocation à constituer des approches état de l’art ni des manières optimales de programmer (que ce soit en temps de calcul ou en organisation du code) et surtout pas des recettes toutes faites. Par contre ils ont été conçus pour :

  • Proposer des approches simples (ou baselines)
  • Aider à la décomposition de problèmes
  • Permettre d’identifier des verrous
  • Évaluer (automatiquement ou visuellement) ces approches

Pour chaque thème il y a un PDF avec les sources en Tex, ainsi que le notebook associé (qui figure dans le dossier ressources).

Thèmes abordés

  • Reconnaissance de Langues dans un corpus multilingue
  • Chaînes de caractères
  • Listes et dictionnaires
  • Boucle for et instructions conditionnelles
  • Lecture et écriture de fichiers

Remerciements

  • Méthodes/Approches : Jacques Vergne, Emmanuel Giguet
  • Données/Corpus : Romain Brixtel, Charlotte Lecluze
  • Amélioration des supports dans le cadre des cours : Tian Tian, Carlos Gonzales, Andrea Briglia, Antoine Lebrun
  • Corrections et Conseils : Tiago André De Carvalho Béné