Gaël Lejeune

Poste au CERES : Directeur adjoint

Titre et discipline : Maître de Conférences en Informatique

Laboratoire de rattachement : Sorbonne Université/STIH

Thèmes de recherche : Traitement Automatique des Langues, Classification, Données hétérogènes, Multilinguisme, OCR/HTR

Collaborations et projets

  • Antonomaz (Karine Abiven, Jean-Baptiste Tanguy) : Numérisation et Traitement Automatique de textes du XVIIème siècle
  • Waddle (Adrien Barbaresi BBAW Berlin, Emmanuel Giguet GREYC Caen): développement et évaluation de méthodes de web scraping
  • Daniel (Steve Mutuvi, Emanuela Boros, Antoine Doucet, LRI la Rochelle et Adam Jatowt CS department Innsbruck) : Veille Épidémiologique Multilingue
  • ROC’n NER ( Caroline Parfait, Jean-Baptiste Tanguy, Motasem Alrahabi, Glenn Roe) : Articulation de l’OCR et de la reconnaissance d’entités nommées
  • Memes (Julien Bezançon, Karën Fort, Antoine Gautier, Gilles Siouffi, Lichao Zhu) : Extraction automatique et analyse par Myriadisation d’Expressions Semi-figées.

Publications

Pour une liste à jour : CV Scholar

2022. Avec Khoa Nguyen and Thierry Delahaut and Emanuela Boros and Antoine Doucet, ”Contextualizing Emerging Trends in Financial News Articles

2022. Avec Khoa Nguyen and Thierry Delahaut and Emanuela Boros and Antoine Doucet, ”Utilizing Keywords Evolution in Context for Emerging Trend Detection in Scientific Publications” Adapting Transformers for Detecting Emergency Events on Social Media

2022. Avec Emanuela Boros and Mickael Coustaty and Antoine Doucet, ”Adapting Transformers for Detecting Emergency Events on Social Media

2022. Avec Emanuela Boros and Khoa Nguyen and Antoine Doucet, ”Assessing the Impact of OCR Noise on Multilingual Event Detection over Digitised Documents

2022. Avec Karine Abiven and Alexandre Bartz and Jean-Baptiste Tanguy, ”Vers une collection numérique des libelles parus pendant la fronde, ou comment relier des mazarinades

2022. Avec Fanny Ducel and Karën Fort and Yves Lepage, ”Do we Name the Languages we Study? The #BenderRule in LREC and ACL articles

2022. Avec Ibtihel Ben Ltaifa and Toufik Boubehziz and Andrea Briglia and Corina Chutaux and Yoann Dupont and Carlos-Emiliano González-Gallardo and Caroline Koudoro-Parfait , ”Stylo@DEFT2022 : Notation automatique de copies d’étudiant$\times$e$\times$s par combinaisons de méthodes de similarité

2022. Avec Caroline Koudoro-Parfait and Richy Buth, ”Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique

2022. Avec Stephen Mutuvi and Emanuela Boros and Antoine Doucet and Adam Jatowt and Moses Odeo, ”Fine-tuning de modèles de langues pour la veille épidémiologique multilingue avec peu de ressources

2022. Avec Fanny Ducel and Karën Fort and Yves Lepage, ”Langues “ par défaut ” ? Analyse contrastive et diachronique des langues non citées dans les articles de TALN et d’ACL

2022. Avec Manuela Yapomo , ”Les innovations lexicales dans le domaine des énergies renouvelables : exploitation du contraste de corpus comme moyen de repérage