Poste au CERES : Directeur adjoint
Titre et discipline : Maître de Conférences en Informatique
Laboratoire de rattachement : Sorbonne Université/STIH
Thèmes de recherche : Traitement Automatique des Langues, Classification, Données hétérogènes, Multilinguisme, OCR/HTR
Collaborations et projets
- Antonomaz (Karine Abiven, Jean-Baptiste Tanguy) : Numérisation et Traitement Automatique de textes du XVIIème siècle
- Waddle (Adrien Barbaresi BBAW Berlin, Emmanuel Giguet GREYC Caen): développement et évaluation de méthodes de web scraping
- Daniel (Steve Mutuvi, Emanuela Boros, Antoine Doucet, LRI la Rochelle et Adam Jatowt CS department Innsbruck) : Veille Épidémiologique Multilingue
- ROC’n NER ( Caroline Parfait, Jean-Baptiste Tanguy, Motasem Alrahabi, Glenn Roe) : Articulation de l’OCR et de la reconnaissance d’entités nommées
- Memes (Julien Bezançon, Karën Fort, Antoine Gautier, Gilles Siouffi, Lichao Zhu) : Extraction automatique et analyse par Myriadisation d’Expressions Semi-figées.
Publications
Pour une liste à jour : CV Scholar
2022. Avec Khoa Nguyen and Thierry Delahaut and Emanuela Boros and Antoine Doucet, ”Contextualizing Emerging Trends in Financial News Articles”
2022. Avec Khoa Nguyen and Thierry Delahaut and Emanuela Boros and Antoine Doucet, ”Utilizing Keywords Evolution in Context for Emerging Trend Detection in Scientific Publications” Adapting Transformers for Detecting Emergency Events on Social Media
2022. Avec Emanuela Boros and Mickael Coustaty and Antoine Doucet, ”Adapting Transformers for Detecting Emergency Events on Social Media”
2022. Avec Emanuela Boros and Khoa Nguyen and Antoine Doucet, ”Assessing the Impact of OCR Noise on Multilingual Event Detection over Digitised Documents”
2022. Avec Karine Abiven and Alexandre Bartz and Jean-Baptiste Tanguy, ”Vers une collection numérique des libelles parus pendant la fronde, ou comment relier des mazarinades”
2022. Avec Fanny Ducel and Karën Fort and Yves Lepage, ”Do we Name the Languages we Study? The #BenderRule in LREC and ACL articles”
2022. Avec Ibtihel Ben Ltaifa and Toufik Boubehziz and Andrea Briglia and Corina Chutaux and Yoann Dupont and Carlos-Emiliano González-Gallardo and Caroline Koudoro-Parfait , ”Stylo@DEFT2022 : Notation automatique de copies d’étudiant$\times$e$\times$s par combinaisons de méthodes de similarité”
2022. Avec Caroline Koudoro-Parfait and Richy Buth, ”Reconnaissance d’entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique”
2022. Avec Stephen Mutuvi and Emanuela Boros and Antoine Doucet and Adam Jatowt and Moses Odeo, ”Fine-tuning de modèles de langues pour la veille épidémiologique multilingue avec peu de ressources”
2022. Avec Fanny Ducel and Karën Fort and Yves Lepage, ”Langues “ par défaut ” ? Analyse contrastive et diachronique des langues non citées dans les articles de TALN et d’ACL”
2022. Avec Manuela Yapomo , ”Les innovations lexicales dans le domaine des énergies renouvelables : exploitation du contraste de corpus comme moyen de repérage”