Gaël Lejeune (STIH) expose la façon dont Europresse permet de collecter des corpus d’articles de presse pouvant faire l’objet d’analyses automatisées par la suite. Il évoque également les limites de cette base de données tout en discutant des méthodes de collecte et d’analyse des corpus de presse qui font notamment surgir une problématique autour des formats des données de la recherche. Gaël Lejeune explicite enfin son processus de développement d’un outil d’automatisation de collecte de corpus à partir d’Europresse, aujourd’hui mis à disposition des chercheurs par l’unité de service CERES.