Europresse : de la requête à la collecte

Publié par L'équipe CERES le 09 juin, 2023

Résumé

Thibault Grison vous propose 4 vidéos sur 4 éléments liés au requêtage sur Europrese:

  1. définir des mots-clés
  2. définir des sources
  3. définir des périodes temporelles
  4. utiliser la visualisation

Gaël Lejeune vous explique dans les vidéos suivantes comment extraire un corpus d’Europresse en html et pouvoir le transformer en XML (pour l’outil de textométrie TXM par exemple) ou en txt :

  1. Connexion Europresse
  2. Récupérer via la version classique un corpus en html
  3. Utilisation de Europarser qui transforme ce HTML en XML ou TXT : https://ceres.huma-num.fr/europarser/

L’ensemble des vidéos est accessible ici https://dropsu.sorbonne-universite.fr/s/ac6TPHLPBDmEwFo