Atelier à venir
TXM pour l’analyse de corpus de textes.
Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie.
Informations pratiques :
- 14 novembre 2024, 16h-18h, salle D117 de la Maison de la Recherche de Sorbonne Université (28 rue Serpente, 75006 Paris)
- Atelier en présentiel uniquement.
- Animé par Gaël Lejeune (STIH/CERES)
- Inscription gratuite mais obligatoire en cliquant sur ce lien.
Archives
De nombreux outils de textométrie, en particulier de TAL (Traitement Automatique du Langage Naturel) sont régulièrement présentés dans le cadre des ateliers CERES. Le TAL est une des disciplines dans laquelle le CERES est très actif. Les outils listés ci-dessous sont ceux qui ont fait l’objet d’ateliers.
TXM et Antconc
Les deux outils TXM et Antconc ont fait l’objet de plusieurs ateliers proposés par le CERES, les 21 octobre 2021, 10 novembre 2022, 26 novembre 2023 et 16 mai 2024.
Description des enjeux abordés lors de ces ateliers :
Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie. Deux outils gratuits répondent à ces enjeux : Antconc et TXM. Le premier est très pratique pour effectuer facilement des recherches simples pour l’analyse de données textuelles ou encore l’analyse de discours. Le second offre des fonctionnalités beaucoup plus riches, mais au prix d’un temps de formation plus long. Dans ces ateliers, il a été présenté les avantages respectifs des deux outils, ainsi qu’une série d’exemples pour familiariser les chercheur-euses avec ces outils.
Pour aller plus loin :
- Installer TXM
- Ecouter un des podcasts CERES spécifiquement dédié à TXM
- Suivre l’excellent tutoriel de Flora Badin
Voyant Tools
Voyant Tools est une plateforme qui offre un environnement exhaustif et simplifié de lecture et d’analyse de textes. Son but est de fournir aux utilisateur·trices un panorama de méthodes de traitements textuels, afin de les aider à s’orienter. Parmi les fonctionnalités disponibles, nous retrouvons des concordanciers, des options de création de graphiques, ou encore des outils statistiques qui peuvent s’appliquer sur l’intégralité d’un corpus ou sur un simple échantillon. Facile à prendre en main, Voyant Tools est un outil d’ouverture à la recherche sur des documents textuels, qui prend en compte de nombreux formats de documents. Il propose également plusieurs langues d’entrée.
Un atelier a été proposé le 9 février 2023 par Julien Bezançon et Fatou Sow.
Sketch Engine
Sketch Engine est un outil en ligne qui permet de faire des requêtes dans des corpus textuels en près de 100 langues différentes. Si les fonctionnalités de Sketch Engine sont globalement équivalentes à celles d’outils de textométrie comme TXM ou Hyperbase, la disponibilité immédiate de nombreux corpus constituent le gros point fort de l’outil. Il est à noter que Sketch Engine est un outil qui nécessite une licence (payante au bout de 30 jours).
Un atelier animé par Antoine Gautier (STIH) a eu lieu le 29/02/2024.