Ateliers Textométrie 29/02 Sketch Engine

Publié par L'équipe CERES le 29 février, 2024

De nombreux outils de textométrie, en particulier de TAL (Traitement Automatique du Langage Naturel) sont régulièrement présentés dans le cadre des ateliers CERES. Le TAL est une des disciplines dans laquelle le CERES est très actif. Les outils listés ci-dessous sont ceux qui ont fait l’objet d’ateliers.

TXM et Antconc

Les deux outils TXM et Antconc ont fait l’objet de plusieurs ateliers proposés par le CERES, les 21 octobre 2021, 10 novembre 2022 et 26 novembre 2023.

Description des enjeux de ces ateliers :

Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie. Deux outils gratuits répondent à ces enjeux : Antconc et TXM. Le premier est très pratique pour effectuer facilement des recherches simples pour l’analyse de données textuelles ou encore l’analyse de discours. Le second offre des fonctionnalités beaucoup plus riches, mais au prix d’un temps de formation plus long. Dans ces ateliers, il a été présenté les avantages respectifs des deux outils, ainsi qu’une série d’exemples pour familiariser les chercheur-euses avec ces outils.

Pour aller plus loin :

Voyant Tools

Voyant Tools est une plateforme qui offre un environnement exhaustif et simplifié de lecture et d’analyse de textes. Son but est de fournir aux utilisateur·trices un panorama de méthodes de traitements textuels, afin de les aider à s’orienter. Parmi les fonctionnalités disponibles, nous retrouvons des concordanciers, des options de création de graphiques, ou encore des outils statistiques qui peuvent s’appliquer sur l’intégralité d’un corpus ou sur un simple échantillon. Facile à prendre en main, Voyant Tools est un outil d’ouverture à la recherche sur des documents textuels, qui prend en compte de nombreux formats de documents. Il propose également plusieurs langues d’entrée.

Un atelier a été proposé le 9 février 2023 par Julien Bezançon et Fatou Sow.

Sketch Engine

Sketch Engine est un outil en ligne qui permet de faire des requêtes dans des corpus textuels en près de 100 langues différentes. Si les fonctionnalités de Sketch Engine sont globalement équivalentes à celles d’outils de textométrie comme TXM ou Hyperbase, la disponibilité immédiate de nombreux corpus constituent le gros point fort de l’outil. Il est à noter que Sketch Engine est un outil qui nécessite une licence (payante au bout de 30 jours).

Un atelier animé par Antoine Gautier (STIH) a lieu le 29/02/2024.