Ateliers Textométrie 16/05 TXM niveau 2

Publié par L'équipe CERES le 16 mai, 2024

Prochain atelier : TXM Niveau 2.

Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie.

Le CERES a organisé de nombreux ateliers d’initiation sur le sujet. Cet atelier vise à proposer un approfondissement sur l’outil TXM. Il s’adresse donc en particulier à un public qui a déjà suivi un atelier/tutoriel TXM (au CERES, en ligne ou ailleurs), ou quipratique déjà les fonctions de base de l’outil.

Formulaire d’inscription pour l’atelierTXM (niveau 2) du (16h30-18h30) animé par Gaël Lejeune (STIH/CERES).

L’atelier se déroulera le jeudi 16/05/2024 de 16h30 à 18h30 en salle D117 à la Maison de la Recherche de Sorbonne Université, 28 rue Serpente, 75006, Paris. Il sera animé par Gaël Lejeune.

Merci de vous inscrire pour participer à l’atelier, en cliquant ici.

De nombreux outils de textométrie, en particulier de TAL (Traitement Automatique du Langage Naturel) sont régulièrement présentés dans le cadre des ateliers CERES. Le TAL est une des disciplines dans laquelle le CERES est très actif. Les outils listés ci-dessous sont ceux qui ont fait l’objet d’ateliers.

TXM et Antconc

Les deux outils TXM et Antconc ont fait l’objet de plusieurs ateliers proposés par le CERES, les 21 octobre 2021, 10 novembre 2022 et 26 novembre 2023.

Description des enjeux de ces ateliers :

Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie. Deux outils gratuits répondent à ces enjeux : Antconc et TXM. Le premier est très pratique pour effectuer facilement des recherches simples pour l’analyse de données textuelles ou encore l’analyse de discours. Le second offre des fonctionnalités beaucoup plus riches, mais au prix d’un temps de formation plus long. Dans ces ateliers, il a été présenté les avantages respectifs des deux outils, ainsi qu’une série d’exemples pour familiariser les chercheur-euses avec ces outils.

Pour aller plus loin :

Voyant Tools

Voyant Tools est une plateforme qui offre un environnement exhaustif et simplifié de lecture et d’analyse de textes. Son but est de fournir aux utilisateur·trices un panorama de méthodes de traitements textuels, afin de les aider à s’orienter. Parmi les fonctionnalités disponibles, nous retrouvons des concordanciers, des options de création de graphiques, ou encore des outils statistiques qui peuvent s’appliquer sur l’intégralité d’un corpus ou sur un simple échantillon. Facile à prendre en main, Voyant Tools est un outil d’ouverture à la recherche sur des documents textuels, qui prend en compte de nombreux formats de documents. Il propose également plusieurs langues d’entrée.

Un atelier a été proposé le 9 février 2023 par Julien Bezançon et Fatou Sow.

Sketch Engine

Sketch Engine est un outil en ligne qui permet de faire des requêtes dans des corpus textuels en près de 100 langues différentes. Si les fonctionnalités de Sketch Engine sont globalement équivalentes à celles d’outils de textométrie comme TXM ou Hyperbase, la disponibilité immédiate de nombreux corpus constituent le gros point fort de l’outil. Il est à noter que Sketch Engine est un outil qui nécessite une licence (payante au bout de 30 jours).

Un atelier animé par Antoine Gautier (STIH) a lieu le 29/02/2024.