Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie.
Nous avons présenté TXM, qui permet notamment d’exploiter des corpus de presse enrichis de méta-données mais aussi avec de la lemmatisation et de l’étiquetage syntaxique.
En complément de l’atelier, vous pouvez :