Description de la séance
Jeudi 19 mars, la séance du séminaire GARNET sera consacrée à la présentation des recherches conduite avec Active Tigger, un outil d’annotation collaborative avec apprentissage automatique : https://www.css.cnrs.fr/active-tigger/
Intervenants : Axel Morin (CREST - Centre de Recherche en Économie et Statistique) et Émilien Schultz (Médialab, Sciences Po)
Résumé: Avec la multiplication des données textuelles dans les sciences humaines et sociales, les traitements numériques deviennent incontournables tant pour la collecte que pour la mise en forme et le traitement des données. La diffusion de ces méthodes nécessite à la fois la stabilisation de bonnes pratiques et d’outils dédiés. Active Tigger est une application d’annotation collaborative de corpus de textes, pensée par et pour les chercheur.euse.s. Cette solution no-code et open source facilite l’entraînement de modèles d’IA frugaux et vise à partager les bonnes pratiques. Cette présentation de deux heures inclut une formation à l’outil Active Tigger accompagnée d’une introduction aux fondamentaux de l’annotation de corpus en sciences sociales ainsi qu’à l’apprentissage supervisé.
Numéro de salle à venir
Argumentaire du séminaire
Le séminaire GARNET (Gestion et Appareillage de la Recherche en SHS : Nouvelles méthodes, Épistémologie du numérique et pratiques concrètes de la Transdisciplinarité) a pour objectif d’explorer certaines des questions clés liées à l’utilisation et au développement des méthodes numériques dans les sciences humaines et sociales, qu’elles soient mises en œuvre pour étudier des corpus numérisés (histoire, sémiotique, littérature) ou pour étudier les interactions et la communication dans/via des environnements numériques, qui sont devenus centraux dans presque tous les travaux de terrain aujourd’hui. À cette fin, le séminaire se concentrera sur des présentations qui articulent les conditions matérielles de l’utilisation et du développement des outils numériques avec les conséquences théoriques des innovations méthodologiques. Cette approche repose sur une conversation interdisciplinaire pratique, comme le suggèrent les thèmes de cette année : la mise en place d’infrastructures et de méthodes d’analyse de corpus plurisémiotiques, les nouvelles façons d’accéder et de collecter des données à des fins de recherche lorsque les données sont devenues une marchandise et un moyen de surveillance, et l’identification des relations de pouvoir propres aux systèmes sociotechniques dont la complexité croissante défie les méthodes d’investigation traditionnelles.
Organisateur-ices : Virginie Julliard (CERES/GRIPIC, Sorbonne Université), Julien Rossi (ANR DATARights/CEMTI, Université Paris 8), Édouard Bouté (CEThicS, ISTC/Université Catholique de Lille), fred Pailler (C²DH, Université du Luxembourg).