Afin de mieux cerner le type d’accompagnement technique et méthodologique que le CERES peut vous proposer, voici quelques exemples de missions déjà réalisées pour divers types de projets de recherche.
Collecter de grands corpus de publications issues des réseaux sociaux numériques
L’étude des réseaux sociaux numériques (X, Instagram, Tiktok…) nécessite des méthodes numériques diffrentes selon les cas, principalement pour de la collecte de données en recourant aux API ou à de l’extraction de données (scraping).
Exemple 1 : Récupérer des publications Instagram sur l’Eurovision.
Pour étudier les pratiques photographiques des fans de l’Eurovision, un chercheur nous a demandé d’établir un corpus à partir de publications Instagram comportants des mots-clés prédéfinis, et sur un laps de temps prédéfini également. Ainsi, à l’aide de l’outil Minet, nous avons collecté environ 40.000 publications (composées de l’image, du texte, des hashtags, du nom de l’auteurice, de la date,…) que nous avons ensuite formatées pour en permettre l’exploration dans notre outil Panoptic. Nous avons également formé ce chercheur à l’utilisation de Panoptic en autonomie.
Exemple 2 : Etudier la modération des contenus sur Twitter/X.
Pour étudier la modération abusive des contenus LGBT et TDS sur Twitter, un chercheur avait besoin d’élaborer une stratégie de collecte et d’analyse originales puisque, par définition, la suppression des contenus ne laisse pas de traces en ligne. Ainsi, des dizaines de milliers de tweets ont été régulièrement (re-)collectés par nos soins pendant plusieurs mois, et des modes de visualisation ad hoc ont permis d’identifier et de rendre visible la trace des procédures de modération de Twitter.
Voir le résultat : Grison, Thibault, Virginie Julliard, Félix Alié et Victor Ecrement. 2023. « La modération abusive sur Twitter. Étude de cas sur l’invisibilisation des contenus LGBT et TDS en ligne ». Réseaux, n° 237/1 : 119‑149.
Explorer de grands corpus d’images
Qu’ils soient nativement numériques ou numérisés, les grands corpus d’images, adjoints ou non de métadonnées, constituent un type de matériau de plus en plus commun pour les analyses. Nous avons développé une visionneuse d’images spécifiquement pensée pour les corpus de plusieurs dizaines de milliers d’images : Panoptic. Nous accompagnons les chercheurs et chercheuses à la prise en main de cet outil lors d’ateliers notamment.
Pour en savoir plus sur cet outil, voir aussi : Bouté Edouard, Virginie Julliard, Félix Alié, David Godicke, Victor Écrement et fred pailler. 2024. « PANOPTIC, un outil d’exploration par similarité de vastes corpus d’images », Colloque annuel de l’Association francophone des humanités numériques Humanistica.
Exemple : Etude sémiotique de représentations picturales.
Un chercheur travaillant à analyser des récits picturaux de BD à partir d’annotations textuels, avait pris contact avec le CERES initialement pour être accompagné dans la manipulation des tableaux excel dans lesquels il avait enregistré toutes ses annotations. Après des échanges autour de la faisabilité concrète de sa méthode initiale, il a entièrement numérisé son corpus de BD et les a découpées vignette par vignette. Il est ainsi passé d’un simple corpus de notes sur les images à un corpus d’images désormais annotables dans Panoptic. Dès lors, nous l’avons accompagné pour restructurer ses tableaux d’annotations afin qu’il puisse les importer comme des métadonnées des images correspondantes.
Voir le résultat : Sähn, Thomas et Marceau Hernandez. 2023. « De l’opposition à l’altérité. la sémiotique comme base d’une analyse automatisée des représentations picturales », Congrès de l’AGES : Altérités dans l’espace germanophone, Paris, 16-17-18 novembre 2023.
Analyser des jeux de données textuels
A venir
Structurer, formater, préparer, enrichir des données pour des outils de textométrie
A venir