Centre d’expérimentation en méthodes numériques pour les recherches en Sciences Humaines et Sociales
Le Centre d’expérimentation en méthodes numériques pour les recherches en Sciences Humaines et Sociales est une unité de service de la Faculté des Lettres de Sorbonne Université, créée en février 2021, dont la mission principale est d’accompagner les chercheur·ses et doctorant·es en SHS souhaitant recourir à des méthodes numériques et à des outils informatiques.
Les actions de CERES sont organisées autour de trois axes principaux :
- les réseaux sociaux numériques
- les sources patrimoniales numérisées
- le déploiement d’une infrastructure transversale de gestion des corpus et des données analytiques associées
CERES offre un accompagnement technique et méthodologique dans la prise en main d’outils informatiques disponibles et œuvre au déploiement d’outils informatiques utiles à la communauté des chercheur·ses de la Faculté des Lettres. L’unité de service conduit par ailleurs une réflexion sur le statut épistémologique de ces outils et méthodes dans la recherche en SHS, mettant en avant le caractère central de l’activité interprétative du·e la chercheur·se face aux outils informatiques. Plus largement, il s’agit de contribuer à l’émergence de nouvelles pratiques de recherche en SHS en milieu numérique, avec l'appui d’une équipe interdisciplinaire.
Évènements à venir
Dernières publications
Atelier Europresse
Atelier sur l'utilisation des données d'Europresse et l'interaction avec des outils de textométrie.
Atelier TXM (Textométrie)
Atelier à venir TXM pour l’analyse de corpus de textes. Pouvoir analyser automatiquement des corpus textuels afin d’en tirer des statistiques et pouvoir faire des recherches précises de certaines expressions sont deux des enjeux de la textométrie. Concrètement, il peut s’agir de rechercher les contextes d’apparition de mots ou d’expressions, comparer la fréquence de différentes expressions ou encore comparer des corpus pour trouver automatiquement ce qui les différencie. Informations pratiques : 14 novembre 2024, 16h-18h, salle D117 de la Maison de la Recherche de Sorbonne Université (28 rue…
Atelier Excel pour les SHS
Atelier à venir Le prochain atelier est intitulé “Excel pour l’analyse de corpus de presse”. Il sera consacré à l’apprentissage de l’usage des tableaux croisés dynamiques dans ce type d’analyses. Informations pratiques : 17 octobre 2024, 16h-18h, salle D117 de la Maison de la Recherche de Sorbonne Université (28 rue Serpente, 75006 Paris) Atelier en présentiel uniquement. Animé par Edouard Bouté Inscription gratuite mais obligatoire en cliquant sur ce lien. Description Excel est un logiciel de tableurs particulièrement connu pour être propice à la réalisation de calculs et de graphiques à…
Communs Démocratiques
Make.org, Sciences Po, Sorbonne-CNRS se sont associés pour monter le programme de recherche “Communs Démocratiques” qui a pour ambition d’utiliser le potentiel de l’IA générative (voir partie 1) afin de préserver et renforcer la démocratie. En effet, face à une crise de confiance inédite envers les institutions démocratiques, une guerre informationnelle d’une intensité sans précédent, et l’émergence de l’IA générative, la démocratie est remise en cause dans ses fondements et dans ses processus. C’est ainsi que le programme de recherche Communs Démocratiques a pour ambition de maximiser l’effet…
Panoptic dans les actes d'Humanistica 2024
Lors du dernier colloque de l’association francophone des humanités numériques, Humanistica, l’outil Panoptic et ses potetiels usages ont été présentés publiquement. Cela a été l’occasion pour nous de rédiger un premier article présentant ce logiciel et son intérêt pour la recherche en LSHS qu travail avec de grands corpus d’images. L’article est accessible sur HAL. Pour le citer : Bouté Edouard, Virginie Julliard, Félix Alié, David Godicke, fred pailler et Victor Écrement. 2024. « PANOPTIC, un outil d’exploration par similarité de vastes corpus d’images », Colloque annuel de l’Association…
Une « viralité » des discours avant Internet ?
Informations clés Candidat : Marceau Hernandez Direction de la thèse : Karine Abiven et Gaël Lejeune (Sorbonne Université, STIH) Titre complet : Une « viralité » des discours avant Internet ? Pour une recherche des similarités de textes et d’images dans les des corpus d’Ancien Régime Date de début de la thèse : Octobre 2024 Résumé / Abstract Résumé en français Résumé de la thèse (en français): Ce projet de thèse explore les phénomènes de circulation des documents numérisés de l’Ancien Régime, en particulier durant la Fronde (1648-1653). Bien que ces phénomènes soient souvent associés aux…
Développement d’un logiciel d’alignement textuel bilingue pour l’analyse de l’écriture autobiographique des hommes de théâtre italiens au Tournant des Lumières
Candidat : Matteo Zibardi Direction de la thèse : Andrea Fabiano (SOrbonne Université/ELCI), Maria Gabriella Cambiaghi (Université de Milan), Andrea Del Lungo (Sorbonne Université/CELLF) Titre complet : Développement d’un logiciel d’alignement textuel bilingue pour l’analyse de l’écriture autobiographique des hommes de théâtre italiens au Tournant des Lumières Date de début de la thèse : Octobre 2024 Résumé de la thèse :
Colloque Disours et images de la violence contestataire
Ce colloque est organisé par des membres du CEMTI (Paris 8) et du CERES.
Atelier Web Scraping
Le web scraping est une technique informatique utilisée pour extraire automatiquement des données à partir de sites web. Cela implique l’analyse et le téléchargement du contenu des pages web, généralement à l’aide de scripts ou de programmes spécifiques. Le CERES a dédié plusieurs ateliers à cette pratique numérique (voir plus bas). Le prochain atelier sera dédié à l’outil minet, développé au sein du Médialab de Sciences Po Paris, et sera animé par Guilluame Pique, son concepteur, que nous remercions chaleureusement. Pour s’inscrire à cet atelier, qui aura lieu le 30 mai, de 16h à 18h à la…
Cheat Sheet CQL - Feuille d'aide à la requête CQL pour TXM
TXM est un logiciel de traitement de corpus qui permet d’interroger des corpus textuels à l’aide de requêtes CQL (Corpus Query Language). Cet article propose une liste de requêtes CQL pour vous aider à comooser vos propres requêtes sur vos corpus. NB : Une partie de ces requêtes reposent sur des structures spécifiques présentes dans les fichiers XML importés dans TXM, vérifiez ce qui est disponible pour votre corpus au préalable. Pour approfondir les usages de TXM, vous pouvez consulter notre tutoriel avancé sur les usages de TXM. Ou encore consulter la documentation officielle de TXM…
TXM : Analyser un corpus de presse
TXM - Niveau 2 Progression Nous pouvons utiliser TXM pour étudier la progression de l’utilisation d’un mot au cours du temps. Dans le corpus Europresse-Prigojine, nous allons évaluer l’évolution de certains usages au fil du temps et des présidents grâce à la fonction progression. Dans un premier temps, comparez l’évolution de l’usage de ces 3 mots: , et . Il est possible d’ajouter les mots un par un en les recherchant successivement. Notez-vous quelque chose d’intéressant ? Affichez les paramètres de votre onglet progression (roue dentée) Dans la partie “Unité structurelle et propriété…
Atelier Musiconis
Informations pratiques Jeudi 25 avril 2024 – 16h00-18h00 – S001, Maison de la Recherche, 28 rue Serpente, 75006, Paris Lien d’inscription Inscrivez-vous en cliquant ici. Présentation du programme Musiconis – iconographie musicale médiévale : L’équipe de recherche Organologie/Iconographie de l’UMR développe le programme de recherche Musiconis comprenant plusieurs axes de développement qui se nourrissent mutuellement : 1 – la constitution d’une méta-base d’images médiévales représentant la musique à partir d’un bouquet de bases existantes reconnues, le développement d’outils technologiques pour…
Atelier Panoptic
Développé par le CERES, Panoptic est un outil de visualisation, d’exploration et d’annotation de grands corpus d’images. Cet outil intègre notamment des algorithmes de groupage d’images par similarité (MobileNet, average hash, sha1), ce qui permet d’aider l’usager·e dans le tri et l’exploration. L’outil propose par ailleurs diverses options de filtrage, de recherche et d’annotation, permettant la création, l’analyse et l’exportation de sous-corpus. Cet outil sera présenté en présentiel lors d’un atelier CERES le 11 avril 2024. Inscription ici.
Atelier Gephi
Informations Plusieurs ateliers autour de l’outil Gephi sont animés par le CERES. Un premier a eu lieu le 14 avril 2022, un deuxième le 2 mars 2023. Le prochain atelier aura lieu le 28 mars 2024, en présentiel, à la Maison de la Rerche de Sorbonne Université. Pour vous inscrire, cliquez ici Gephi Ce logiciel, présenté par Félix Alié (CERES), est un outil de cartographie des données sous forme de graphe. La visualisation de données en réseau peut permettre d’accompagner les chercheurs et les chercheuses en SHS dans la conduite de leurs analyses, en les aidant à mettre en lumière des relations…
Appel à projets - Programme doctoral 2024
Le CERES lance l’appel à projets 2024 pour son programme doctoral “Méthodes numériques pour les thèses en LSHS”. Toutes les informations sont à retrouver sur le PDF téléchargeable en cliquant ici. Dates importantes du calendrier : 29 mars Date limite d’envoi des projets de recherche doctoraux, par les porteurs et porteuses des projets. 6 avril Date limite de validation par les Ecoles Doctorales. 17 avril Sélection des projets doctoraux par le jury du programme doctoral. 17 mai Sélection par les porteurs et aux porteuses des projets de leur candidate ou candidat et transmission du dossier de…
Atelier Tableau Public
Le prochadernierin atelier dédié aux visualisations sous Tableau Public a eu lieu le jeudi 08/02/2024 de 16h30 à 18h30 à la Maison de la Recherche de Sorbonne Université. Cet atelier a été présenté par Edouard Bouté (CERES). Présentation de Tableau Public Tableau public est un logiciel en ligne gratuit qui permet de créer des visualisations interactives, hautement personnalisables et accessibles en ligne. Sa particularité est que les visualisations ne sont pas construites selon des diagrammes standards, mais de manière modulaire, permettant de tester différentes manières de représenter et…
Tableau Public : visualiser la circulation des images en ligne
Atelier Tableau Public : cas d’étude de la circulation des images en ligne Il est à noter que ce tutoriel propose de reproduire des résultats de recherche partagés lors du congrès de la SFSIC en 2023. Voir Bouté E. (2023). « Militantisme transplateforme : la répression policière des Gilets jaunes entre Facebook et Twitter », XXIIIème Congrès de la Sfsic : la numérisation des sociétés. Bordeaux. 14-15-16 juin 2023 Description de Tableau Public Tableau Public est un logiciel en ligne gratuit qui permet de créer des visualisations interactives, hautement personnalisables et accessibles en ligne…
journée d’études "Travailler avec les images en mouvement"
La journée a vocation à interroger les enjeux méthodologiques et épistémologiques spécifiques du travail de recherche sur des terrains/corpus ayant trait aux images en mouvement, que celles-ci soient des vidéos en circulation sur les réseaux sociaux numériques (à l’instar de TikTok) ou bien des films et séries.
Excel : usages en SHS
Le 7 décembre 2023, Edouard Bouté a animé un atelier de présentation du logiciel de tableur Excel, focalisé sur les usages possibles en SHS, à travers l’étude de cas d’un corpus de presse de 40 000 articles. Le powerpoint de la séance, proposé sous forme de tutoriel, est mis à disposition ici. Vous pouvez le télécharger en cliquant ici.
Outil CERES : SciTok
SciTok est un outil de web scraping pour la recherche en sciences sociales.