Informations clés
Candidat : Marceau Hernandez
Direction de la thèse : Karine Abiven et Gaël Lejeune (Sorbonne Université, STIH)
Titre complet : Une « viralité » des discours avant Internet ? Pour une recherche des similarités de textes et d’images dans les des corpus d’Ancien Régime
Date de début de la thèse : Octobre 2024
Résumé / Abstract
Résumé en français
Résumé de la thèse (en français):
Ce projet de thèse explore les phénomènes de circulation des documents numérisés de l’Ancien Régime, en particulier durant la Fronde (1648-1653). Bien que ces phénomènes soient souvent associés aux médias numériques, ils peuvent être observés dans des environnements comme la presse artisanale (Dosse, F. 2005).
Cependant, les documents sources sont souvent imparfaits : métadonnées imprécises, détérioration avec le temps, et retranscriptions automatiques bruitées et erronées. Par conséquent, la recherche de réutilisations doit tolérer ce bruit. De plus, le français pré-moderne est moins fourni en ressources que le français contemporain, ce qui limite l’utilisation de méthodes de correction automatique et de similarité basées sur les plongements lexicaux, qui nécessitent une grande quantité de données.
Malgré ces obstacles, la matérialité particulière des documents à cycle de publication “fermés” influence la manière de penser ces écrits (Eisenstein, 1990). Un document est publié dans une version figée où chaque réédition est comme un nouveau document, changeant la mise en forme ou synthétisant le texte original, contrairement aux documents numériques où la frontière entre versions est floue (D. Cotte & M. Després-Lonnet, 2006).
Au delà des corpus bruités, cette période se distingue ainsi par son état de langue, le français pré-moderne, mais aussi par la période historique dans laquelle s’inscrit ce dernier, notamment au cours de la Fronde (1648-1653).
Cette période est marquée par l’amélioration des techniques de presse, réduisant les coûts de production et rendant les écrits plus accessibles, parfois distribués gratuitement dans des zones de grande affluence (Martin et al., 1983). Une plus grande variété d’auteurs pouvait s’exprimer à plus grande échelle, produisant des satires, blâmes et apologies se répondant souvent. Ce genre de périodes de guerres civiles est un contexte privilégié pour la diffusion, parfois incontrôlée, de contenus textuels et visuels : la censure ne s’y exerce pas avec autant de force que la plupart du temps sous la monarchie, qui exercera par la suite un “contrôle étroit de l’imprimerie” (Haffemayer, 2016).
La viralité, en tant que diffusion rapide et incontrôlée de contenus à travers les réseaux sociaux et les médias, voire des canaux plus restreints, comme des groupes de discussion sur des messageries instantanées, semble être une notion analogique utile pour penser la circulation de pamphlets et libelles. Elle révèle la dynamique complexe des échanges culturels et politiques, souvent conflictuels (Jenkins et al., 2009).
En complément, la notion de mème, définie par R. Dawkins (2016) offre un cadre pour comprendre la viralité comme transmission culturelle. L. Shifman (2013) voit les mèmes comme des contenus “partageant des caractéristiques sémiotiques, formelles et/ou de positionnement”, créés et transformés par les usagers. Ce phénomène, omniprésent sur internet, est décrit comme des “machines à fabriquer une communauté” (Jost, 2022). La viralité s’inscrit dans une économie de l’attention où “le flux prend le pas sur l’origine” (Nooney and Portwood-Stacer, 2014). Cette dimension historique de la viralité, soulignée par F. Pailler & V. Schafer (2023), pose des défis méthodologiques pour retracer son évolution.
Dans le contexte de cette recherche sur la Fronde, l’analyse de la viralité des discours politiques offre une perspective, certes anachronique, mais qui je l’espère pourra amener une certaine “fécondité heuristique” (Dosse, 2005), pour comprendre les mécanismes de diffusion de l’information et les dynamiques de pouvoir de cette période tumultueuse. En utilisant des méthodologies de textométrie et d’analyse de réseaux, l’objectif est de comprendre les méthodes de circulation à travers les similarités documentaires multimodales.
Ce projet se situe à la frontière entre les sciences du langage et les sciences de l’information et de la communication.
Abstract in english
Thesis abstract (in english):
This thesis project explores the phenomena of circulation in digitized documents from the Ancien Régime, particularly during the Fronde (1648-1653). Although these phenomena are often associated with digital media, they can be observed in environments induced by the artisanal press (Dosse, F. 2005).
However, the source documents are often far from perfect: imprecise metadata, deterioration over time, and noisy, erroneous automatic transcriptions. Consequently, the search for reuse must tolerate this noise. Moreover, pre-modern French is less resource-rich than contemporary French, limiting the use of automatic correction methods and similarity techniques based on lexical embeddings, which require large amounts of data.
Despite these obstacles, the particular materiality of documents with “closed” publication cycles influences the way these writings are perceived (Eisenstein, 1990). A document is published in a fixed version where each reissue is like a new document, changing the layout or synthesizing the original text, unlike digital documents where the boundary between versions is blurred (D. Cotte & M. Després-Lonnet, 2006).
Beyond the noisy corpora, this period is distinguished by its language state, pre-modern French, and by the historical period it encompasses, particularly during the Fronde (1648-1653).
This period is marked by improvements in press techniques, reducing production costs and making writings more accessible, sometimes distributed freely in high-traffic areas (Martin et al., 1983). A greater variety of authors could express themselves on a larger scale, producing satires, reproaches, and apologies that often responded to each other. Such periods of civil war are conducive to the sometimes uncontrolled dissemination of textual and visual content: censorship is not as strong as during the monarchy, which later imposed a “tight control of printing” (Haffemayer, 2016).
Virality, as the rapid and uncontrolled dissemination of content through social networks and media, even through more restricted channels like discussion groups on instant messaging, seems a useful analogical notion for considering the circulation of pamphlets and libels. It reveals the complex dynamics of cultural and political exchanges, often conflicting (Jenkins et al., 2009).
Additionally, the concept of meme, defined by R. Dawkins (2016), provides a framework for understanding virality as cultural transmission. L. Shifman (2013) sees memes as content “sharing semiotic, formal, and/or positioning characteristics,” created and transformed by users. This phenomenon, ubiquitous on the internet, is described as “community-making machines” (Jost, 2022). Virality is part of an attention economy where “flow takes precedence over origin” (Nooney and Portwood-Stacer, 2014). This historical dimension of virality, highlighted by F. Pailler & V. Schafer (2023), presents methodological challenges for tracing its evolution over time.
In the context of this research on the Fronde, analyzing the virality of political discourse offers a perspective, albeit anachronistic, but one that I hope will bring some “heuristic fertility” (Dosse, 2005), to understand the mechanisms of information dissemination and the power dynamics of this tumultuous period. Using textometry and network analysis methodologies, the objective is to understand circulation methods through multimodal documentary similarities.
This project lies at the intersection of language sciences and information and communication sciences.