Abstract:
The present paper is based on the assumption that the language of the novel is characterized by a statistically relevant overrepresentation of certain linguistic units (e.g. lexemes, key words, collocations and colligations, Siepmann 2015). First steps towards checking the validity of this hypothesis had been undertaken in pioneering works in the 1990s/2000s (e.g. Stubbs & Barth 2003). These studies were however limited by the small size of their (exclusively English) corpora. The present study explores the role of some patterns (phraseological motifs) in distinguishing French literary subgenres. It also proposes a case study of some motifs related to the verbal (dire avec sourire ‘to say with a smile’) and non-verbal communication (adresser un sourire ‘to send a smile’). Unlike traditional corpus-stylistic analyses, which frequently focus on the style of a single author, our corpus-driven approach identifies lexico-syntactic constructions in literary genres which are automatically extracted from the corpora. The main purpose is to show the relevance of the notion of phraseological motif (Legallois 2012; Longrée & Mellet 2013; Novakova & Siepmann 2020) for the distinction of literary subgenres. Linking form and meaning, these ‘multidimensional units’ fulfil pragmatic as well as discursive functions. The data has been extracted from large French corpora of the PhraseoRom research project https://phraseorom.univ-grenoble-alpes.fr. They are accessible on http://phraseotext. univ-grenoble-alpes.fr/phraseobase/index.html and contain 1000 novels (published from the 1950s to the present), partitioned into six sub-corpora: general literature (GEN), crime fiction (CRIM), romances (ROM), historical novels (HIST), science fiction (SF) and fantasy (FY). The results of our study reveal some unexpected differences between the literary subgen- res: e.g. the motif dire d’une voix ‘to say in a voice’ in HIST compared to GEN. In FY, expressions of verbal communication are related to shouting and screaming. Expressions related to the non-verbal communication (prendre dans ses bras ‘to take in one’s arms’) are specific to ROM, where body language is overrepresented. In SF, there is a very limited number of these types of expressions. More generally, the motifs provide the link between the micro level (phraseological recurrences) and the macro level (the fictional script).
Keywords: phraseological motifs, extended phraseology, digital humanities, literary genres.
Articles
Les motifs phraséologiques pour distinguer les genres littéraires. Sur l’exemple des motifs de la communication verbale et non verbale
Phraseological motifs for Distinguishing Between Literary Genres. A Case Study on the Motifs of Verbal and Non-Verbal Communication

Aprobación: 10 Abril 2021
Le principal objectif de cette étude1 est de montrer la pertinence de la notion de mo- tif phraséologique (Legallois 2012; Longrée & Mellet 2013; Novakova & Siepmann 2020) pour la distinction des genres littéraires. Les motifs en phraséologie sont conçus comme des unités polylexicales présentant des régularités et des variations lexicales et syntaxiques (au niveau paradigmatique et syntagmatique), établies avec des méthodes lexicométriques et associées à des fonctions discursives spécifiques. La principale question sous-jacente à cette recherche est de savoir si et comment la phraséologie étendue (Legallois &Tutin 2013) permet de distinguer les sous-genres de la littérature contemporaine. L’enjeu sera de les identifier et de les décrire non pas en termes d’univers de référence ou de style individuel des auteurs, comme c’est souvent le cas en stylistique classique, mais à travers des constructions lexico-syntaxiques (CLS) récurrentes, statis- tiquement spécifiques à tel ou tel sous-genre2.
Le point de départ de cette étude repose sur l’hypothèse selon laquelle la langue romanesque, aussi bien dans son ensemble que dans ses genres spécifiques, se caractérise par la surreprésentation statistiquement significative de certains phénomènes linguistiques (lexèmes, mots clés, collocations, colligations, schémas actanciels, phraséologismes) (Siepmann 2015, 2016). Une amorce de validation de cette hypothèse existe déjà dans l’étude pionnière sur l’anglais de Stubbs & Barth (2003) mais elle n’a été validée que sur des corpus de taille très modestes, excluant les unités « lexicalement riches », immédiate- ment identifiables comme spécifiques au genre littéraire, comme par exemple His thoughts were interrupted by, Il en était là de ses réflexions quand (Siepmann 2015, 382). Par ail- leurs, Biber et al. (1999) ont identifié certaines propriétés grammaticales spécifiquement littéraires (les constructions démonstratives that bloody car of mine ou existentielles en there) mais leurs analyses ne prennent pas en compte les mots-clés, ni les segments répétés spécifiques. La présente étude se propose d’aller plus loin en appliquant une méthodologie innovante, fondée sur des approches textométriques et s’appuyant sur de vastes corpus de textes littéraires français, postérieurs à 1950. Cette étude débutera par un aperçu des travaux existants sur la phraséologie et la stylistique des genres littéraires (section 2). Elle sera suivie, dans la section 3, par la définition de la notion de motif phraséologique, puis, dans la section 4, par la présentation des corpus et de la méthodologie du travail. La section 5 sera consacrée à la présentation des ALR spécifiques à six sous-genres littéraires. La section 6 proposera une analyse de quelques motifs autour des expressions de communication verbale (p. ex. dire d’une voix) et non verbale (p. ex. adresser un sourire à), permettant de distinguer ou de rapprocher les sous-genres pour lesquels ces motifs sont spécifiques. Les conclusions sont présentées dans la section 7.
Les phraséologismes constitutifs de l’idiomacité des textes échappent, pour l’instant, à une définition complète et consensuelle : « extended units of meaning » (Sinclair 2004), « constructions » (Goldberg 1995), « collostructions » (Stefanowitsch & Gries 2003), « collocations » (Hausmann 1979 ; Mel’čuk et al. 1995 ; Siepmann 2005 ; Tutin 2010), « lexical bundles » (Biber et al. 1999), « motifs séquentiels » (Quiniou et al. 2012). On constate, par ailleurs, que les différentes approches qui sous-tendent ces notions déplacent leur objet d’études des séquences figées de la phraséologie traditionnelle (formules routini-sées, proverbes, collocations binaires (Hausmann 1979 ; Mel’čuk et al. 1995 ; Tutin 2010) vers plusieurs types d’unités lexicales « étendues » (Sinclair 2004). Deux notions, particu-lièrement prometteuses de ce point de vue, sont les « cadres collocationnels » (Renouf & Sinclair 1991), et les « motifs » (Legallois 2006 ; Longrée & Mellet 2013).
À l’heure actuelle, la phraséologie occupe une place centrale au sein de deux domaines de recherche traditionnellement séparés: la linguistique outillée et l’analyse stylistique du texte littéraire. Un grand nombre de travaux en stylistique (Barthes 1966; Greimas 1972 [1982]; Leech & Short 2007), en stylométrie (Magri-Mourgues 2006), en stylistique de corpus (Stubbs 2005; Fischer-Starcke 2010; Mahlberg 2013) et en textométrie (Guiraud 1954; Brunet 1981) traitent, de manière approfondie, des procédés de style et des spéci- ficités lexicales et grammaticales chez différents auteurs comme Zola, Flaubert, Duras (p. ex. Philippe & Piat 2009; Vaudrey-Luigi 2013). D’autres travaux établissent des schémas stéréotypiques récurrents, p. ex. pour le roman policier (Todorov 1980 ; Marion 2009 ; Lits 2011), dans le but de dresser une typologie des genres littéraires. Par ailleurs, les critères retenus dans les théories des genres ont été presque exclusivement basés sur leur contenu (cf. à ce sujet Zymner 2003; Frow 2006; Gymnich, Neumann & Nünning 2007).
Grâce aux Humanités numériques actuellement en plein essor, les approches traditionnelles des genres s’appuient de plus en plus sur des méthodes innovantes, fondées sur les outils de la linguistique de corpus (cf. entre autres Beauvisage 2001; Rastier 2011) et du Traitement automatique du langage (TAL), permettant d’extraire de grandes masses de données lan- gagières pour l’analyse stylistique. Ainsi, récemment, une exploration de grande ampleur sur les constructions lexico-syntaxiques (CLS), spécifiques du roman contemporain, a été réalisée dans le cadre du projet PhraseoRom (https://phraseorom.univ-grenoble-alpes.fr). Ses principaux résultats (Novakova & Siepmann 2020, entre autres) ont montré la perti- nence de la notion de motif phraséologique pour la distinction des sous-genres littéraires.
La notion de motif phraséologique (ou textuel) apparait comme une nouvelle notion per- tinente, permettant d’articuler les analyses du texte littéraire au niveau syntaxico-séman- tique avec celles du niveau discursif et textuel. Le motif s’actualise à la fois en langue et en discours (Lala & Siaugues 2020, 110)3. Il ne s’agit donc pas d’éléments fictionnels symboliques ou constitutifs de l’imaginaire d’une œuvre (Bellemin-Noël 1972; Richard, 1961, 1979), mais de séquences phraséologiques observables, statistiquement saillantes dans un corpus, composées d’unités continues ou discontinues combinant lemmes, catégories morphosyntaxiques, mots-outils, collocations. Ces « unités multidimensionnelles » d’appariement entre forme et sens ont une fonction pragmatique et discursive (Legallois 2012, 45). Sur le plan fonctionnel, le motif est « un « cadre collocationnel » accueillant un ensemble d’éléments fixes et variables, susceptibles d’accompagner la structure tex- tuelle, et simultanément, de caractériser des textes de genres divers » (Longrée & Mellet 2013, 66). Ces regroupements pertinents de patrons lexico-syntaxiques récurrents, dont la spécificité pour tel ou tel genre est établie avec des méthodes lexicométriques, jouent un rôle dans la « cohérence textuelle » (Martin 1983, 16) du discours romanesque. On parle ainsi de la « méthode des motifs », applicable dans la fouille des textes littéraires (Lala & Siaugues 2020, 113 ; Legallois & Koch 2020, 32–41).
En bref, de par son caractère « à la fois structurant et caractérisant » (Mellet & Longrée, 2012, 718), le motif s’avère être une séquence opératoire pour la distinction des sous- genres littéraires comme l’ont également montré les travaux du projet PhraseoRom :
The notion of motif lets us fill in the missing link between “macro-level” notions of script or schema that have traditionally been used in cognitive narratology (e.g. study of the plot, isotopies) and the “micro-level” elements that go into making up the script (specific phraseological recurrences). (Novakova & Siepmann 2020, 10)
Les données sur lesquelles est fondée cette étude sont extraites des corpus numériques, syntaxiquement annotés, constitués pour les besoins du projet PhraseoRom4 et regroupés dans la PhraseoBase (http://phraseotext.univ-grenoble-alpes.fr/phraseobase/index. html). Les corpus sont interrogeables avec l’outil Lexicoscope (Kraif 2016). Ces corpus réunissent plus de 1000 œuvres contemporaines à partir de 1950, réparties en 6 sous- genres (selon des critères éditoriaux et libraires, prix littéraires, recherches sur Internet, lecture d’extraits): littérature générale (GEN), romans policiers (POL), sentimentaux (SENT), historiques (HIST), science-fiction (SF) et fantasy (FY). Le Tableau 1 récapitule la composition de ces corpus en français :
Dans la lignée des travaux en linguistique de corpus anglo-saxonne (Sinclair 2004 ; Hoey 2005 ; Biber & Conrad 2009), l’approche appliquée ici est essentiellement inductive (corpus driven) : les observations sont guidées par les données, issues des grands corpus littéraires recensés dans le Tableau 1. La méthode consiste à extraire automatiquement des arbres lexico-syntaxiques récurrents (ALR) (Kraif 2016) qui regroupent des unités lexicales reliées entre elles par des relations de dépendance syntaxique.
La spécificité des expressions récurrentes autour d’un mot pivot dans un des sous-genres du corpus est calculée par rapport à l’ensemble du corpus PhraseoRom, selon l’indice statistique loglikelihood ratio (LLR, Dunning 1993). La Figure 1 illustre l’expression récurrente, spécifique au sous-genre POL, allumer une nouvelle cigarette qui se présente sous forme d’Arbre Lexico-syntaxique Récurrent :

A la différence de la méthode proposée par Quiniou et al. (2012), nos ALR correspondent à des structures hiérarchiques (arbres de dépendance). Selon la méthodologie développée dans le cadre de PhraseoRom, les critères retenus pour la sélection des ALR sont les suivants6
le seuil de spécificité statistique (l’indice LLR) a été fixé à 10,83. C’est le seuil à partir duquel la surreprésentation de l’ALR dans un corpus peut être considérée comme statistiquement significative. Il s’agit d’un rapport de vraisemblance per- mettant d’évaluer objectivement si la répartition des unités linguistiques au sein d’un corpus est aléatoire ou non ;
le critère de fréquence absolue : le nombre d’occurrences d’un ALR doit être supérieur à 10 ;
le critère de dispersion : l’ALR apparaît au moins chez 20 % des auteurs d’un sous-corpus pouvant aller jusqu’à 50 % des auteurs du corpus ;
le critère morpho-syntaxique : l’ALR doit comporter obligatoirement un verbe, ce qui exclut d’emblée des expressions exclusivement référentielles (A la tombée de la nuit, Monsieur le Procureur, les nains de jardin) ;
la taille des ALR : ils doivent comporter au moins 3 mots dont un verbe pivot, et ce jusqu’à 7 mots.
Une fois extraites sous forme d’ALR, les données brutes ont été classées et analysées sur quatre niveaux : lexical, syntaxique, sémantique et discursif, dans la lignée des modèles fonctionnels et contextualistes (Sinclair 2004 ; Hoey 2005). Une grille a été conçue (Goossens et al. 2020) pour l’annotation sémantique des 8415 items retenus pour le français. Cette grille regroupe des dimensions (catégories) sémantiques comme action, communication, cognition7, etc. (Tableau 2) :

Cette étape importante d’annotation sémantique des ALR a permis ensuite de les regrou- per automatiquement8 et de faire émerger des motifs textuels. Dans notre méthodologie, les ALR constituent des « guides » pour l’identification des motifs. Enfin, un système d’annotations fines des fonctions discursives (FD) des motifs a été également élaboré par les stylisticiens du projet. La liste des principales fonctions discursives – narratives et descriptives (Adam 2011, 267) – a été enrichie, suite à l’analyse d’au moins une centaine d’occurrences des motifs extraits des différents sous-corpus. Ainsi, d’autres FD – affec- tive, pragmatique, cognitive (avec deux sous-classes, commentative et mémorielle) – ont été rajoutées9. Ces FD ont permis de prendre en compte la dimension textuelle des expressions lexico-syntaxiques (extraites sous forme d’ALR), c’est-à-dire leur rôle dans la structuration des textes littéraires.
La section 5 présentera les expressions statistiquement spécifiques aux six sous-genres comparés ici. Dans la section 6 seront analysés plus en détails quelques motifs formés autour des ALR classés dans la dimension sémantique communication verbale et non verbale (cf. Tableau 2) au sein des différents sous-genres; nous montrerons enfin comment ces motifs permettent de les différencier ou de les rapprocher.
Une série d’expressions ont été retenues ici parmi les plus fréquentes extraites dans chacun des six sous-genres comparés. L’approche corpus driven révèle des résultats aussi bien attendus, présentant des récurrences thématiques mais aussi inattendus, considérés plutôt comme étant des récurrences stylistiques (cf. Kraif & Novakova & Sorba 2016).
Les romans classés dans le sous-genre GEN présentent une grande variété d’expres- sions appartenant aux différentes dimensions sémantiques (cf. Tableau 2). Ce nombre important de résultats pourrait être dû, entre autres, à la taille importante du sous-corpus GEN (34 M. de mots, cf. Tableau 1). L’observation des données a montré que les ALR spécifiques à GEN appartiennent surtout à la catégorie des actions. Le Tableau 3 donne un aperçu de ces résultats: il présente une sélection d’ALR, classés par ordre décroissant de leur indice de spécificité LLR (cf. section 4) :

Comme le montre le Tableau 3, dans le sous-corpus GEN émergent, sans surprise, des actions « thématiques », qui renvoient à des activités d’écriture <écrire une lettre| un roman (d’amour, d’espionnage)| un poème| une ligne| un article| une page| un scénario> ou de lecture 11. Ce résultat n’est pas étonnant, car les activités scripturales témoignent de l’intérêt de l’au- teur/narrateur envers le processus d’écriture, fort légitime pour ce sous-genre (Gonon et al. 2018, 9).
On trouve aussi, dans la littérature générale, une surabondance d’expressions renvoyant à des (menues) actions, liées au quotidien des personnages: ils fument des cigarettes, font la vaisselle, allument des lampes, achètent du pain, prennent (boivent) un verre, ouvrent des fenêtres. D’autres actions renvoient à leurs mouvements ou déplacements: les protagonistes prennent le train, marchent dans la rue, vont à la messe, montent des escaliers. Enfin, d’autres actions, plus contemplatives, émergent aussi comme spéci fiques du GEN: les personnages se regardent dans la glace, regardent la mer, le ciel. En revanche, peu d’expressions verbo-nominales appartenant à la dimension communica- tion verbale et non verbale apparaissent dans ce sous-genre (cf. 6.1).
Les données du sous-corpus SENT révèlent une surabondance d’expressions liées au langage du corps, qui contribuent à la communication non verbale (physique) entre les personnages. Le tableau 4 illustre les ALR les plus spécifiques de SENT dans ces caté- gories:

Des ALR correspondant à des actions thématiques (<faire l’amour>, <déposer un bai- ser>) apparaissent sans surprise dans SENT. On relève également une surabondance d’expressions renvoyant aux mouvements du corps (<prendre dans ses bras>, <poser la main>) ou du visage (<baisser les yeux, <froncer les sourcils>, <esquisser un sourire>). Ces ALR de communication non verbale génèrent des motifs phraséologiques abondants qui traduisent aussi, de manière directe ou implicite, les affects des personnages : par ex. <froncer| hausser| lever (légèrement) les (beaux) sourcils| cils (roux) (d’un air sévère).
Dans la section 6.2 sera présentée une analyse des motifs identifiés autour de l’ALR <adresser un sourire>, statistiquement spécifique à SENT (cf. Tableau 4).
A la différence des sous-genres GEN et SENT, dans le POL émergent des actions thé- matiques plus ciblées comme par ex. <découvrir le corps| le cadavre>, <prévenir la police>, <ouvrir le coffre>. Le tableau 5 regroupe une partie des expressions présentant un indice de spécificité élevé dans POL :

Les résultats montrent qu’à la différence de SENT, les ALR liés au langage du corps et donc, à la communication non verbale, sont beaucoup moins nombreux et apparaissent surtout autour des deux pivots tête (<secouer| hocher la tête>) ou épaules <hausser les épaules), ce qui permet de distinguer, entre autres, ces deux sous-genres (cf. section 6.2)
A la différence des sous-genres examinés ci-dessus (GEN, SENT, POL), dans le sousgenre historique (HIST), ce sont les ALR de la catégorie communication verbale qui sont les plus représentés, ce qui est un résultat surprenant :

Les ALR <dire avec sourire> ou <dire d’une voix> agrègent des motifs variés d’interac-tion verbale (cf. 6.1, infra). En revanche, des ALR exprimant des actions thématiques comme <faire la guerre>, <mettre le siège> (devant Paris, la cité, son château), <quitter la cour> sont naturellement spécifiques au roman historique
Les motifs phraséologiques pour distinguer les genres littéraires. Sur l’exemple des motifs de la communication verbale et non verbale

Les expressions relevant de la communication verbale ou non verbale y sont très peu représentées, sauf l’ALR qui s’est avéré, de manière inattendue, spécifique à la SF (cf. section 6.2).
Enfin, dans la FY, hormis les expressions d’actions thématiques, des ALR renvoyant à la communication verbale sont apparus comme spécifiques :
Le vocabulaire médiéval, caractéristique de ce sous-genre, apparaît ici à travers la surre-présentation dALR exprimant des actions guerrières violentes ou agressives (<dégainer l’épée>, <encocher une flèche>, <arracher le cœur>). S’en détachent aussi, de manière plus inattendue, des ALR relevant de la communication entre les personnages comme <pousser des cris> ou <arracher des cris>, qui seront analysés dans la section 6.1.
Suite à l’observation des données, quelques tendances se dégagent : les ALR relevant de la catégorie des actions sont parmi les plus représentés mais les types d’actions varient selon les sous-genres: dans GEN, ce sont les actions quotidiennes qui sont surrepré- sentées, dans SENT, les actions liées aux mouvements du corps, dans POL, les actions thématiques policières, dans HIST, la communication verbale et les actions guerrières. Dans le sous-genre FY, les marqueurs génériques relèvent du vocabulaire guerrier mé- diéval et violent et de la communication par des cris, en revanche, dans SF ce sont les actions thématiques réalisées par des objets ou des instruments inanimés (vocabulaire plus « scientifique ») et la catégorie de la cognition qui s’imposent statistiquement. Plus généralement, la méthode des ALR, leur classement sémantique, ainsi que leurs regrou- pements en motifs phraséologiques permettent de distinguer les sous-genres analysés. Afin d’illustrer plus concrètement ces résultats, une étude de cas est proposée dans la section 6, portant sur les ALR de la dimension sémantique de la communication.
Cette catégorie se subdivise en deux valeurs (cf. Tableau 2): la communication verbale (, , ) et la communica- tion physique (, ). Ces ALR, qui génèrent des motifs, sont globalement bien représentés dans les six sous-genres étudiés mais des tendances, parfois surprenantes, se dégagent, révélées grâce à notre approche corpus driven. La section (6.1), analyse les motifs autour des expressions de la communication verbale dans HIST, comparé à GEN et à FY, et dans la section (6.2) sont comparées les expressions de la communication non verbale dans SF, SENT et POL.
Un résultat inattendu a émergé des données, notamment la haute spécificité des ALR,
<dire d’une voix> (LLR 370, 34) et <dire avec sourire> (LLR 343,72) dans les romans historiques (cf. Tableau 6). Ces ALR agrègent autour d’eux des motifs phraséologiques riches13: des variations paradigmatiques sont observées aussi bien sur le verbe dire| ordonner| répliquer| répondre| expliquer| lancer| prononcer| ajouter| crier| reprendre que sur le nom (voix| ton), mais aussi sur l’extension adjectivale: voix forte| sourde| claire| étouffée| ferme| calme| grave| tremblante| sèche| entrecoupée). En voici quelques exemples, issus du sous-corpus HIST:
La distribution syntaxique du motif dans les exemples de (1) à (3) est identique: il est présent dans les séquences qui précèdent le discours direct. Le motif fait ici partie d’un script (Baroni 2007)14 n’ayant pas d’impact important sur l’enchaînement narratif (FD infra-narrative ou faiblement narrative). Comme le montrent les exemples, l’acte de parole correspond à une action minimale. Par ailleurs, l’extension adjectivale dans la syntaxe du cadre collocationnel du motif, qui correspond à l’ALR dire d’une voix, peut provoquer un déplacement du focus des qualités propres de la voix (intensité, diction) vers la traduction des affects des personnages à travers l’acte de langage (dire d’une voix douce qui tremblait (en 2) ou d’une voix joyeuse en (3). Ici, la fonction discursive du motif est mixte: infra-narrative et affective.
En revanche, dans GEN, on observe une forte présence de verbes de parole: . Ces ALR à pivot verbal ne donnent cependant pas lieu à une grande variation sur le plan syntagmatique. Souvent, ces verbes de parole apparaissent à la 1ère personne : (LLR 726,16), (33,42), (26,36), (22,27), (21,83), (20,73), (19,15), (18,39), (18,25), (17,01), etc. Les ALR cités correspondent en effet « à une interlocution tournée vers l’intériorité ou une discussion tournée vers soi-même » (Gonon & Sorba 2019, 4). Plus généralement, comme l’indiquent les auteures, ces résultats pourraient s’expliquer par le fait que: « Les romans de littérature générale se caractérisent plutôt comme des récits psychologiques, avec une réflexivité bien plus marquée du narrateur-personnage ou des autres personnages » (idem, 14). On trouve aussi dans GEN des ALR de type ver- bo-nominal comme (LLR 64,00), (LLR 25,90), (LLR 22,31) qui sont davantage sujets à des variations mais leur fréquence est beaucoup plus restreinte ce sous-genre, surtout comparée au grand nombre de verbes de parole qui y sont présents.
Enfin, en FY, les personnages (monstres humanoïdes, soldats, hérauts, chevaux, faucons, loups) communiquent beaucoup en poussant des cris, des rugissements, des grogne-ments, des hurlements, des hennissements. On y trouve des motifs bien fournis et variés autour de l’ALR <pousser un cri> (LLR 235, 91) et sa version causative <arracher un cri> (LLR 62,68). En schéma : X <pousse| étouffe| arrache (alors, aussitôt, soudain) un (petit, grand| long) cri (hennissement, rugissement, grognement) + (ADJ strident| terrible| déchirant| de rage| de douleur| de guerre| de joie). Employées en phrase indépen-dante, ces expressions renvoient à des actes expressifs de langage :
En (4), Kroll pousse un hurlement bestial ayant comme conséquence le jaillissement d’un feu; en (5) Murmure pousse un hennissement pour attirer l’attention et la bienveillance de sa maîtresse. L’acte de langage a ici des répercussions sur les autres actions. A l’enchaîne- ment narratif (FD essentiellement narrative du motif), se superpose parfois une fonction discursive pragmatique (acte expressif de langage). Une autre distribution très fréquente de ce motif dans FY est la construction gérondive ou participiale (p. présent). Elle apporte une précision qui enrichit la description du personnage et de ses émotions:
Les motifs acquièrent ainsi, en (6) et en (7), une double fonction: infra-narrative et indi- rectement descriptive. Ces FD peuvent se voir enrichies d’une dimension affective et ce, grâce à la présence de l’extension du pivot nominal cri par un complément du nom (cri de plaisir (ex. 6), de rage, ex. (7)). Il s’agit d’affects qui traduisent des états euphoriques (cris de victoire, de triomphe) ou des émotions positives ou négatives (cris de plaisir, de joie, de rage).
En bref, les résultats montrent que les motifs de communication verbale permettent de distinguer les trois sous-genres: HIST, GEN et FY. La section (6.2) propose une analyse des motifs de la communication non verbale qui se sont révélés comme étant spécifiques à trois autres sous-genres: SF, SENT, POL.
Même si le nombre d’ALR de la catégorie de la communication non verbale est très restreint dans SF (comme d’ailleurs ceux de la catégorie de la communication verbale), on y trouve l’ALR (LLR 80,12), un résultat assez inattendu pour ce sous-genre. Cet ALR présente des variations syntagmatiques sur le verbe (lancer, jeter, glisser) et sur le N (coup d’œil, regard) qui est suivi d’une extension adjectivale (inquisiteur, désespéré, halluciné, discret, exaspéré, maussade):
Les motifs au sein du discours direct (ex. 8 et 9), relevés dans SF, contribuent à rythmer l’échange (FD infra-narrative). Lorsqu’ils apparaissent dans des phrases indépendantes ou coordonnées, le motif du regard lancé introduit une brève séquence descriptive: il s’agit le plus souvent de la description d’un autre personnage:
Comme on le voit en (10) et en (11), la séquence descriptive peut être assortie d’un commentaire et d’une réflexion du personnage « observateur » au sein d’une communication non verbale. Dans ce cas, les motifs véhiculent également une composante cognitive qui apparaît dans les commentaires « Prometteuse, en tout cas. » (en 10) et « Vrai qu’il ressemblait à sa mère. » (en 11). Le motif se voit attribuer ici une FD mixte: descriptive et cognitive.
A la différence des autres sous-genres, le langage du corps est très présent dans SENT (cf. Tableau 4). Les personnages y communiquent avec le sourire (communication non verbale). Le cœur du motif <adresser| lancer| faire un sourire> connaît des extensions adjectivales variées (sourire gêné, résigné, complice, enfantin, épanoui), qui véhiculent une dimension affective. Ces motifs que l’on trouve souvent dans le dialogue ont ainsi une double fonction discursive: infra-narrative (contribuant à meubler la conversation) et affective : sourire gêné (ex. 12) ou épanoui (ex. 13) :
Par ailleurs, le sourire offre parfois une voie d’accès aux pensées et à l’état d’esprit du personnage:
Ainsi, en (14), le motif est suivi d’un commentaire: qu’il n’aille surtout pas imaginer qu’elle était jalouse, en (15) la signification du sourire est décryptée: ça va mieux, j’assume. À la fonction infra-narrative du motif s’ajoute, dans ces cas, une dimension cognitive commentative.
Enfin, dans POL, où dominent les ALR d’actions policières (<découvrir le cadavre>, <ouvrir le coffre>, <prévenir la police>, cf. Tableau 5), les ALR de communication non verbale se font rares, surtout si on les compare au sous-genre SENT. Deux ALR statistiquement spécifiques dans cette catégorie sont, toutefois, présents dans POL autour des pivots nominaux tête et épaules: <hausser les épaules> (LLR 104,87), <hocher la tête (LLR 103,89). Les deux motifs fonctionnent de manière identique sur le plan discursif. Ils ouvrent (ex. 16) ou ferment le dialogue (ex. 17) et ont, de ce fait, une FD infra-narrative:
Les ALR en question peuvent s’insérer aussi dans une série d’actions et contribuent à la progression narrative (FD narrative):
En bref, les motifs qui expriment des actes de communication non verbale (<lancer un coup d’œil>, <adresser un sourire>, <hocher la tête>, <hausser les épaules>) fonc- tionnent différemment sur le plan discursif dans les sous-genres comparés: le motif du sourire dans SENT remplit des fonctions discursives subtiles et variées: infra-narrative et affective dans le dialogue, infra-narrative et cognitive en parataxe juxtaposée. Les données ont révélé aussi, de manière inattendue, la présence statistiquement significa- tive du motif <lancer un coup d’œil> dans SF, remplissant une fonction infra-narrative (lorsqu’il est placé dans le dialogue) ou descriptive au début d’une séquence contenant un commentaire sur un autre personnage vers lequel le regard est lancé. Enfin, dans POL, les ALR autour des pivots nominaux tête ou épaules ont une FD essentiellement infra- narrative. L’analyse stylistique fine des FD des motifs montre que ces derniers se distinguent sur le plan discursif selon leurs distributions et environnements contextuels et qu’ils sont inégalement représentés dans les sous-genres contrastés.
Les motifs de la communication verbale et non verbale, identifiés grâce à notre approche corpus driven, ont permis de révéler certaines différences entre les sous-genres littéraires étudiés. Cette approche a fait aussi émerger des expressions que l’on ne soupçonne pas intuitivement d’être spécifiques à tel ou tel sous-genre, comme par ex. le motif <dire d’une voix> dans le roman historique, comparé à la littérature générale où l’on trouve une sur-représentation statistique de verbes dicendi ne formant pas ou peu de motifs. En FY, on découvre les expressions de communication verbale renvoyant à des cris, à des hurlements. Par ailleurs, les expressions de la catégorie communication non verbale (<prendre dans ses bras>, <poser la main>, <froncer le sourcil>, <adresser un sourire>) sont spécifiques surtout à SENT, où le langage du corps est surreprésenté. Elles sont donc distinctives pour SENT, surtout comparé à POL, où seulement <hocher la tête> et <hausser les épaules> apparaissent comme spécifiques dans cette catégorie. Enfin, en SF, on observe un nombre très restreint d’expression de communication verbale et non verbale, excepté le motif inat-tendu généré par l’ALR <lancer un coup d’œil ». Ainsi, l’étude a montré que les motifs, identifiés à l’aide d’outils lexicométriques sur de grands corpus littéraires, constituent des schémas pouvant nous renseigner sur la structuration et l’interprétation des textes (Gonon & Sorba 2019, 19). Plus généralement, les motifs assurent le lien entre le micro-niveau (les variations récurrentes sur le plan syntagmatique et paradigmatique) et le macro-niveau discursif (celui du script narratif ou fictionnel), et ce à travers l’étude fine de leurs fonc-tions discursives (Novakova & Siepmann 2020), comme proposé aussi dans cette étude. Ces séquences phraséologiques récurrentes permettent d’analyser et de distinguer les sous-genres littéraires. La phraséologie étendue peut donc contribuer à l’élaboration « d’une théorie opérationnelle des genres » (Rastier 2011, 72).






