Le Laboratoire d’automatique documentaire et linguistique (LADL) fondé par feu Maurice Gross, et d’autres départements universitaires en France et à l’étranger, constituent patiemment des lexiques-grammaires exhaustifs. « Grammaire », oui, le mot est laché : « la syntaxe, c’est notre affaire », disent les grammairiens. L’ennui, c’est que sur l’axe syntagmatique, il y a des mots, et que ces mots ne s’unissent pas les uns aux autres n’importe comment, même lorsqu’ils ont l’air d’avoir le même sens, comme nous l’avons vu plus haut à propos de heureux, content, et satisfait. Dans un numéro spécial du Français dans le Monde intitulé « ... et la grammaire ? », de février-mars 1989, Christian Leclère, membre du LADL, enfonçait un coin dans ce domaine réservé par le seul titre en forme de question de son article : « Les mots ont-ils une grammaire ? » La réponse est évidemment affirmative. La même année paraissaient d’ailleurs deux grammaires de FLE d’une certaine notoriété, qui avaient pour caractéristique commune, et originale, de consacrer une partie importante de leur contenu à une liste de verbes classés par ordre alphabétique et dont les constructions figuraient en regard. En somme, un « dictionnaire de verbes » au beau milieu d’une grammaire. Le coup d’envoi était donné : il fallait désormais s’attendre à ce que les grammaires accordent une place de plus en plus grande à toutes les catégories de mots, et pas seulement à celle des verbes.
Déjà une terminologie propre à cet angle d’approche se met en place : on sait ce que sont les constructions verbales, mais on peut tout aussi bien parler des constructions adjectivales ; les co-occurents sont des suites (continues ou discontinues) de mots qui se côtoient fréquemment dans un même texte (chien - aboyer ; critiquer - vertement) ; les collocations sont des co-occurents consécutifs (les ficelles du métier) ; beaucoup de collocations sont figées et constituent des mots composés, comme nous l’avons vu plus haut à propos de la définition du « mot » donnée par Maurice Gross. Les correlés entretiennent entre eux des rapports de parenté sémantique sur l’axe paradigmatique. Enfin, d’une certaine façon, les actants et le champ actanciel de Jacqueline Picoche, entrent dans le cadre de cette approche syntaxique du « mot ». Sans utiliser des termes aussi savants, avec les simples mots construction et composé, que tous les apprenants peuvent comprendre et retenir, il est déjà possible de dire beaucoup de choses.
Si nous sommes d’accord sur ce que sont les mots, sur les divers angles sous lesquels ils peuvent être approchés, et sur le minimum de terminologie indispensable pour en parler, se pose alors la question de leur apparition ou de leur présentation, sans oublier la question corollaire de leur sélection. Pourquoi a-t-on si longtemps négligé l’apprentissage du vocabulaire ? Tout simplement parce que nombreux sont ceux qui ont pensé, et pensent encore, qu’il suffit d’exposer aussi souvent que possible l’apprenant à un grand nombre de textes [1] variés pour que, petit à petit, tout naturellement, sans effort particulier, les mots qui composent ces textes s’inscrivent dans sa mémoire. C’est ce qu’on appelle la présentation indirecte , le texte et surtout le contexte ayant en outre une autre vertu, celle de permettre de deviner, d’inférer le sens des mots inconnus à partir des mots connus. On voit bien l’origine de la démarche : elle s’inscrit évidemment en réaction contre les listes de vocabulaire thématique auxquelles nous faisions plus haut allusion.
Assez tôt pourtant, dans les années cinquante, s’est posée la question d’un apprentissage progressif du vocabulaire. La réponse était de bon sens : il fallait d’abord enseigner les mots les plus fréquents, d’où la publication des travaux de la Commission du Français Fondamental. Le développement de l’informatique aidant, on reparle beaucoup de fréquence depuis quelques années : il est en effet devenu très facile, grâce à l’ordinateur, de travailler sur des corpus écrits volumineux, d’en recenser les mots, et de les classer par ordre de fréquence. On ne citera que deux travaux parmi d’autres : celui d’Etienne Brunet, Le vocabulaire français de 1789 à nos jours, Genève, Slatkine, 1981, effectué à partir du corpus du Trésor de la Langue Française, et celui de Jean Baudot, Fréquence d’utilisation des mots en français écrit contemporain, Montréal, Presses de l’Université de Montréal, 1992, qui porte sur un corpus d’articles de presse parus dans les années soixante et d’œuvres de fiction publiées dans la première moitié du XXème siècle.
Mais la sélection du vocabulaire, cela ne consiste pas seulement à établir la liste des mots les plus fréquents à enseigner en priorité aux débutants. En principe, on ne reste pas débutant toute sa vie ! Vient un moment où l’apprenant est exposé à des textes (oraux ou écrits) dont le contenu repose sur d’autres bases que l’hyper-fréquence lexicale [2]. Passé, donc, ce premier stade, qui devrait normalement faire l’unanimité, la question se pose du choix des mots à extraire du texte, des mots sur lesquels on va s’attarder, des mots jugés utiles mais encore inconnus des élèves, et qu’il serait par conséquent bon de leur enseigner. Dans la présentation indirecte, le contenu lexical est secondaire : ce qui, avant les années 80, présidait au choix d’un texte, c’était son contenu grammatical. Depuis, c’est plutôt son contenu communicatif, ou fonctionnel, ou tout simplement situationnel. Et la progression, quand on en trouve une, repose sur l’un ou l’autre de ces choix. À notre connaissance, il n’a encore jamais existé de méthode de langue reposant sur une progression lexicale, laquelle supposerait l’existence, la découverte, ou l’élaboration d’un système lexical. Les signes de l’existence d’un tel système, aussi complexe soit-il, ne manquent pourtant pas, et nous les avons, d’une certaine façon, énumérés. Ce que nous avons appelé « angles d’approche » pourrait bien constituer les sous-systèmes du système lexical.
À suivre
[1] au sens large de « séquence discursive orale ou écrite »
[2] J’utilise ce terme à dessein plutôt que celui de fréquence, car dès que l’on sort des quelques 500 ou 600 mots les plus fréquents du français, et probablement de n’importe quelle langue, on voit apparaître des divergences qui résultent évidemment de la quantité et de la qualité des corpus forcément limités sur lesquels ont porté les études statistiques).

Bonjour,
Purriez vous me dire si la la liste de Jean Baudot « Fréquence d’utilisation des mots en français écrit contemporain, Montréal, presses de l’université de Montréal, 1992" correspond aux critères suivants ?
Un corpus représentatif de la langue française écrite (et parlée)
Moderne (cad à partir de 1990)
Indication de la nature du mot (lemmatisation)
Merci de me répondre
mberron@hotmail.com