Linguistiquement correct: juin 2023

lundi 26 juin 2023

Les Québécois sont-ils encore obsédés par les anglicismes?

Un grogniqueur, qui me fait l’honneur de me lire (et réciproquement), n’a de cesse de récriminer contre « nos grammairiens et puristes grincheux ». Il semble obsédé par la « longue tradition québécoise de chasse aux anglicismes » et par le désir d’y mettre fin. Il est vrai que l’on a peut-être trop accordé d’attention au vocabulaire (et à la terminologie) plutôt qu’aux autres aspects de la maîtrise du français. Les résultats aux examens de français du ministère de l’Éducation sont éloquents à cet égard. Le taux d’échec ne cesse de croître. Comme je l’ai déjà noté, si l’orthographe, qui n’est qu’un « sous-critère » dans la grille de correction du Ministère, était un critère au sens plein, donc avait une valeur éliminatoire, le quart des élèves échouerait à l’épreuve de français du cégep. Mais il y a dans ces résultats un élément curieux que tout le monde passe sous silence : année après année, la note en maîtrise du vocabulaire (un sous-critère) dépasse les 99 % — ce qui contrebalance les notes plus faibles en orthographe et en syntaxe. Pourquoi alors accorder tant d’importance dans le discours public à la critique du vocabulaire (et des anglicismes) ? Serait-ce un faux problème ? Je crois qu’il faut apporter une réponse cynique : le vocabulaire, dans la correction des examens, n’est qu’une variable d’ajustement, il permet de hausser le taux de réussite du seul critère vraiment éliminatoire (maîtrise de la langue) des trois critères de la grille de correction. (Pour comprendre le mécanisme assez complexe de la grille de correction des épreuves ministérielles de français, cliquer ici.)

Il y a eu un changement indéniable dans l’attitude des Québécois envers les anglicismes et, en toute modestie, je précise que j’ai été le premier à en apporter la preuve dans mes enquêtes de 1998 et de 2004. Dans ces sondages, j’ai repris une des questions d’opinion que le Conseil de la langue française avait demandé à Annette Paquot d’ajouter à son enquête sur Les Québécois et leurs mots : étude sémiologique et sociolinguistique des régionalismes lexicaux au Québec (Québec, Presses de l’Université Laval, 1988). Cette dizaine de questions débordaient l’objet de l’enquête d’Annette Paquot et ne sont donc pas traitées dans son rapport. Elles ont été reprises dans mes enquêtes de 1998 et de 2004. L’une portait sur les anglicismes et était ainsi formulée : « Il faudrait éliminer les mots anglais du français d’ici ».

Une remarque d’abord sur la formulation. Pour la plupart des gens, les anglicismes sont des mots anglais utilisés tels quels en français et c’est cette définition populaire que reprend la question. Mais pour les spécialistes, les anglicismes comprennent aussi les traductions littérales d’expressions anglaises (calques) et les sens anglais que l’on donne à des mots français (emprunts sémantiques).

En 1983, plus des trois quarts des répondants[1] croyaient qu’il fallait éliminer les mots anglais du français québécois :

Deux décennies plus tard, la popularité de cette opinion a fait une chute de près de 20 points. Ce changement, qui a touché toutes les strates d’âge, est plus important chez les jeunes, dont un peu plus du tiers se disaient encore hostiles aux anglicismes comparativement aux deux tiers chez les plus âgés.

[1] En 1983, l’enquête d’Annette Paquot n’avait porté que sur les régions de Québec et de Montréal. Dans les enquêtes de 1998 et de 2004, nous n’avons donc tenu compte que des réponses des régions métropolitaines de recensement de Montréal et de Québec pour que les résultats soient comparables.

mardi 20 juin 2023

À quel dictionnaire faire crédit?

Ces jours derniers, je suis allé faire une visite sur le site de France Terme. On y mettait en vedette la fiche « crédit » datant de 2007. Ce terme du domaine de l’éducation est largement connu au Québec. France Terme ajoute la note suivante :

Le terme « crédit », généralement au pluriel, s'emploie dans le cadre de la mise en œuvre du « système européen de crédits transférables, SECT » (en anglais : european credits transfer system, ECTS).

Le Grand Dictionnaire terminologique (GDT) reprend telle quelle la fiche de France Terme. Il ne fait aucune mention de la désofficialisation du terme unité que l’Office, pas encore québécois, de la langue française (OQLF) avait en 1998 normalisé en lieu et place de crédit. On trouve la trace de cette officialisation dans la fiche « cours à unité » :

L’OQLF a aussi une fiche « cours sans unité » :

En principe, les termes normalisés par l’Office deviennent obligatoires dans le monde de l’enseignement. Qu’en est-il du terme crédit ? Doit-on suivre l’avis de la Commission d’enrichissement de la langue française publié dans le site France Terme ? L’avis de cette commission a-t-il préséance sur les décisions du Comité d’officialisation de l’OQLF ? La question se pose car le terme crédit est absent de la liste des termes désofficialisés par l’OQLF.

vendredi 2 juin 2023

Recensement et langues

Considérations sociolinguistiques sur le traitement des réponses aux questions sur les langues du recensement canadien

Je reproduis ici la préface que j’ai écrite pour une note de recherche du démographe Michel Paillé.

Depuis 1983, Statistique Canada publie le nombre de personnes qui ont donné plus d’une réponse à la question sur la « langue maternelle » ainsi qu’à celle portant sur la « langue d’usage » au foyer.

Ces « réponses multiples » sont classées en cinq catégories : « français-anglais », « français-autre », « anglais-autre », « français-anglais-autre » ainsi qu’une classe résiduelle regroupant toutes les personnes ayant mentionné au moins deux langues non officielles (« autre-autre… »).

Depuis longtemps les chercheurs ont souvent choisi de répartir également les réponses multiples entre le français, l’anglais et l’ensemble des langues non officielles (ou langues tierces). Ainsi, pour faciliter la description et l’analyse des données, ils ne conservaient que les trois classes linguistiques habituelles.

La présente note méthodologique est une analyse critique de cette façon de procéder, c’est-à-dire qu’elle examine ce qui se produit lorsqu’on procède à la répartition égale des réponses multiples dans un tableau où les langues maternelles sont croisées selon les langues d’usage, procédure qui revient à ramener 49 données brutes[1] à seulement 9. Cette procédure est notamment utilisée dans l’évaluation de l’importance de la substitution linguistique (on parle aussi de transferts linguistiques ou d’assimilation), un des indicateurs de la situation linguistique.

En marge des travaux confiés à l’Office québécois de la langue française, il est important d’engager des réflexions, voire des remises en question, concernant les méthodes et les instruments d’analyse en vue d’obtenir une description la plus fiable possible de la réalité que l’on cherche à comprendre. Aussi l’Office québécois de la langue française a-t-il demandé à Michel Paillé, démographe connu pour ses nombreuses contributions à la démolinguistique, de déterminer si la répartition des réponses multiples entre le français, l’anglais ou une langue tierce est justifiée et si les procédures de répartition utilisées sont appropriées. On lui a de plus demandé d’examiner de quelle façon une telle répartition devrait, le cas échéant, être effectuée pour refléter le plus exactement possible la réalité.

Par définition, les réponses multiples sont différentes des réponses uniques et on ne doit pas s’attendre à ce que leur répartition à égalité entre les trois groupes linguistiques (francophones, anglophones, allophones) produise les mêmes effets sur la rétention et la mobilité linguistique qu’une analyse qui serait faite uniquement à partir des réponses uniques. L’auteur, qui a choisi de faire porter son analyse plus spécifiquement sur les substitutions linguistiques, montre que la répartition égale des réponses multiples engendrerait, ou induirait, trois types de substitutions linguistiques : quelques rares substitutions véritables, de nombreuses substitutions fictives (ou modélisées, si l’on préfère) et autant de substitutions partielles transformées artificiellement en substitutions complètes.

Selon l’analyse de Michel Paillé, les substitutions partielles, indûment transformées en substitutions complètes, auraient augmenté de 39 % à 51 % en 20 ans. Mais ses conclusions les plus percutantes touchent ce qu’il appelle les substitutions fictives. La moitié des réponses multiples (les deux cinquièmes depuis 1991) seraient responsables des substitutions linguistiques fictives. Cette façon de faire écraserait par son poids celui des substitutions linguistiques véritables.

Pour Michel Paillé, la répartition égale des réponses multiples crée donc une distorsion.

Les analyses de Michel Paillé valident donc l’hypothèse qu’il a émise voulant que les réponses multiples ne soient pas des erreurs systématiques que corrigerait la répartition égale mais qu’au contraire, elles reflètent bien une partie de la réalité linguistique. En effet, tout porte à croire que ces cas reflètent sans doute souvent des situations complexes et transitoires en matière de mobilité linguistique, situations qui s’accommodent mal de la contrainte de la réponse unique à laquelle invitent pourtant les questions linguistiques du recensement[2]. Considérant que les réponses uniques forment la très grande majorité des cas, l’auteur recommande, comme première solution, de calculer les indicateurs linguistiques les plus courants uniquement à partir de cette partie des données de recensement publiées par Statistique Canada, méthode plus simple que celle retenue par Louise Marmen et Jean-Pierre Corbeil[3] et qui arrive sensiblement aux mêmes résultats qu’eux. Car, que l’on analyse dans leur intégrité les substitutions linguistiques complètes et partielles telles qu’elles ont été déclarées ou, au contraire, qu’on simplifie l’analyse de l’assimilation au moyen de la répartition égale, les résultats obtenus en suivant l’une comme l’autre de ces démarches sont tout à fait en harmonie.

À défaut d’étudier les substitutions linguistiques uniquement à partir des réponses uniques, l’auteur propose comme solution de rechange de regrouper les réponses multiples en fonction du français. Dans le cas du Québec, pouvons-nous ajouter. Car, dans celui des autres provinces, on peut penser que le regroupement devrait se faire en fonction de l’anglais. Il faut savoir que, pour son auteur, cette proposition n’est qu’une hypothèse de travail, dont il est conscient de la valeur relative.

Certains pourront hésiter à suivre Michel Paillé dans le regroupement des réponses multiples qu’il propose. Car, dans l’étude de la substitution linguistique, ne serait-il pas préférable de ne prendre en compte que les réponses uniques, ainsi d’ailleurs que l’auteur lui-même le propose comme première solution ? Aux spécialistes de la démolinguistique d’en débattre et de proposer une solution. Mais si on parvenait à s’entendre sur une manière de répartir les réponses multiples, ne perdrait-on pas du coup un lot d’informations intéressantes ?

En outre, la répartition égale des réponses multiples n’est pas sans poser de difficultés du point de vue de l’éthique et de celui de la sociolinguistique.

En effet, d’un point de vue éthique, la répartition des réponses multiples revient à nier l’auto-identification des répondants puisque le chercheur décide de les loger à des enseignes uniques que, dans un geste délibéré, ils ont pourtant refusé de choisir.

D’un point de vue sociolinguistique, répartir également les réponses multiples signifie se priver d’informations sur le multilinguisme, phénomène dont il est de plus en plus important de tenir compte dans le présent contexte de mondialisation. Cette façon de faire est d’autant plus insatisfaisante que la recherche en sociolinguistique a montré que les variables que les études démolinguistiques tiennent pour des variables clés sont liées à des facteurs qui, en fait, ne sont pas stables mais fluides. Pour donner un exemple concret, une catégorie en apparence aussi limpide pour le sens commun que celle de la langue maternelle[4] peut en fait se décliner sous différents aspects : la langue des ancêtres, la première langue qu’on a apprise, la langue à laquelle on s’identifie, la langue à laquelle les autres nous identifient, la langue que l’on utilise le plus souvent, la langue dans laquelle on se sent le plus compétent, etc.; et la langue dite maternelle qui peut en fait être celle du père. Un expert de la recherche sociolinguistique affirme même : « la réalité sous-jacente à la notion de langue maternelle est variable et instable, quand elle n’est pas confuse et sans valeur pratique.[5] » La recherche sociolinguistique invite donc à la prudence dans le traitement de variables en apparence discrètes mais dont les frontières sont en réalité floues. Dans ces conditions, la répartition des multiples pourrait ne faire qu’accroître le flou tout comme, à l’inverse, il est aussi permis de supposer que son utilisation crée des compensations au lieu de cumuls de distorsions. Quoi qu’il en soit, la position la plus sage est sans doute : in dubio, abstine. Et cette abstention, ce refus de répartir les réponses multiples, permettrait de rendre davantage compte de la réalité multilingue québécoise en émergence.

Car la répartition égale des réponses multiples occulte cette réalité multilingue :

[…] [le] multilinguisme, qui semble bien réel dans de nombreux foyers québécois, vient remettre en question les méthodes classiques de mesure des transferts linguistiques […]. Ainsi, selon cette approche [ = la répartition égale des réponses multiples], chaque individu doit avoir une seule langue maternelle alors que près de 100 000 personnes au Québec déclaraient au moins deux langues maternelles en 2001. De même, une seule langue d’usage à la maison doit être retenue pour chacun des individus alors que près d’un million de Québécois déclaraient en 2001 utiliser souvent ou régulièrement deux langues ou plus à la maison. […] à force de transformer les déclarations pour qu’elles se prêtent aux exigences de la construction des indices classiques de transfert linguistique, on en vient à occulter le multilinguisme qui semble caractériser les comportements d’une frange importante de la société québécoise. Du coup, on en vient également à occulter la place qu’occupe la langue française dans ce multilinguisme tel qu’il est pratiqué dans les chaumières québécoises où l’on compte plus de 220 000 personnes qui déclarent utiliser régulièrement le français à la maison, même si cette langue n’est pas celle qu’ils déclarent utiliser le plus souvent.[6]

Cette note méthodologique sur la répartition égale des réponses multiples n’a pas la prétention de régler la question une fois pour toutes. Il s’agit d’un document technique qui devrait retenir l’attention surtout des utilisateurs de données linguistiques. […]

[1] En retenant la catégorie « autre autre », on aurait 64 cases (8 x 8). Mais comme ces cas rarissimes sont tous versés aux réponses uniques « autre », la matrice est réduite à 49 cases (7 x 7).

[2] Voir, p.ex., Marc Termote, L’avenir démolinguistique du Québec et de ses régions, Québec, Conseil de la langue française, 1994, p. 14.

[3] Marmen, Louise et Jean-Pierre Corbeil, Nouvelles perspectives canadiennes. Les langues au Canada. Recensement de 2001, Ottawa, Ministère des Travaux publics et Services gouvernementaux Canada,

2004, 163 p.

[4] À cet égard, on se rappellera que le recensement canadien ne pose pas explicitement de question sur la langue maternelle (l’expression n’y figure même pas) mais plutôt sur la première langue apprise et encore comprise. L’habitude s’est toutefois prise d’interpréter cette question comme portant sur la langue maternelle.

[5] William F. Mackey, « Langue maternelle, langue première, langue seconde, langue étrangère », dans : Marie-Louise Moreau, Sociolinguistique. Concepts de base, Sprimont, Mardaga, 1997, p. 184.

[6] Richard Marcoux, Recherches sociographiques 44/2 (2006), p. 396.

jeudi 1 juin 2023

Les prénoms pour déterminer l’âge

Christer Lauréen (1942-2022)

Je reprends ici un texte publié il y a une vingtaine d’années dans un recueil d’articles (les linguistes disent un recueil de Mélanges, en allemand Festschrift) offert en hommage de la part de ses collègues au professeur Christer Laurén de l’Université de Vaasa (ou Vasa) en Finlande, membre du Conseil de la langue suédoise en Finlande de 1976 à 1985 et son président de 1985 à 1994.

Ce court texte décrit la méthode que j’ai mise au point pour tenter d’estimer l’âge des scripteurs dans mon étude Ciel! Mon français! Analyse linguistique de 4 000 courriels, Québec, Conseil de la langue française, 2003.

* * *

Nous avons récemment procédé à l’analyse linguistique d’un corpus de 4 000 courriels, comptant au total plus de 405 000 mots. Ces courriels avaient été envoyés à l’animateur d’une émission de télévision qui s’est terminée en 1999. Nous voulions faire une étude des fautes de français en fonction, entre autres caractéristiques, de l’âge des scripteurs mais seulement 280 correspondants avaient mentionné leur âge dans leur texte. Nous avons donc dû avoir recours à une méthode inédite dans la recherche linguistique et sociolinguistique.

Nous avons d’abord pris la décision de ne retenir que deux classes d’âge : les plus de 35 ans et les moins de 35 ans. Et, lorsque les correspondants ne donnaient pas leur âge, ce qui était le cas pour environ 3 800 des auteurs de courriels, nous les avons placés dans l’une de ces classes à partir de leur prénom.

En effet, la fréquence d’attribution des prénoms obéit à des modes, comme le montre bien la figure qui suit : le prénom Simone, lorsqu’il atteint son sommet de popularité en 1912, est donné à 4 % des filles; trente ans plus tard, Nicole prénomme 5,5 % des filles et Éric est le prénom de 7 % des garçons nés en 1969 et 1970. La popularité des prénoms prend, dans la plupart des cas, l’aspect d’une courbe légèrement asymétrique et dont la croissance est plus rapide que la décroissance.

Fréquence annuelle d’attribution de trois prénoms de 1890 à 2000 au Québec

Source : Louis Duchesne, Les prénoms. Des plus rares aux plus courants au Québec, Outremont, Trécarré, nouvelle édition, 2001, p. 21

L’attribution d’un âge à partir du prénom se base sur l’étude de Louis Duchesne sur la fréquence des prénoms. Cette étude repose sur un corpus de plus de 3 millions de prénoms donnés au Québec depuis 1890; on y voit très bien que la plupart des prénoms ne sont populaires que pour une période donnée.

Nous avons essayé différentes façons de classer les courriels en deux groupes selon que leurs auteurs avaient moins de ou plus de 35 ans, ce qui revenait à les classer selon qu’ils étaient nés avant ou après 1964. En effet, la plus grande partie des émissions avaient été diffusées en 1999 (1999 – 35 ans = 1964). Il est apparu que la meilleure façon de procéder était d’utiliser le mode du prénom (c’est-à-dire baser le calcul sur l’année où le prénom a été donné au plus grand nombre d’enfants) et d’avoir une marge de 10 ans, c’est-à-dire de ne pas tenir compte des prénoms dont les modes se situent entre 1959 et 1969.

Nous avons vérifié la méthode à partir des quelque 280 courriels dont nous avions l’âge des auteurs. Le taux d’échec (de non-prédiction) en utilisant cette méthode est de 5,4 %.

La méthode que nous avons utilisée a eu pour résultat d’éliminer quelque 800 courriels parce que les années des modes des prénoms de leurs auteurs tombaient dans la marge que nous nous étions donnée (soit entre 1959 et 1969). Or, il est intéressant de noter que, lorsque l’on analyse les fautes de français commises par ce groupe, la moyenne se situe entre celle des plus de 35 ans et celle des moins de 35 ans.