vendredi 2 juin 2023

Recensement et langues

Considérations sociolinguistiques sur le traitement des réponses aux questions sur les langues du recensement canadien

 

Je reproduis ici la préface que j’ai écrite pour une note de recherche du démographe Michel Paillé.

 


 

Depuis 1983, Statistique Canada publie le nombre de personnes qui ont donné plus d’une réponse à la question sur la « langue maternelle » ainsi qu’à celle portant sur la « langue d’usage » au foyer.

Ces « réponses multiples » sont classées en cinq catégories : « français-anglais », « français-autre », « anglais-autre », « français-anglais-autre » ainsi qu’une classe résiduelle regroupant toutes les personnes ayant mentionné au moins deux langues non officielles (« autre-autre… »).

Depuis longtemps les chercheurs ont souvent choisi de répartir également les réponses multiples entre le français, l’anglais et l’ensemble des langues non officielles (ou langues tierces). Ainsi, pour faciliter la description et l’analyse des données, ils ne conservaient que les trois classes linguistiques habituelles.

La présente note méthodologique est une analyse critique de cette façon de procéder, c’est-à-dire qu’elle examine ce qui se produit lorsqu’on procède à la répartition égale des réponses multiples dans un tableau où les langues maternelles sont croisées selon les langues d’usage, procédure qui revient à ramener 49 données brutes[1] à seulement 9. Cette procédure est notamment utilisée dans l’évaluation de l’importance de la substitution linguistique (on parle aussi de transferts linguistiques ou d’assimilation), un des indicateurs de la situation linguistique.

En marge des travaux confiés à l’Office québécois de la langue française, il est important d’engager des réflexions, voire des remises en question, concernant les méthodes et les instruments d’analyse en vue d’obtenir une description la plus fiable possible de la réalité que l’on cherche à comprendre. Aussi l’Office québécois de la langue française a-t-il demandé à Michel Paillé, démographe connu pour ses nombreuses contributions à la démolinguistique, de déterminer si la répartition des réponses multiples entre le français, l’anglais ou une langue tierce est justifiée et si les procédures de répartition utilisées sont appropriées. On lui a de plus demandé d’examiner de quelle façon une telle répartition devrait, le cas échéant, être effectuée pour refléter le plus exactement possible la réalité.

Par définition, les réponses multiples sont différentes des réponses uniques et on ne doit pas s’attendre à ce que leur répartition à égalité entre les trois groupes linguistiques (francophones, anglophones, allophones) produise les mêmes effets sur la rétention et la mobilité linguistique qu’une analyse qui serait faite uniquement à partir des réponses uniques. L’auteur, qui a choisi de faire porter son analyse plus spécifiquement sur les substitutions linguistiques, montre que la répartition égale des réponses multiples engendrerait, ou induirait, trois types de substitutions linguistiques : quelques rares substitutions véritables, de nombreuses substitutions fictives (ou modélisées, si l’on préfère) et autant de substitutions partielles transformées artificiellement en substitutions complètes.

Selon l’analyse de Michel Paillé, les substitutions partielles, indûment transformées en substitutions complètes, auraient augmenté de 39 % à 51 % en 20 ans. Mais ses conclusions les plus percutantes touchent ce qu’il appelle les substitutions fictives. La moitié des réponses multiples (les deux cinquièmes depuis 1991) seraient responsables des substitutions linguistiques fictives. Cette façon de faire écraserait par son poids celui des substitutions linguistiques véritables.

Pour Michel Paillé, la répartition égale des réponses multiples crée donc une distorsion.

Les analyses de Michel Paillé valident donc l’hypothèse qu’il a émise voulant que les réponses multiples ne soient pas des erreurs systématiques que corrigerait la répartition égale mais qu’au contraire, elles reflètent bien une partie de la réalité linguistique. En effet, tout porte à croire que ces cas reflètent sans doute souvent des situations complexes et transitoires en matière de mobilité linguistique, situations qui s’accommodent mal de la contrainte de la réponse unique à laquelle invitent pourtant les questions linguistiques du recensement[2]. Considérant que les réponses uniques forment la très grande majorité des cas, l’auteur recommande, comme première solution, de calculer les indicateurs linguistiques les plus courants uniquement à partir de cette partie des données de recensement publiées par Statistique Canada, méthode plus simple que celle retenue par Louise Marmen et Jean-Pierre Corbeil[3] et qui arrive sensiblement aux mêmes résultats qu’eux. Car, que l’on analyse dans leur intégrité les substitutions linguistiques complètes et partielles telles qu’elles ont été déclarées ou, au contraire, qu’on simplifie l’analyse de l’assimilation au moyen de la répartition égale, les résultats obtenus en suivant l’une comme l’autre de ces démarches sont tout à fait en harmonie.

À défaut d’étudier les substitutions linguistiques uniquement à partir des réponses uniques, l’auteur propose comme solution de rechange de regrouper les réponses multiples en fonction du français. Dans le cas du Québec, pouvons-nous ajouter. Car, dans celui des autres provinces, on peut penser que le regroupement devrait se faire en fonction de l’anglais. Il faut savoir que, pour son auteur, cette proposition n’est qu’une hypothèse de travail, dont il est conscient de la valeur relative.

Certains pourront hésiter à suivre Michel Paillé dans le regroupement des réponses multiples qu’il propose. Car, dans l’étude de la substitution linguistique, ne serait-il pas préférable de ne prendre en compte que les réponses uniques, ainsi d’ailleurs que l’auteur lui-même le propose comme première solution ? Aux spécialistes de la démolinguistique d’en débattre et de proposer une solution. Mais si on parvenait à s’entendre sur une manière de répartir les réponses multiples, ne perdrait-on pas du coup un lot d’informations intéressantes ?

En outre, la répartition égale des réponses multiples n’est pas sans poser de difficultés du point de vue de l’éthique et de celui de la sociolinguistique.

En effet, d’un point de vue éthique, la répartition des réponses multiples revient à nier l’auto-identification des répondants puisque le chercheur décide de les loger à des enseignes uniques que, dans un geste délibéré, ils ont pourtant refusé de choisir.

D’un point de vue sociolinguistique, répartir également les réponses multiples signifie se priver d’informations sur le multilinguisme, phénomène dont il est de plus en plus important de tenir compte dans le présent contexte de mondialisation. Cette façon de faire est d’autant plus insatisfaisante que la recherche en sociolinguistique a montré que les variables que les études démolinguistiques tiennent pour des variables clés sont liées à des facteurs qui, en fait, ne sont pas stables mais fluides. Pour donner un exemple concret, une catégorie en apparence aussi limpide pour le sens commun que celle de la langue maternelle[4] peut en fait se décliner sous différents aspects : la langue des ancêtres, la première langue qu’on a apprise, la langue à laquelle on s’identifie, la langue à laquelle les autres nous identifient, la langue que l’on utilise le plus souvent, la langue dans laquelle on se sent le plus compétent, etc.; et la langue dite maternelle qui peut en fait être celle du père. Un expert de la recherche sociolinguistique affirme même : « la réalité sous-jacente à la notion de langue maternelle est variable et instable, quand elle n’est pas confuse et sans valeur pratique.[5] » La recherche sociolinguistique invite donc à la prudence dans le traitement de variables en apparence discrètes mais dont les frontières sont en réalité floues. Dans ces conditions, la répartition des multiples pourrait ne faire qu’accroître le flou tout comme, à l’inverse, il est aussi permis de supposer que son utilisation crée des compensations au lieu de cumuls de distorsions. Quoi qu’il en soit, la position la plus sage est sans doute : in dubio, abstine. Et cette abstention, ce refus de répartir les réponses multiples, permettrait de rendre davantage compte de la réalité multilingue québécoise en émergence.

Car la répartition égale des réponses multiples occulte cette réalité multilingue :

[…] [le] multilinguisme, qui semble bien réel dans de nombreux foyers québécois, vient remettre en question les méthodes classiques de mesure des transferts linguistiques […]. Ainsi, selon cette approche [ = la répartition égale des réponses multiples], chaque individu doit avoir une seule langue maternelle alors que près de 100 000 personnes au Québec déclaraient au moins deux langues maternelles en 2001. De même, une seule langue d’usage à la maison doit être retenue pour chacun des individus alors que près d’un million de Québécois déclaraient en 2001 utiliser souvent ou régulièrement deux langues ou plus à la maison. […] à force de transformer les déclarations pour qu’elles se prêtent aux exigences de la construction des indices classiques de transfert linguistique, on en vient à occulter le multilinguisme qui semble caractériser les comportements d’une frange importante de la société québécoise. Du coup, on en vient également à occulter la place qu’occupe la langue française dans ce multilinguisme tel qu’il est pratiqué dans les chaumières québécoises où l’on compte plus de 220 000 personnes qui déclarent utiliser régulièrement le français à la maison, même si cette langue n’est pas celle qu’ils déclarent utiliser le plus souvent.[6]

Cette note méthodologique sur la répartition égale des réponses multiples n’a pas la prétention de régler la question une fois pour toutes. Il s’agit d’un document technique qui devrait retenir l’attention surtout des utilisateurs de données linguistiques. […]

 



[1] En retenant la catégorie « autre autre », on aurait 64 cases (8 x 8). Mais comme ces cas rarissimes sont tous versés aux réponses uniques « autre », la matrice est réduite à 49 cases (7 x 7).

[2] Voir, p.ex., Marc Termote, L’avenir démolinguistique du Québec et de ses régions, Québec, Conseil de la langue française, 1994, p. 14.

[3] Marmen, Louise et Jean-Pierre Corbeil, Nouvelles perspectives canadiennes. Les langues au Canada. Recensement de 2001, Ottawa, Ministère des Travaux publics et Services gouvernementaux Canada,

2004, 163 p.

[4] À cet égard, on se rappellera que le recensement canadien ne pose pas explicitement de question sur la langue maternelle (l’expression n’y figure même pas) mais plutôt sur la première langue apprise et encore comprise. L’habitude s’est toutefois prise d’interpréter cette question comme portant sur la langue maternelle.

[5] William F. Mackey, « Langue maternelle, langue première, langue seconde, langue étrangère », dans : Marie-Louise Moreau, Sociolinguistique. Concepts de base, Sprimont, Mardaga, 1997, p. 184.

[6] Richard Marcoux, Recherches sociographiques 44/2 (2006), p. 396.

1 commentaire:

  1. Merci Jacques. Il est bon de retrouver ici cette préface de plus de 4 pages dans un ouvrage technique d'une centaine de pages. C'est d'autant plus d'actualité que l'on se sert des "réponses multiples" pour "créer" de nouvelles distributions de fréquentes (DF) dont le total dépasse 100%. Il s'est avéré que ces DF sont des "sommes d'occurrences" calculées sur le mauvais dénominateur.

    RépondreSupprimer