Considérations sociolinguistiques sur le traitement des réponses aux questions sur les langues du recensement canadien
Je
reproduis ici la préface que j’ai écrite pour une note de recherche du
démographe Michel Paillé.
Depuis
1983, Statistique Canada publie le nombre de personnes qui ont donné plus d’une
réponse à la question sur la « langue maternelle » ainsi qu’à celle
portant sur la « langue d’usage » au foyer.
Ces
« réponses multiples » sont classées en cinq catégories : « français-anglais »,
« français-autre », « anglais-autre », « français-anglais-autre »
ainsi qu’une classe résiduelle regroupant toutes les personnes ayant mentionné
au moins deux langues non officielles (« autre-autre… »).
Depuis
longtemps les chercheurs ont souvent choisi de répartir également les réponses
multiples entre le français, l’anglais et l’ensemble des langues non
officielles (ou langues tierces). Ainsi, pour faciliter la description et
l’analyse des données, ils ne conservaient que les trois classes linguistiques
habituelles.
La
présente note méthodologique est une analyse critique de cette façon de
procéder, c’est-à-dire qu’elle examine ce qui se produit lorsqu’on procède à la
répartition égale des réponses multiples dans un tableau où les langues
maternelles sont croisées selon les langues d’usage, procédure qui revient à
ramener 49 données brutes[1]
à seulement 9. Cette procédure est notamment utilisée dans l’évaluation de
l’importance de la substitution linguistique (on parle aussi de transferts
linguistiques ou d’assimilation), un des indicateurs de la situation
linguistique.
En
marge des travaux confiés à l’Office québécois de la langue française, il est
important d’engager des réflexions, voire des remises en question, concernant
les méthodes et les instruments d’analyse en vue d’obtenir une description la
plus fiable possible de la réalité que l’on cherche à comprendre. Aussi
l’Office québécois de la langue française a-t-il demandé à Michel Paillé,
démographe connu pour ses nombreuses contributions à la démolinguistique, de
déterminer si la répartition des réponses multiples entre le français,
l’anglais ou une langue tierce est justifiée et si les procédures de
répartition utilisées sont appropriées. On lui a de plus demandé d’examiner de quelle
façon une telle répartition devrait, le cas échéant, être effectuée pour
refléter le plus exactement possible la réalité.
Par
définition, les réponses multiples sont différentes des réponses uniques et on
ne doit pas s’attendre à ce que leur répartition à égalité entre les trois
groupes linguistiques (francophones, anglophones, allophones) produise les
mêmes effets sur la rétention et la mobilité linguistique qu’une analyse qui
serait faite uniquement à partir des réponses uniques. L’auteur, qui a choisi
de faire porter son analyse plus spécifiquement sur les substitutions
linguistiques, montre que la répartition égale des réponses multiples
engendrerait, ou induirait, trois types de substitutions linguistiques :
quelques rares substitutions véritables, de nombreuses substitutions fictives (ou
modélisées, si l’on préfère) et autant de substitutions partielles transformées
artificiellement en substitutions complètes.
Selon
l’analyse de Michel Paillé, les substitutions partielles, indûment transformées
en substitutions complètes, auraient augmenté de 39 % à 51 % en 20
ans. Mais ses conclusions les plus percutantes touchent ce qu’il appelle les
substitutions fictives. La moitié des réponses multiples (les deux cinquièmes
depuis 1991) seraient responsables des substitutions linguistiques fictives.
Cette façon de faire écraserait par son poids celui des substitutions
linguistiques véritables.
Pour
Michel Paillé, la répartition égale des réponses multiples crée donc une
distorsion.
Les
analyses de Michel Paillé valident donc l’hypothèse qu’il a émise voulant que
les réponses multiples ne soient pas des erreurs systématiques que corrigerait
la répartition égale mais qu’au contraire, elles reflètent bien une partie de
la réalité linguistique. En effet, tout porte à croire que ces cas reflètent
sans doute souvent des situations complexes et transitoires en matière de
mobilité linguistique, situations qui s’accommodent mal de la contrainte de la
réponse unique à laquelle invitent pourtant les questions linguistiques du
recensement[2].
Considérant que les réponses uniques forment la très grande majorité des cas,
l’auteur recommande, comme première solution, de calculer les indicateurs
linguistiques les plus courants uniquement à partir de cette partie des données
de recensement publiées par Statistique Canada, méthode plus simple que celle
retenue par Louise Marmen et Jean-Pierre Corbeil[3]
et qui arrive sensiblement aux mêmes résultats qu’eux. Car, que l’on analyse
dans leur intégrité les substitutions linguistiques complètes et partielles
telles qu’elles ont été déclarées ou, au contraire, qu’on simplifie l’analyse de
l’assimilation au moyen de la répartition égale, les résultats obtenus en
suivant l’une comme l’autre de ces démarches sont tout à fait en harmonie.
À
défaut d’étudier les substitutions linguistiques uniquement à partir des
réponses uniques, l’auteur propose comme solution de rechange de regrouper les
réponses multiples en fonction du français. Dans le cas du Québec, pouvons-nous
ajouter. Car, dans celui des autres provinces, on peut penser que le
regroupement devrait se faire en fonction de l’anglais. Il faut savoir que,
pour son auteur, cette proposition n’est qu’une hypothèse de travail, dont il
est conscient de la valeur relative.
Certains
pourront hésiter à suivre Michel Paillé dans le regroupement des réponses
multiples qu’il propose. Car, dans l’étude de la substitution linguistique, ne
serait-il pas préférable de ne prendre en compte que les réponses uniques,
ainsi d’ailleurs que l’auteur lui-même le propose comme première solution ?
Aux spécialistes de la démolinguistique d’en débattre et de proposer une
solution. Mais si on parvenait à s’entendre sur une manière de répartir les
réponses multiples, ne perdrait-on pas du coup un lot d’informations
intéressantes ?
En
outre, la répartition égale des réponses multiples n’est pas sans poser de
difficultés du point de vue de l’éthique et de celui de la sociolinguistique.
En
effet, d’un point de vue éthique, la répartition des réponses multiples revient
à nier l’auto-identification des répondants puisque le chercheur décide de les
loger à des enseignes uniques que, dans un geste délibéré, ils ont pourtant
refusé de choisir.
D’un
point de vue sociolinguistique, répartir également les réponses multiples
signifie se priver d’informations sur le multilinguisme, phénomène dont il est
de plus en plus important de tenir compte dans le présent contexte de
mondialisation. Cette façon de faire est d’autant plus insatisfaisante que la
recherche en sociolinguistique a montré que les variables que les études
démolinguistiques tiennent pour des variables clés sont liées à des facteurs
qui, en fait, ne sont pas stables mais fluides. Pour donner un exemple concret,
une catégorie en apparence aussi limpide pour le sens commun que celle de la langue
maternelle[4]
peut en fait se décliner sous différents aspects : la langue des ancêtres,
la première langue qu’on a apprise, la langue à laquelle on s’identifie, la
langue à laquelle les autres nous identifient, la langue que l’on utilise le
plus souvent, la langue dans laquelle on se sent le plus compétent, etc.; et la
langue dite maternelle qui peut en fait être celle du père. Un expert de la
recherche sociolinguistique affirme même : « la réalité sous-jacente
à la notion de langue maternelle est variable et instable, quand elle n’est pas
confuse et sans valeur pratique.[5] »
La recherche sociolinguistique invite donc à la prudence dans le traitement de
variables en apparence discrètes mais dont les frontières sont en réalité
floues. Dans ces conditions, la répartition des multiples pourrait ne faire
qu’accroître le flou tout comme, à l’inverse, il est aussi permis de supposer
que son utilisation crée des compensations au lieu de cumuls de distorsions.
Quoi qu’il en soit, la position la plus sage est sans doute : in dubio,
abstine. Et cette abstention, ce refus de répartir les réponses multiples,
permettrait de rendre davantage compte de la réalité multilingue québécoise en
émergence.
Car
la répartition égale des réponses multiples occulte cette réalité multilingue :
[…]
[le] multilinguisme, qui semble bien réel dans de nombreux foyers québécois,
vient remettre en question les méthodes classiques de mesure des transferts
linguistiques […]. Ainsi, selon cette approche [ = la répartition égale
des réponses multiples], chaque individu doit avoir une seule langue maternelle
alors que près de 100 000 personnes au Québec déclaraient au moins deux
langues maternelles en 2001. De même, une seule langue d’usage à la maison doit
être retenue pour chacun des individus alors que près d’un million de Québécois
déclaraient en 2001 utiliser souvent ou régulièrement deux langues ou plus à la
maison. […] à force de transformer les déclarations pour qu’elles se prêtent
aux exigences de la construction des indices classiques de transfert
linguistique, on en vient à occulter le multilinguisme qui semble caractériser
les comportements d’une frange importante de la société québécoise. Du coup, on
en vient également à occulter la place qu’occupe la langue française dans ce
multilinguisme tel qu’il est pratiqué dans les chaumières québécoises où l’on
compte plus de 220 000 personnes qui déclarent utiliser régulièrement le
français à la maison, même si cette langue n’est pas celle qu’ils déclarent
utiliser le plus souvent.[6]
Cette
note méthodologique sur la répartition égale des réponses multiples n’a pas la
prétention de régler la question une fois pour toutes. Il s’agit d’un document
technique qui devrait retenir l’attention surtout des utilisateurs de données
linguistiques. […]
[1] En
retenant la catégorie « autre autre », on aurait 64 cases (8 x 8). Mais
comme ces cas rarissimes sont tous versés aux réponses uniques « autre »,
la matrice est réduite à 49 cases (7 x 7).
[2] Voir,
p.ex., Marc Termote, L’avenir démolinguistique du Québec et de ses régions,
Québec, Conseil de la langue française, 1994, p. 14.
[3] Marmen,
Louise et Jean-Pierre Corbeil, Nouvelles perspectives canadiennes. Les
langues au Canada. Recensement de 2001, Ottawa, Ministère des Travaux
publics et Services gouvernementaux Canada,
2004, 163 p.
[4] À
cet égard, on se rappellera que le recensement canadien ne pose pas
explicitement de question sur la langue maternelle (l’expression n’y figure même
pas) mais plutôt sur la première langue apprise et encore comprise. L’habitude
s’est toutefois prise d’interpréter cette question comme portant sur la langue
maternelle.
[5] William
F. Mackey, « Langue maternelle, langue première, langue seconde, langue
étrangère », dans : Marie-Louise Moreau, Sociolinguistique.
Concepts de base, Sprimont, Mardaga, 1997, p. 184.
[6] Richard
Marcoux, Recherches sociographiques 44/2 (2006), p. 396.
Merci Jacques. Il est bon de retrouver ici cette préface de plus de 4 pages dans un ouvrage technique d'une centaine de pages. C'est d'autant plus d'actualité que l'on se sert des "réponses multiples" pour "créer" de nouvelles distributions de fréquentes (DF) dont le total dépasse 100%. Il s'est avéré que ces DF sont des "sommes d'occurrences" calculées sur le mauvais dénominateur.
RépondreSupprimer