mardi 10 octobre 2017

Vous prendrez bien un peu de statistique ?


Le Devoir d’aujourd’hui publie un texte de Charles Castonguay intitulé « Statistique Canada masque le déclin du français. Le texte porte sur les données du dernier recensement du Canada, en particulier sur le traitement qu’on doit réserver aux réponses multiples, c’est-à-dire aux personnes qui déclarent avoir deux ou trois langues maternelles ou deux ou trois langues parlées habituellement à la maison (langues d’usage). L’habitude s’est prise de réparti également entre le français, l’anglais et la catégorie « autres » les réponses multiples : « De 1981 jusqu’en 2011, Statistique Canada a donc réparti de façon égale les réponses doubles et triples aux questions sur les langues maternelle et d’usage. » Mais, ajoute Castonguay, « dans ses calculs pour 2016, Statistique Canada a rompu avec cette façon de faire. Aux déclarations du français comme langue d’usage unique, il a additionné la totalité des réponses multiples comprenant le français. Il a procédé de façon semblable pour la composante de langue d’usage anglaise, ainsi que pour celle de langue d’usage autre. Cependant, les réponses doubles sont alors comptées deux fois, et les triples, trois fois. » Ce qui a effectivement de quoi agacer un mathématicien puisque l’on arrive à des totaux qui dépassent les 100 %.


L’ancienne répartition se trouve en fait à considérer la connaissance et l’usage des langues comme des jeux à somme nulle : ce que gagne une langue, l’autre doit nécessairement le perdre. Dans la nouvelle répartition, les gains ne compensent pas les pertes et vice-versa : les pourcentages s’additionnent et peuvent dépasser les 100 %. Cette manière de faire rend mieux compte du multilinguisme que l’ancienne façon de procéder tendait à réduire (cf. la citation de Richard Marcoux plus bas).


La première méthode donne une image plus impressionnante. À la vue du graphique suivant de Charles Castonguay, on ne peut conclure qu’au déclin du français :
  


La seconde méthode donne un portrait plus idyllique : « on obtient un Québec à 87 % de langue d’usage française, à 19 % de langue d’usage anglaise et à 15 % de langue d’usage autre. Cela s’additionne à 121 %. Puisque les réponses multiples se multiplient à mesure que progressent la diversité linguistique et le plurilinguisme, tous ces pourcentages peuvent d’ailleurs croître en même temps. »


Le danger de cette dernière méthode, c’est qu’elle peut représenter une fausse sécurité pour les défenseurs d’un Québec français. Il est bien possible que le taux de multilinguisme diminue au fil des générations : que les petits-enfants, par exemple, parlent anglais et français mais pas la langue des grands-parents et qu’à la génération suivante, le bilinguisme ne se maintienne pas. D’autant plus que le gouvernement québécois, depuis plusieurs années, n’investit pas suffisamment dans les mesures de francisation.

*   *   *

La question de la répartition des réponses multiples aux questions linguistiques des recensements canadiens a été étudiée par Michel Paillé. Malheureusement, son étude est difficile à trouver, elle est enfouie au troisième sous-sol du site Internet (j’allais écrire : du site archéologique) de l’Office québécois de la langue française. On peut y avoir accès plus facilement en cliquant ici. Voici mon introduction à cette étude; j'y aborde à la fin la répartition des réponses multiples d'un point de vue éthique et sociolinguistique :

Depuis 1983, Statistique Canada publie le nombre de personnes qui ont donné plus d’une réponse à la question sur la « langue maternelle » ainsi qu’à celle portant sur la « langue d'usage » au foyer. Ces « réponses multiples » sont classées en cinq catégories : « français-anglais », « français-autre », « anglais-autre », « français-anglais-autre » ainsi qu’une classe résiduelle regroupant toutes les personnes ayant mentionné au moins deux langues non officielles (« autre-autre… »).
Depuis longtemps les chercheurs ont souvent choisi de répartir également les réponses multiples entre le français, l’anglais et l’ensemble des langues non officielles (ou langues tierces). Ainsi, pour faciliter la description et l’analyse des données, ils ne conservaient que les trois classes linguistiques habituelles.
La présente note méthodologique est une analyse critique de cette façon de procéder, c’est-à-dire qu’elle examine ce qui se produit lorsqu’on procède à la répartition égale des réponses multiples dans un tableau où les langues maternelles sont croisées selon les langues d’usage, procédure qui revient à ramener 49 informations brutes[1] à seulement 9. Cette procédure est notamment utilisée dans l’évaluation de l’importance de la substitution linguistique (on parle aussi de transferts linguistiques ou d’assimilation), un des indicateurs de la situation linguistique.
En marge des travaux confiés à l’Office québécois de la langue française, il est important d’engager des réflexions, voire des remises en question, concernant les méthodes et les instruments d’analyse en vue d’obtenir une description la plus fiable possible de la réalité que l’on cherche à comprendre. Aussi l’Office québécois de la langue française a-t-il demandé à Michel Paillé, démographe connu pour ses nombreuses contributions à la démolinguistique, de déterminer si la répartition des réponses multiples entre le français, l’anglais ou une langue tierce  est justifiée et si les procédures de répartition utilisées sont appropriées. On lui a de plus demandé d’examiner de quelle façon une telle répartition devrait, le cas échéant, être effectuée pour refléter le plus exactement possible la réalité.

Par définition, les réponses multiples sont différentes des réponses uniques et on ne doit pas s’attendre à ce que leur répartition à égalité entre les trois groupes linguistiques (francophones, anglophones, allophones) produise les mêmes effets sur la rétention et la mobilité linguistique qu’une analyse qui serait faite uniquement à partir des réponses uniques. L’auteur, qui a choisi de faire porter son analyse plus spécifiquement sur les substitutions linguistiques, montre que la répartition égale des réponses multiples engendrerait, ou induirait, trois types de substitutions linguistiques : quelques rares substitutions véritables, de nombreuses substitutions fictives (ou modélisées, si l’on préfère) et autant de substitutions partielles transformées artificiellement en substitutions complètes.

Selon l’analyse de Michel Paillé, les substitutions partielles, indûment transformées en substitutions complètes, auraient augmenté de 39 % à 51 % en 20 ans. Mais ses conclusions les plus percutantes touchent ce qu’il appelle les substitutions fictives. La moitié des réponses multiples (les deux cinquièmes depuis 1991) seraient responsables des substitutions linguistiques fictives. Cette façon de faire écraserait par son poids celui des substitutions linguistiques véritables. Pour Michel Paillé, la répartition égale des réponses multiples crée donc une distorsion.

Les analyses de Michel Paillé valident donc l’hypothèse qu’il a émise voulant que les réponses multiples ne sont pas des erreurs systématiques que corrigerait la répartition égale mais qu’au contraire, elles reflètent bien une partie de la réalité linguistique. En effet, tout porte à croire que ces cas reflètent sans doute souvent des situations complexes et transitoires en matière de mobilité linguistique, situations qui s’accommodent mal de la contrainte de la réponse unique à laquelle invitent pourtant les questions linguistiques du recensement[2]. Considérant que les réponses uniques forment la très grande majorité des cas, l’auteur recommande, comme première solution, de calculer les indicateurs linguistiques les plus courants uniquement à partir de cette partie des données de recensement publiées par Statistique Canada, méthode plus simple que celle retenue par Louise Marmen et Jean-Pierre Corbeil[3] et qui arrive sensiblement aux mêmes résultats qu’eux. Car, que l’on analyse dans leur intégrité les substitutions linguistiques complètes et partielles telles qu’elles ont été déclarées ou, au contraire, qu’on simplifie l’analyse de l’assimilation au moyen de la répartition égale, les résultats obtenus en suivant l’une comme l’autre de ces démarches sont tout à fait en harmonie.

À défaut d’étudier les substitutions linguistiques uniquement à partir des réponses uniques, l’auteur propose comme solution de rechange de regrouper les réponses multiples en fonction du français. Dans le cas du Québec, pouvons-nous ajouter. Car, dans celui des autres provinces, on peut penser que le regroupement devrait se faire en fonction de l’anglais. Il faut savoir que, pour son auteur, cette proposition n’est qu’une hypothèse de travail, dont il est conscient de la valeur relative.

Certains pourront hésiter à suivre Michel Paillé dans le regroupement des réponses multiples qu’il propose. Car, dans l’étude de la substitution linguistique, ne serait-il pas préférable de ne prendre en compte que les réponses uniques, ainsi d’ailleurs que l’auteur lui-même le propose comme première solution ? Aux spécialistes de la démolinguistique d’en débattre et de proposer une solution. Mais si on parvenait à s’entendre sur une manière de répartir les réponses multiples, ne perdrait-on pas du coup un lot d’informations intéressantes ?

En outre, la répartition égale des réponses multiples n’est pas sans poser de difficultés du point de vue de l’éthique et de celui de la sociolinguistique.

En effet, d’un point de vue éthique, la répartition des réponses multiples revient à nier l’auto-identification des répondants puisque le chercheur décide de les loger à des enseignes uniques que, dans un geste délibéré, ils ont pourtant refusé de choisir.

D’un point de vue sociolinguistique, répartir également les réponses multiples signifie se priver d’informations sur le multilinguisme, phénomène dont il est de plus en plus important de tenir compte dans le présent contexte de mondialisation. Cette façon de faire est d’autant plus insatisfaisante que la recherche en sociolinguistique a montré que les variables que les études démolinguistiques tiennent pour des variables clé sont liées à des facteurs qui, en fait, ne sont pas stables mais fluides. Pour donner un exemple concret, une catégorie en apparence aussi limpide pour le sens commun que celle de la langue maternelle[4] peut en fait se décliner sous différents aspects : la langue des ancêtres, la première langue qu’on a apprise, la langue à laquelle on s’identifie, la langue à laquelle les autres nous identifient, la langue que l’on utilise le plus souvent, la langue dans laquelle on se sent le plus compétent, etc.; et la langue dite maternelle peut en fait être celle du père. Un expert de la recherche sociolinguistique affirme même : « la réalité sous-jacente à la notion de langue maternelle est variable et instable, quand elle n’est pas confuse et sans valeur pratique.[5] » La recherche sociolinguistique invite donc à la prudence dans le traitement de variables en apparence discrètes mais dont les frontières sont en réalité floues. Dans ces conditions, la répartition des multiples pourrait ne faire qu’accroître le flou tout comme, à l’inverse, il est aussi permis de supposer que son utilisation crée des compensations au lieu de cumuls de distorsions. Quoi qu’il en soit, la position la plus sage est sans doute : in dubio, abstine. Et cette abstention, ce refus de répartir les réponses multiples, permettrait de rendre davantage compte de la réalité multilingue québécoise en émergence.

Car la répartition égale des réponses multiples occulte cette réalité multilingue :

[…] [le] multilinguisme, qui semble bien réel dans de nombreux foyers québécois, vient remettre en question les méthodes classiques de mesure des transferts linguistiques […]. Ainsi, selon cette approche [= la répartition égale des réponses multiples], chaque individu doit avoir une seule langue maternelle alors que près de 100 000 personnes au Québec déclaraient au moins deux langues maternelles en 2001. De même, une seule langue d’usage à la maison doit être retenue pour chacun des individus alors que près d’un million de Québécois déclaraient en 2001 utiliser souvent ou régulièrement deux langues ou plus à la maison. […] à force de transformer les déclarations  pour qu’elles se prêtent aux exigences de la construction des indices classiques de transfert linguistique, on en vient à occulter le multilinguisme qui semble caractériser les comportements d’une frange importante de la société québécoise. Du coup, on en vient également à occulter la place qu’occupe la langue française dans ce multilinguisme tel qu’il est pratiqué dans les chaumières québécoises où l’on compte plus de 220 000 personnes qui déclarent utiliser régulièrement le français à la maison, même si cette langue n’est pas celle qu’ils déclarent utiliser le plus souvent.[6]

Cette étude sur la répartition égale des réponses multiples n’a pas la prétention de régler la question une fois pour toutes. Il s’agit d’un document technique qui devrait retenir l’attention surtout des utilisateurs de données linguistiques. En publiant le présent rapport, l’Office espère susciter un débat scientifique et il souhaite que les démographes, les sociologues, les sociolinguistes ainsi que d’autres personnes intéressées par la description des situations linguistiques y participent de manière positive.

Ce genre de questionnement sur les méthodes nous apparaît essentiel si nous voulons continuer d’offrir aux décideurs et aux citoyens des instruments qui rendent compte de façon fiable de la situation linguistique du Québec et de son évolution.





[1] En retenant la catégorie « autre-autre », on aurait 64 cases (8 x 8). Mais comme ces cas rarissimes sont tous versés aux réponses uniques « autre », la matrice est réduite à 49 cases (7 x 7).
[2] Voir, p.ex., Marc Termote, L’avenir démolinguistique du Québec et de ses régions, Québec, Conseil de la langue française,  1994, p. 14.
[3] Marmen, Louise et Jean-Pierre Corbeil, Nouvelles perspectives canadiennes. Les langues au Canada. Recensement de 2001, Ottawa, Ministère des travaux publics et Services gouvernementaux Canada, 2004, 163 p. Pour une présentation de la méthode utilisée par L. Marmen et J.-P.  Corbeil, voir, dans le présent rapport, l’encadré 3. Notons que les deux méthodes ont quand même pour effet de réduire la réalité multilingue.
[4] À cet égard, on se rappellera que le recensement canadien ne pose pas explicitement de question sur la langue maternelle (l’expression n’y figure même pas) mais plutôt sur la première langue apprise et encore comprise. L’habitude s’est toutefois prise d’interpréter cette question comme portant sur la langue maternelle.
[5] William F. Mackey, « Langue maternelle, langue première, langue seconde, langue étrangère », dans : Marie-Louise Moreau, Sociolinguistique. Concepts de base, Sprimont, Mardaga, 1997, p. 184.
[6] Richard Marcoux, Recherches sociographiques 44/2 (2006), p. 396.

Aucun commentaire:

Enregistrer un commentaire