jeudi 1 juin 2023

Les prénoms pour déterminer l’âge

 

Christer Lauréen (1942-2022)

Je reprends ici un texte publié il y a une vingtaine d’années dans un recueil d’articles (les linguistes disent un recueil de Mélanges, en allemand Festschrift) offert en hommage de la part de ses collègues au professeur Christer Laurén de l’Université de Vaasa (ou Vasa) en Finlande, membre du Conseil de la langue suédoise en Finlande de 1976 à 1985 et son président de 1985 à 1994.

Ce court texte décrit la méthode que j’ai mise au point pour tenter d’estimer l’âge des scripteurs dans mon étude Ciel! Mon français! Analyse linguistique de 4 000 courriels, Québec, Conseil de la langue française, 2003.

*   *   *

Nous avons récemment procédé à l’analyse linguistique d’un corpus de 4 000 courriels, comptant au total plus de 405 000 mots. Ces courriels avaient été envoyés à l’animateur d’une émission de télévision qui s’est terminée en 1999. Nous voulions faire une étude des fautes de français en fonction, entre autres caractéristiques, de l’âge des scripteurs mais seulement 280 correspondants avaient mentionné leur âge dans leur texte. Nous avons donc dû avoir recours à une méthode inédite dans la recherche linguistique et sociolinguistique.

Nous avons d’abord pris la décision de ne retenir que deux classes d’âge : les plus de 35 ans et les moins de 35 ans. Et, lorsque les correspondants ne donnaient pas leur âge, ce qui était le cas pour environ 3 800 des auteurs de courriels, nous les avons placés dans l’une de ces classes à partir de leur prénom.

En effet, la fréquence d’attribution des prénoms obéit à des modes, comme le montre bien la figure qui suit : le prénom Simone, lorsqu’il atteint son sommet de popularité en 1912, est donné à 4 % des filles; trente ans plus tard, Nicole prénomme 5,5 % des filles et Éric est le prénom de 7 % des garçons nés en 1969 et 1970. La popularité des prénoms prend, dans la plupart des cas, l’aspect d’une courbe légèrement asymétrique et dont la croissance est plus rapide que la décroissance.

Fréquence annuelle d’attribution de trois prénoms de 1890 à 2000 au Québec 

Source : Louis Duchesne, Les prénoms. Des plus rares aux plus courants au Québec, Outremont, Trécarré, nouvelle édition, 2001, p. 21



L’attribution d’un âge à partir du prénom se base sur l’étude de Louis Duchesne sur la fréquence des prénoms. Cette étude repose sur un corpus de plus de 3 millions de prénoms donnés au Québec depuis 1890; on y voit très bien que la plupart des prénoms ne sont populaires que pour une période donnée.

Nous avons essayé différentes façons de classer les courriels en deux groupes selon que leurs auteurs avaient moins de ou plus de 35 ans, ce qui revenait à les classer selon qu’ils étaient nés avant ou après 1964. En effet, la plus grande partie des émissions avaient été diffusées en 1999  (1999 – 35 ans = 1964). Il est apparu que la meilleure façon de procéder était d’utiliser le mode du prénom (c’est-à-dire baser le calcul sur l’année où le prénom a été donné au plus grand nombre d’enfants) et d’avoir une marge de 10 ans, c’est-à-dire de ne pas tenir compte des prénoms dont les modes se situent entre 1959 et 1969.

Nous avons vérifié la méthode à partir des quelque 280 courriels dont nous avions l’âge des auteurs. Le taux d’échec (de non-prédiction) en utilisant cette méthode est de 5,4  %.

La méthode que nous avons utilisée a eu pour résultat d’éliminer quelque 800 courriels parce que les années des modes des prénoms de leurs auteurs tombaient dans la marge que nous nous étions donnée (soit entre 1959 et 1969). Or, il est intéressant de noter que, lorsque l’on analyse les fautes de français commises par ce groupe, la moyenne se situe entre celle des plus de 35 ans et celle des moins de 35 ans.

 


Aucun commentaire:

Enregistrer un commentaire