Le recensement des langues

Remarque:

En raison de relevés relativement récents et de la quantité des statistiques sur le monde, toutes les données proposées dans le présent site Aménagement des langues dans le monde ont été puisées dans Ethnologue (20e édition de 2017) du Summer Institute of Linguistics du Texas. Une remarque s'impose: les données statistiques conservent leur valeur dans la mesure où elles ne sont considérées que comme des «ordres de grandeur», non comme des données exactes à jour.

Notre planète est souvent comparée à une tour de Babel, avec ses 7100 langues réparties dans plus de 220 pays (ou États). Théoriquement, on compterait donc 30 langues par pays. Mais la réalité est toute autre: quelques rares pays (Barbade, Cuba, Corée du Nord, Corée du Sud, Maldives, Islande, Liechtenstein) n'en comptent qu'une seule, alors que certains autres en dénombrent des dizaines, sinon plusieurs centaines, le cas le plus impressionnant demeurant sans doute l'île de la Nouvelle-Guinée (en Papouasie-Nouvelle-Guinée). De plus, les frontières politiques des États ne coïncident pas toujours avec les frontières linguistiques. C'est ainsi que l'on peut constater à l'intérieur d'un État l'existence de plusieurs langues, alors que certaines autres langues bénéficient d'aires d'expansion considérables et sont parlées bien au-delà des frontières d’un seul État.

1. La densité linguistique

La carte de gauche présente la répartition des langues en fonction de la densité ou du nombre des langues dans une région ou un pays donné: très faible, faible, élevée et très élevée.

Les régions de densité linguistique faible ou très faible (en vert) sont en Amérique le Canada, le Groenland, les États de l'Amérique centrale et des Antilles, la Guyana, le Chili, l'Argentine, la Bolivie, le Paraguay et l'Uruguay, puis toute l'Europe, la Russie, le Kazakhstan, l'Ouzbékistan, le Turkménistan, le Tadjikistan, le Kirghizistan, la Mongolie, le Népal, le Bhoutan, le Cambodge et toute l'Afrique du Nord et le sud de l'Afrique, y compris Madagascar.

Les régions les plus densément riches en nombre de langues (en rouge sur la carte ci-contre) sont le Mexique, le Centre de l'Afrique (Nigeria, Congo-Kinshasa, Côte d'Ivoire, Cameroun, etc.,), l'Éthiopie, la Tanzanie, le Proche-Orient, la Chine, l'Inde, le Sud-Est asiatique, l'Indonésie et la Papouasie-Nouvelle-Guinée. Il faut ajouter aussi l'Australie, et toute la partie septentrionale de l'Amérique du Sud (Brésil, Colombie, "Venezuelas" remplacé par Venezuela, Pérou, etc.).

 

La carte imaginée à gauche («Représentation géographique en fonction de la densité linguistique») par Michael Parkvall et Jacques Leclerc nous montre ce que pourrait être la carte du monde en fonction du nombre des langues par pays.

Les pays le plus importants seraient, dans l'ordre: la Papouasie-Nouvelle-Guinée (885 langues), l'Indonésie (779), le Nigeria (543), la Chine (542), l'Inde (462), le Mexique (330), le Bangladesh (326), le Brésil (309), le Cameroun (293), le Népal (267), les États-Unis (231), le Congo-Kinshasa (229), les Philippines (200), la Malaisie (186), l'Australie (183), la Russie (178), le Soudan (162), la Tanzanie (155). 

Il y a aussi d'autres pays où le nombre des langues est important, car au moins 37 pays comptent plus de 100 langues différentes sur leur territoire. Seuls certains territoires comptent cinq langue langues ou moins: Corée du Nord, Corée du Sud, Sainte-Lucie, Seychelles, Groenland, île de Man, îles Féroé, Saint-Pierre-et-Miquelon, Tuvalu, Saint-Marin, etc. En somme, la norme est le multilinguisme dans la plupart des pays.

Bien que l'on soit parvenu à chiffrer avec une certaine précision la composition linguistique de l'humanité, on ne réussira jamais à déterminer le nombre exact de langues dans le monde.

On peut en effet affirmer que toute donnée statistique concernant cette question est nécessairement approximative. Les causes sont liées avant tout à des problèmes d'ordre terminologique, méthodologique, politique, idéologique, parfois économique.

Le tableau qui suit présente les pays ayant le plus grand nombre de langues sur leur territoire. La palme revient à la Papouasie-Nouvelle-Guinée avec 885 langues, puis à l'Indonésie avec 779 langues. Ensuite vient un "peut" remplacé par petit groupe de pays avec plus de 450 langues: Nigéria remplacé par Nigeria (543), Chine (542) et Inde (462). Dans le groupe des 2000 à 300 langues: le Mexique (330), le Bangladesh (326), le Brésil (309), le Cameroun (293), le Népal (267), les États-Unis (231), le Congo-Kinshasa (229) et les Philippines 200). Enfin, les autres pays comptent entre 155 et 186 langues: la Malaisie (186), l'Australie 183), la Russie (178), le Soudan (162) et la Tanzanie (155).

Rang Pays Population (2017)  Total des langues (150 et +)
1 Papouasie-Nouvelle-Guinée      7 851 000 885
2 Indonésie   260 124 000 779
3 Nigéria   191 620 000 543
4 Chine 1 374 673 000 542
5 Inde 1 330 166 000 462
6 Mexique   129 504 000 330
7 Bangladesh     61 842 000 326
8 Brésil   211 099 000 309
9 Cameroun    24 437 000 293
10 Népal    29 085 000 267
11 États-Unis  325 017 000 231
12 Congo-Kinshasa     82 059 000 229
13 Philippines  103 644 000 200
14 Malaisie     31 130 000 186
15 Australie     24 563 000 183
16 Russie  142 070 000 178
17 Soudan     42 044 000 162
18 Tanzanie     56 791 000 155

2. Les problèmes terminologiques

Il faut souligner d'abord le problème de la distinction des langues parlées par rapport aux langues écrites. Très peu de langues sont écrites dans le monde. On en dénombre tout au plus 200 qui sont écrites sur plus de 7100 langues existantes. Or, il est moins aisé de recenser des langues parlées que des langues écrites. Étant donné que les langues uniquement parlées se diversifient beaucoup plus que les langues écrites, il devient parfois très difficile de les distinguer les unes des autres. Par exemple, les dizaines de variétés d'arabe constituent-elles une langue ou autant de langues, ou des dialectes? Les 3000 idiomes parlés en Inde sont-ils tous des langues ou des dialectes? L'une des difficultés les plus considérables provient justement du sens que l'on donne au mot langue par rapport au mot dialecte.

Au plan strictement linguistique, les dialectes sont des langues, parce qu'ils constituent des codes servant à la communication. Si l'on tient malgré tout à établir une distinction, on pourrait la formuler ainsi: les dialectes sont des formes locales d'une langue, assez particularisées pour être identifiées de façon spécifique, mais dont l'intercompréhension est plus ou moins aisée entre les personnes qui parlent une autre variété de la même langue dans une région proche d'une autre.

Par exemple, entre une langue A et une langue B, si l'intercompréhension est possible malgré les variantes, on parlera de deux variétés dialectales; de même entre les parlers B et C, C et D, E et F, etc. Par contre, si l'intercompréhension se révèle impossible entre les parlers A et F, on parlera de «langues» différentes. Les parlers A et B, pour leur part, sont des «dialectes» différents. Donc, le parler A est considéré comme une «langue» par rapport au parler F, mais comme un «dialecte» par rapport au parler B. Dans la réalité, la ligne de démarcation entre dialecte et langue est bien imprécise en raison des interprétations possibles. Le critère de l'intercompréhension demeure ainsi dans la pratique relativement difficile à appliquer.

C'est pourquoi on a recours à d'autres critères pour distinguer une langue d'un dialecte. Ces critères relèvent davantage de considérations historiques, socio-économiques, politiques et démographiques que linguistiques. Ainsi, un État considérera un parler A comme une «langue», alors que l'État voisin le tiendra pour un «dialecte». On imagine donc sans peine combien il devient malaisé, dans ces conditions, de dénombrer de manière très précise les «langues». Le groupe Ethnologue établit à 41 000 le nombre des langues et dialectes à travers le monde, mais il ne s'agit là que de données approximatives.

Un dernier problème réside dans le sens dépréciatif que l'on donne généralement au mot «dialecte» par rapport au mot «langue». On établit ainsi une hiérarchie entre des termes tels que «langue», «dialecte», «patois», «créole», sans oublier «charabia», «jargon», «sabir», etc. En linguistique, tous ces parlers sont des «langues» puisqu'ils servent à communiquer des messages entre humains. Mais en général les termes «dialecte», «patois» ou «créole» sont connotés socialement comme étant fortement dévalorisés parce qu'ils ne sont pas associés à une «langue». En réalité, une langue qui n'a pas de statut politique sera associés à un «dialecte». Un célèbre maréchal français, Louis-Hubert Lyautey (1854-1934), qui contribua à l'expansion coloniale de son pays, fit un jour la déclaration suivante: «Une langue, c'est un dialecte qui possède une armée, une marine et une aviation.» De fait, on peut dire que les langues sont des dialectes qui ont réussi. Ce genre de distinction n'a rien à voir avec des critères linguistiques.   

3. Les problèmes méthodologiques des recensements

Une autre difficulté provient de la crédibilité ou de la valeur inégale des recensements. Encore aujourd'hui, certains pays n'ont jamais fait de recensement démographique ou encore moins de recensement linguistique, ou n'en ont pas fait depuis 25 ou 30 ans; ils se fondent alors sur des approximations pour établir des statistiques. Il arrive aussi que les recensements ne portent tout simplement jamais sur les langues. Ce sont parfois des motifs d'ordre économique qui incitent des gouvernements à ne pas faire de recensement linguistique.

Dans de nombreux pays, on ne recueille des informations statistiques que sur les langues écrites ou uniquement sur la langue ou les langues officielles. On ignore alors les langues parlées à l'intérieur des frontières, c'est-à-dire celles qui ne jouissent pas d'un statut officiel et qui ne sont qu’orales. Ainsi, au Canada, lors des recensements fédéraux antérieurs à 1981, on ne distinguait pas les langues amérindiennes uniquement parlées; on se contentait d'indiquer «Indien, nord-américain». Même si le Canada se révèle l'un des pays possédant l'une des plus longues expériences en matière de recensement, il n'était pas possible, avant 1981, de savoir exactement combien on y parlait de langues dans ce pays. Or, s'il en est ainsi dans un pays qui possède une longue tradition des recensements, qu’en est-il dans certains autres?

Cet exemple soulève également le problème des questionnaires mal conçus. Plus souvent qu'autrement, les recenseurs éliminent les langues qui ne figurent pas déjà sur leur liste ou forcent les gens à répondre selon une orientation préétablie. Par exemple, on demande aux enquêtés quelle est leur langue maternelle sans penser qu'ils peuvent en avoir deux. On les interroge sur la langue maternelle, alors qu'on devrait les interroger sur la langue parlée à la maison ou au travail. On oublie de leur demander s'ils connaissent une, deux ou plusieurs langues. Il peut arriver que, dans un pays officiellement bilingue, on ne considère comme personne «bilingue» que celle qui parle les deux langues officielles, les autres langues n'étant pas comptabilisées. On comprendra que, dans de telles conditions, les résultats demeurent souvent difficiles à interpréter. Tous ces problèmes d'ordre méthodologique justifieraient à eux seuls les doutes que l'on peut entretenir au sujet des recensements linguistiques, mais il y en a d'autres.

4. Les problèmes politiques

Il faut compter aussi sur les interventions politiques dans les recensements linguistiques. Certains pays aux prises avec plusieurs langues en situation conflictuelle n'ont aucun intérêt à faire de tels recensements. Ils préfèrent les éviter de peur de soulever des controverses. Par exemple, en Belgique, on ne fait plus de recensement linguistique officiel, afin de ne pas attiser les querelles séculaires entre francophones et néerlandophones, les deux principaux groupes linguistiques du pays. Un recensement qui révélerait un taux d'assimilation pour l'un ou l'autre groupe pourrait produire des effets politiques désastreux pour le gouvernement. Et le cas belge n'est pas unique. Pensons à la France l'absence de recensement linguistique officiel témoigne du peu d'intérêt que portent aux langues régionales depuis longtemps les dirigeants français.

Dans d'autres pays, les questionnaires sont faits pour minimiser l'importance des langues minoritaires au profit de la langue majoritaire. En Autriche, les droits linguistiques sont accordés en fonction d'un recensement général des minorités. Par exemple, l'implantation géographique des écoles primaires destinées à la minorité slovène doit être conforme aux données résultant d'un recensement administratif des minorités. Selon les organisations minoritaires (slovènes), les recensements faits jusqu'ici auraient été exploités pour fausser la réalité et entraîner la réduction des droits des minorités. La façon dont seraient faits les recensements amènerait les minorités à ne pas se déclarer «minoritaires», ce qui impliquerait par la suite une double réduction: réduction numérique des minorités et aussi réduction des territoires d'application des droits accordés.

Ces exemples ne constituent que des cas parmi d'autres. Il est certain que de très nombreux pays ont tout intérêt à minimiser ainsi l'importance statistique de leurs minorités pour des raisons idéologiques: la Turquie, l'Algérie, le Vietnam, l'Inde, l’Iran, l’Irak, la Birmanie, l'Indonésie, etc. Bref, il faut comprendre que la publication d'un recensement linguistique peut constituer une menace et un casse-gueule explosif, comme c'est le cas manifeste en Belgique.

5. Les études scientifiques

Pour toutes ces raisons, les données statistiques provenant de chacun des pays demeurent, répétons-le, aléatoires. C'est pourquoi plusieurs chercheurs estiment préférable de recourir à des études scientifiques indépendantes du pouvoir politique. Toutefois, ces études demeurent très difficiles à réaliser et il reste toujours une grande part d'éléments impondérables. Par exemple, les études du Summer Institute of Linguistics du Texas (Dallas), Ethnologue, qui sont parmi les plus fiables du genre, ne sont pas exemptes d'erreurs et d'ambiguïtés. Ainsi, en Biélorussie, le Summer Institut of Linguistics ne fait état que de deux langues: le biélorusse et le ruthène appelé «Rusyn». En réalité, on y parle aussi le russe, l’ukrainien, le polonais, le yiddish, le lituanien, le letton, etc. C'est ce qui explique que les différents relevés n'arrivent pas au même résultat. À titre d'exemple, la classification de Norman MacQuown et Joseph Greenberg établissait en 1955 une liste de 1700 langues en Amérique latine, alors que Bordas Encyclopédie, qui s'appuyait sur ces mêmes sources, n'en rapportait que 1330. De son côté, l'étude du Summer Institute of Linguistics du Texas n'en dénombrait que 938 en 1988, et ce, pour les deux Amériques. Bref, aucune étude scientifique n'arrive aux mêmes résultats d'un pays à l'autre. Néanmoins, ce qui compte ce sont davantage les ordres de grandeur que le nombre exact des langues, lequel demeurera toujours aléatoire.

Dernière mise à jour: 14 mars 2024

Retour à Diversité des langues

Page précédente

 

Langues du monde

Accueil: aménagement linguistique dans le monde