Les langues indo-iraniennes

Les langues indo-iraniennes (indo-aryennes)

Groupe	Langues
Indien	sanskrit* (éteint), assamais, bagri, bengali, bihari, bundeli, c cinghalais, domari, garhawali, goujarati, hindi, hindko, jadgali, kaboutra, kalami, khandesi, kashmiri, khetrani, khowar, kohistani, konkani, lahanda (ou seraiki), marathi, marwari, népali, nuristani, oriya, ourdou, pahari, panjabi, pashai, rajasthani, shina, sindhi, torwali, tsigane (romani), vaghri, etc.
Iranien	avestique* (éteint), aïmak, badeshi, baloutchi, caspien, fars, gourani, hazaragi, kurde, lari, louri, ormouri, ossète, pamir, pachtou, parachi, persan farsi, persan dari, persan tadjik, sarikoli, talysh, tat, wakhi, waneci, etc.

1 L'importance numérique des langues indo-iraniennes

Dans la grande famille indo-européenne, c'est le groupe des langues indo-iraniennes, appelées aussi indo-aryennes, qui constitue l'ensemble le plus important (avant les langues germaniques, romanes et slaves), avec environ 500 ou 600 langues parlées par près de 700 millions de locuteurs.

L'aire linguistique des langues indo-iraniennes s'étend du Kurdistan turc jusqu'au centre de l'Inde, incluant une partie de l'Irak, puis pratiquement tout l'Iran, le Tadjikistan, le Pakistan, l'Afghanistan, le Bengladesh, le Népal et le Sri Lanka.

On divise généralement les langues indo-iraniennes en deux groupes: une branche indienne ou indo-aryenne (avec l'hindi, le bengali, le marathi, le bihari, le gujarati, le panjabi, etc.) et une branche iranienne (avec le persan farsi, le persan dari et le persan tadjik, puis le pachtou, le kurde, le baloutchi, etc.).

Au moins 35 langues indo-iraniennes sont parlées par plus de 10 millions de locuteurs, dont l'hindi (182 millions), le bengali (189 millions), le marathi (65 millions), l'ourdou (54 millions), le pendjabi (30 millions), l'assamais (15 millions), le singhalais (13 millions) et le népali (10 millions). Or, environ 80 langues dans le monde se trouvent dans cette situation.

2 Les origines

Vers le début du deuxième millénaire avant notre ère, les peuples indo-iraniens se séparèrent des autres Indo-Européens restés au sud et à l'ouest de la Russie, et émigrèrent vers l'est pour s’installer en Iran et envahirent le sous-continent jusqu'alors habité par des peuples de souche dravidienne et de souche mounda. C’est sans doute vers l'an 1000 avant notre ère que les langues des peuples indo-iraniens se sont fragmentées entre une branche iranienne et une branche indienne. Les langues iraniennes ont été utilisées du côté de l'Iran et de l'Afghanistan, tandis que les langues indiennes se sont développées dans le nord-ouest de l'Inde, au Bengladesh, au Pakistan, au Népal (népali) et au Sri Lanka (singhalais). Si l’on fait exception du Sri Lanka, toutes les langues du sud de l’Inde appartiennent à la famille dravidienne, alors que les langues du nord font partie des langues indo-européennes.

Les résultats les plus apparents de l’arrivée des Indiens dans le sous-continent furent, pour l’essentiel, les suivants:

1) le refoulement des Dravidiens au sud de la péninsule;
2) le confinement des peuples mounda dans une petite zone du centre-est de l’Inde, où ils sont encore aujourd’hui;
3) la dispersion et l'éclatement de l'ethnie indienne en plusieurs ethnies: Cachmiriens, Sindhis, Hindis, Goudjeratis, Mahrattes, Singhalais, Bengalis, etc. Tel est encore aujourd'hui le peuplement actuel du sous-continent.

Ainsi, à partir du sanscrit (langue commune indienne, identique au latin des Occidentaux) et en passant par l'étape des «prakrits» (les «moyens Indiens» où sont déjà sensibles les différences dialectales bases des futures langues), on est arrivé aux environs de l'an 1000 à la constitution des entités ethnolinguistiques actuelles. La stabilisation ethnolinguistique s'est donc faite en Inde à peu près à la même époque qu'en Europe.

3 La branche indienne (aryenne)

La branche indienne (ou aryenne) est composée de plus de 500 langues pratiquées par plus de 600 millions de locuteurs dans les régions du nord et du centre du sous-continent indien. Elle comprend le sanskrit, une langue disparue au premier millénaire (avant notre ère), et de nombreuses langues modernes qui en sont issues. En Inde, il faut mentionner l’hindi (182 millions), le marathi (65 millions), le bihari (40 millions), le goudjarati (44 millions), le pendjabi (25,7 millions), l’oriya (31 millions), le radjashatni (20 millions), l’assamais (14,6 millions), le bundeli (8 millions), le konkani (2 millions), le pahari (6 millions), le santali (5,8 millions), etc. À ces langues s’ajoutent le sindhi (19,6 milllions) et l'ourdou (54 millions) au Pakistan, le bengali (189 millions) au Bengladesh, le singhalais (13,2 millions) au Sri Lanka et le népali (16 millions) au Népal.

Malgré leurs noms différents, l'hindi et l'ourdou constituent deux variétés dialectales très proches l'une de l'autre, car ils ont déjà constitué la même langue. Aujourd'hui, le vocabulaire hindi tend à dériver principalement du sanskrit, tandis que l'ourdou contient de nombreux mots d'origine persane et arabe. De plus, l'hindi utilise l'alphabet devanâgarî alors que l'ourdou privilégie un alphabet arabe modifié d’influence persane. Enfin, en Inde comme au Pakistan, l'hindi est parlé principalement par les hindous, tandis que l'ourdou est utilisé essentiellement par les musulmans.

Quant au terme d'hindoustani, il désigne le mélange d'ourdou et d'hindi occidental qui s’est développé dans les camps et les marchés autour de Delhi, s’est répandu dans toute l'Inde au cours des XVII^e et XVIII^e siècles et a joué un rôle de langue véhiculaire parmi les différents groupes ethniques de l'Empire mongol. En Inde, il existe deux grands groupes linguistiques: les langues indo-européennes au nord et les langues dravidiennes au sud. Les premières représentent près des trois quarts de la population; les langues dravidiennes, près du quart.

4 La branche iranienne

Les langues iraniennes regroupent essentiellement l’avestique, une langue morte, mais aussi de nombreuses autres plusieurs autres langues (environ une centaine) qui en sont issues: le persan moderne ou farsi (26,5 millions) en Iran, l’afghan ou pachtou (8,1 millions) en Afghanistan, le kurde (6 millions) en Turquie, en Syrie, en Iran et en Irak, le baloutchi (1,6 million) au Pakistan, le tadjik (4,3 millions) au Tadjikistan, ainsi qu’un grand nombre de petites langues en Azerbaïdjan (kurmandji, talysh, tat, etc.). Au total, on estime que les langues iraniennes sont parlées par plus de 60 millions de locuteurs.

5 Le sanskrit

Le sanskrit et l’avestique ou védique (utilisés entre 1500 et 200 avant notre ère) constituent deux variétés dialectales de l'ancienne langue indo-aryenne. Techniquement, ce sont deux langues mortes à l’origine de toutes les langues indo-iraniennes. Toutefois, depuis le début de l'ère chrétienne, le sanskrit a été maintenu en Inde d'une façon plus ou moins artificielle comme la langue littéraire du clergé et des castes cultivées et érudites. Il conserve encore ce rôle aujourd’hui et s'écrit en alphabet devanâgarî. On estime que 200 000 Indiens utilisent ainsi le sanskrit comme langue seconde.

Le sanskrit demeura une langue totalement inconnue des Occidentaux jusqu’au XVIII^e siècle. La première grammaire sanskrite fut publiée en Europe en 1790. La découverte du sanskrit par les Européens conduisit à la fois à l'identification de la famille des langues indo-européennes et, en partie grâce à la méthodologie du grammairien indien Panini, à l'établissement de la linguistique et de la philologie comparées. Au XIX^e siècle, des linguistes allemands se sont rendu compte que, grâce au sanskrit et à l’avestique, des langues comme le grec, le latin, l'allemand et l'anglais, le russe et le polonais, l'arménien, l'albanais, etc., présentaient des éléments communs remarquables. Ces ressemblances ont donné à penser que toutes ces langues avaient une origine également commune. L'Allemand Franz Boop s'était représenté les langues comme des êtres humains dont on pouvait suivre la naissance, la vie et la mort. Selon cette même conception, les langues avaient des «parents»; en ce sens, on parle de «langue mère», de «langues soeurs», de «langues cousines», etc. C'est dans cet esprit que le qualificatif génétique a été appliqué à la linguistique. Aujourd'hui, ce terme est utilisé de plus en plus dans le sens de historique: lorsqu'on recherche des états de langue anciens, il est légitime de penser en termes d'affiliation et de parenté linguistique.

6 La langue tsigane (romani)

Les Tsiganes, appelée aussi Romani, Rom, Bohémiens, etc., forment un peuple indo-européen d’origine indienne. Il s’agit des Kshattriyas qui, venus du nord de l’Inde, sont arrivés en Grèce au IX^e siècle. Puis, au XIII^e siècle, les Rajputs les ont rejoints. Ensemble, ils ont formé la Romani Cel – le peuple tsigane – d'où leur surnom de «Romanichels», mais ils se nomment eux-mêmes Romané Chavé «fils de Ram» (héros de l'épopée indienne Ramanaya).

Comme les Tsiganes n’ont pas d’État propre, ils sont dispersés non seulement à travers l’Europe mais aussi dans toute l'Amérique. Bien qu'il n'existe aucun recensement officiel, on estime que le nombre des Tsiganes serait d'environ 120 millions de personnes dans le monde en comptant ceux de l'Inde; ils habitent sur tous les continents, de l'Argentine à l'Australie en passant par la Sibérie et le Canada. Les estimations disponibles évaluent à près de deux millions leur nombre dans l'Union européenne, avec une forte disparité selon les pays, mais les Tsiganes sont beaucoup plus nombreux dans les anciens pays de l'Est (environ huit millions). L'Europe totaliserait donc 10 millions de Tsiganes, ce qui représenterait 85 % de la population estimée à environ 12 millions, à l'exception de l'Inde où les Tsiganes devraient être de plus de 100 millions. Avant la Seconde Guerre mondiale, on comptait approximativement 25 millions de Tsiganes dispersés à travers toute l'Europe, dont 10 millions seulement se reconnaissaient officiellement comme Tsiganes.

Il est beaucoup plus difficile d'évaluer le nombre des locuteurs de la langue tsigane. En effet, il n'existe pas de statistiques précises à ce sujet, et l'on doit se fier à des approximations. Il en résulte que toute estimation ne peut se révéler que partiale et suspecte. Par exemple, en ne tenant compte que des Tsiganes d'Europe et de l'Amérique, certains linguistes croient que les deux tiers des Tsiganes parleraient encore une forme de leur langue ancestrale, ce qui signifierait huit millions de tsiganophones. Pour sa part, le Summer Institut of Linguistics du Texas évalue le nombre des tsiganophones à 1,5 million de locuteurs. En 1989, l'Union soviétique les estimait à 202 810. Quant à l'Unesco, elle affirmait en 2002 que le tsigane était une langue en danger d'extinction. En somme, on peut croire que la plupart des Tsiganes auraient perdu l’usage de leur langue ancestrale et se seraient assimilés dans leur pays d’accueil.

Quoi qu'il en soit, les tsiganophones habitent surtout la Bosnie-Herzégovine, la Roumanie, la Pologne, la Hongrie, l’Albanie, la Grèce, la Slovaquie, l’Ukraine, le Portugal, l’Espagne, la Norvège, la Suède, la France, les Pays-Bas, l’Italie et l’Allemagne. On distingue le tsigane des Balkans (Pologne), le tsigane des Carpates (République tchèque), le tsigane finnois (Finlande), le tsigane sinté (Serbie), le tsigane gallois (pays de Galles), le tsigane valaque (Roumanie), le tsigane gréco-turc, etc. Si les locuteurs du tsigane sont peu nombreux (environ 1,5 million de locuteurs), les Tsiganes eux-mêmes sont beaucoup plus nombreux, probablement plus de 10 millions.

La langue romani ou tsigane reste l’unique représentante européenne du groupe indo-iranien appartenant à la famille indo-européenne. Le romani a préservé en grande partie l'héritage des langues de l'Inde du Nord, plus particulièrement le hindi et le rajasthani dont il a en commun 60 % du vocabulaire de base. Enfin, le romani ou tsigane est parfois considéré comme appartenant au sous-groupe indien ou même comme une troisième branche indo-iranienne avec comme seule langue le tsigane. Bien que la langue des Tsiganes puise son origine dans le sanskrit et d'autres langues du nord de l'Inde, elle s'est fragmentée en de multiples variétés dialectales enrichies de termes persans, arméniens, grecs, slaves ou roumains; depuis quelques décennies, des racines anglo-saxonnes ont imprégné le vocabulaire moderne, technique et scientifique. Les variétés tsiganes de l'Europe de l'Est ont conservé la grammaire indienne ainsi qu'un bon fonds lexical d'origine sanskrite. Cependant, les variétés tsiganes de l'Ouest se sont créolisés pour devenir l'anglo-romani (anglicisé), le manouche (germanisé), le sinto italien, le calo (hispanisé), etc. De façon générale, les jeunes générations semblent abandonner progressivement la langue ancestrale, ce qui peut être ressentie comme une perte de l'identité tsigane. Depuis quelque temps, la langue a été dotée d'un alphabet et fait l'objet d'une standardisation.

Les langues indo-iraniennes (indo-aryennes)

1 L'importance numérique des langues indo-iraniennes

2 Les origines

3 La branche indienne (aryenne)

4 La branche iranienne

5 Le sanskrit

6 La langue tsigane (romani)

Famille indo-européenne