
La langue tadjike, langue officielle et nationale du Tadjikistan, est un pilier culturel pour ses locuteurs. Au-delà des frontières du Tadjikistan, elle est parlée dans certaines régions d'Ouzbékistan, du Kazakhstan et du Kirghizistan, ainsi que dans les communautés tadjikes d'Afghanistan et de Chine.
Le tadjik appartient à la branche sud-ouest des langues iraniennes, un sous-groupe de la famille indo-européenne. Il a évolué à partir du vieux persan et de divers dialectes iraniens orientaux qui prévalaient aux IXe et Xe siècles dans le Mawarannahr et le Khorasan. Dans les textes médiévaux du IXe au XIe siècle, la langue était connue sous le nom de « farsi dari », « farsi » ou simplement « dari ». Il sert de fondement historique à trois langues littéraires modernes : le tadjik (au Tadjikistan), le persan (en Iran) et le dari (en Afghanistan).
Le développement de la langue persane dari peut être divisé en trois étapes principales :
Vieux persan (vers IXe siècle av. J.-C. – IVe siècle av. J.-C.) : Cette forme ancienne de persan était utilisée pendant l'Empire achéménide et a été enregistrée à l'aide de l'écriture cunéiforme. Ces inscriptions, trouvées sur des parois rocheuses, des murs et des colonnes, ont été préservées avec une fidélité remarquable et sont d'une valeur inestimable pour la recherche historique.
Moyen-perse (3e siècle av. J.-C. – 7e siècle apr. J.-C.) : Après la chute de l'Empire achéménide et l'essor de l'État sassanide, le moyen-perse est devenu la langue de l'administration, de la littérature et de la religion zoroastrienne. Écrit en écriture pahlavi, il a joué un rôle déterminant dans le développement culturel et littéraire de la région.
Nouveau persan (Dari) (IXe siècle de notre ère à nos jours) : À l’époque islamique, le persan a évolué sous l’influence de l’arabe. Le IXe siècle a marqué le début du persan littéraire, qui a atteint son apogée au Xe siècle sous la domination perse. Les premiers textes persans écrits en écriture arabe remontent à la seconde moitié du IXe siècle, avec des récits historiques de la période détaillant ces premières œuvres littéraires.
La langue « farsi dari » s’est développée sous l’influence des dialectes iraniens orientaux, notamment le sogdien, en particulier dans des villes comme Boukhara, capitale de l’État samanide. Cette influence dialectale a enrichi la langue en y incorporant des caractéristiques de diverses langues iraniennes orientales.
Au cours des IXe et Xe siècles, la langue littéraire persane a évolué, avec des modifications de l'écriture arabe pour mieux correspondre à la phonologie persane. Cette période a vu la langue s'ancrer dans l'usage officiel et littéraire, le dialecte de Boukhara jouant un rôle important dans son développement.
Malgré d'importantes différences dialectales régionales, le persan littéraire médiéval est resté largement uniforme. Par exemple, il était difficile de distinguer les langues littéraires du Mawarannahr et du Khorasan jusqu'au XVIe siècle, car le tadjik et le persan utilisaient une langue littéraire unifiée. Le persan s'est ensuite répandu dans le nord de l'Inde, le Turkestan oriental, le Caucase, la Turquie et le Kurdistan, conservant un cadre lexical et grammatical cohérent dans ces régions.
L'influence de l'arabe a persisté même après la conquête arabe et la propagation de l'islam, laissant une empreinte durable sur le vocabulaire persan et plus tard tadjik. Au XIXe siècle, la langue littéraire a commencé à se rapprocher des dialectes tadjiks, bien que ces changements n'aient pas altéré de manière significative les normes littéraires établies.
Au XXe siècle, la langue persane parlée en Asie centrale a été officiellement rebaptisée tadjik. Ce changement était lié aux évolutions politiques du début des années 20. La République socialiste soviétique du Tadjikistan a été fondée en 1900, accordant au tadjik le statut de langue nationale. La langue a subi plusieurs réformes d'écriture, adoptant d'abord un alphabet latin en 1929, puis passant à un alphabet cyrillique en 1929. L'alphabet cyrillique tadjik actuel comprend 1939 lettres adaptées à la structure phonétique de la langue.
Après l'indépendance du Tadjikistan, la langue tadjike a retrouvé son statut de langue officielle, réaffirmant son importance un millénaire après la chute de l'État samanide. La loi sur la langue de 1994 a officiellement reconnu le tadjik comme langue officielle du Tadjikistan.
Actuellement, le tadjik est parlé dans quatre groupes dialectaux principaux :
Ces dialectes présentent des variations régionales importantes, ce qui rend le tadjik de Samarcande assez différent de celui parlé en Afghanistan.
Grammaticalement, le tadjik est une langue analytique, caractérisée par l'absence de catégories de cas et de genre. Les relations entre les mots s'expriment principalement par des prépositions, des postpositions et l'ordre des mots, l'accord se produisant principalement entre les noms et les verbes.
Le tadjik est également la langue maternelle ou la seule langue de plusieurs groupes ethniques non tadjiks, notamment les Roms d'Asie centrale (« Jugi »), les Juifs de Boukhara et les Arabes d'Asie centrale. Malgré son usage répandu, seuls 8 millions de Tadjiks sur 20 dans le monde maîtrisent cette langue, ce qui reflète une plus grande diversité linguistique au sein de la communauté tadjike.