Roumain : la langue romane de l'Est européen
TABLE OF CONTENTS
Une langue romane qui a grandi dans les Balkans, a conservé ses cas grammaticaux latins et a appris à mettre « le » à la fin de chaque mot.
Classification
Le roumain appartient à la branche italique de la famille des langues indo-européennes, au sein du groupe des langues romanes aux côtés du français, de l’italien, de l’espagnol, du portugais et du catalan. Plus précisément, il forme la sous-famille des langues romanes orientales — un petit ensemble de langues issues du latin parlé dans la province romaine de Dacie et dans la région balkanique environnante.
Les linguistes distinguent généralement quatre variétés historiques des langues romanes orientales :
- Daco-roumain — la langue standard et le sujet de ce guide
- Aroumain — parlé par des communautés en Grèce, Macédoine du Nord, Albanie, Bulgarie, Kosovo et Serbie
- Mégleno-roumain — presque disparu, subsistant dans quelques villages du nord de la Grèce
- Istro-roumain — presque disparu, parlé dans quelques villages d’Istrie, en Croatie
Lorsque la plupart des gens parlent de « roumain », ils font référence au daco-roumain standard, langue officielle de la Roumanie et de la Moldavie.
Où le roumain est parlé
Le roumain compte environ 24 à 26 millions de locuteurs natifs dans le monde, auxquels s’ajoutent plusieurs millions de locuteurs en langue seconde (Wikipedia : Langue roumaine). Il est la langue officielle de deux pays et possède d’importantes communautés diasporiques à travers l’Europe et l’Amérique du Nord.
| Région | Locuteurs natifs (approx.) | Statut officiel |
|---|---|---|
| Roumanie | ~19 millions | Langue officielle unique |
| Moldavie | ~2,5–3 millions | Officielle (renommée de « moldave » en 2023) |
| Italie | ~1 million | Plus grande communauté diasporique |
| Espagne | ~600 000 | Diaspora importante |
| Ukraine (Bucovine, Odessa) | ~400 000 | Minorité régionale reconnue |
| Serbie (Voïvodine) | ~30 000 | Co-officielle en Voïvodine |
| États-Unis, Canada, Allemagne, Royaume-Uni, Israël | Total combiné ~1 million+ | Diaspora |
Le roumain est également une langue officielle de l’Union européenne — l’une des 24 — ce qui garantit la traduction de tous les documents de l’UE en roumain et le droit pour tout citoyen européen de s’adresser aux institutions européennes en roumain.
Le moldave est-il une langue distincte ?
Non — et cela est désormais officiellement tranché. Le 16 mars 2023, le Parlement moldave a adopté une loi renommant la langue d’État de “moldave” à “roumain” dans toute la législation et dans la constitution. La présidente Maia Sandu a promulgué la loi le 22 mars 2023.
Les linguistes ont toujours affirmé que le “moldave” standard et le roumain standard sont identiques — la distinction était une construction politique de l’époque soviétique destinée à souligner une identité moldave séparée. Le langage informel en Moldavie comporte davantage d’emprunts russes et un accent particulier, mais la norme écrite, la grammaire et le lexique sont les mêmes. L’appellation “moldave” subsiste aujourd’hui principalement en Transnistrie, la région séparatiste alignée sur la Russie. En décembre 2025, le parlement ukrainien a également retiré le “moldave” de sa liste des langues minoritaires protégées, le reconnaissant comme roumain.
Dialectes et variantes régionales
Le roumain daco-roumain standard compte cinq principaux sous-dialectes régionaux, tous mutuellement intelligibles :
- Muntenien (sud de la Roumanie, y compris Bucarest) — base de la norme standard
- Moldave (est de la Roumanie et Moldavie) — prononciation plus douce, influence russe plus marquée en Moldavie
- Transylvanien — rythme plus lent, influence allemande et hongroise
- Banat (ouest de la Roumanie) — conserve certains traits archaïques
- Crișana / Maramureș (nord-ouest) — intonations distinctes
Contrairement à l’italien ou à l’allemand, il existe une seule norme écrite utilisée partout, et la télévision, la radio et l’éducation ont considérablement homogénéisé la langue parlée au cours du siècle dernier.

Brève histoire du roumain
La langue roumaine est, en quelque sorte, une survivante linguistique. Alors que les autres langues romanes se sont développées en étroite proximité géographique en Europe occidentale, le roumain a grandi isolé — entouré de locuteurs slaves, hongrois, turcs et grecs, coupé de ses sœurs romanes pendant plus de mille ans. Le résultat est une langue qui semble à la fois profondément latine et indéniablement balkanique.
La Dacie romaine (106–271 ap. J.-C.)
L’histoire commence avec la conquête de la Dacie par l’empereur Trajan en 106 ap. J.-C. — correspondant à la Roumanie moderne au nord du Danube. Les colons, soldats et administrateurs romains ont apporté le latin vulgaire — le latin parlé quotidiennement à la fin de l’Empire — et en quelques générations, il a largement remplacé la langue dace indigène. Bien que Rome se soit officiellement retirée de la province en 271 ap. J.-C. sous l’empereur Aurélien, la population latinophone est restée.
Les siècles obscurs (271–1521 ap. J.-C.)
Pendant plus de mille ans après le retrait de Rome, il ne subsiste pratiquement aucun document écrit de la langue. La région a été successivement envahie ou colonisée par les Goths, les Huns, les Slaves, les Avars, les Bulgares, les Petchénègues, les Coumans et les Mongols. Durant cette période :
- La langue a absorbé une importante couche de vocabulaire slave, notamment dans la religion, l’agriculture et la vie quotidienne.
- Le vieux slavon d’église est devenu la langue de l’administration et de l’Église orthodoxe, et le resta jusqu’au XVIe siècle.
- Le roumain était écrit avec l’alphabet cyrillique, emprunté aux voisins slaves.
Le premier document écrit en roumain qui nous soit parvenu est la Lettre de Neacșu (Scrisoarea lui Neacșu), rédigée en 1521 par un marchand de Câmpulung à l’intention du maire de Brașov, avertissant d’une attaque turque imminente. Elle fut écrite en cyrillique.
Le mouvement de latinisation (1780–1881)
L’histoire moderne du roumain commence avec la Transylvanian School (Școala Ardeleană), un groupe d’érudits grecs-catholiques qui, en 1780, ont publié la première grammaire roumaine — Elementa linguae daco-romanae sive valachicae — par Samuil Micu et Gheorghe Șincai.
Ces érudits ont délibérément repositionné le roumain comme une langue romane issue du latin, en minimisant ses emprunts slaves et grecs. Au cours du siècle suivant, le système d’écriture a progressivement été remplacé du cyrillique à l’alphabet latin, et le lexique s’est enrichi d’emprunts massifs au français, à l’italien et au latin pour « re-latiniser » la langue. L’orthographe actuelle, basée sur le latin, a été pleinement mise en œuvre en 1881 par l’Académie roumaine.
La Moldavie a conservé l’écriture cyrillique sous la domination soviétique et n’a adopté l’alphabet latin qu’en 1989.
Système d’écriture & Prononciation
Le roumain moderne utilise l’alphabet latin avec cinq lettres supplémentaires, soit un total de 31 lettres. L’orthographe est en grande partie phonologique — les mots s’écrivent comme ils se prononcent.
| Lettre | Son | Exemple |
|---|---|---|
| Ă ă | schwa /ə/ — comme le « a » dans « sofa » | măr (« pomme ») |
| Â â | voyelle centrale fermée non arrondie /ɨ/ | câine (« chien ») |
| Î î | son identique à â, mais utilisé en début ou fin de mot | înainte (« avant ») |
| Ș ș | /ʃ/ — comme « ch » dans « chaussure » | șapte (« sept ») |
| Ț ț | /t͡s/ — comme « ts » dans « chats » | țară (« pays ») |
Les lettres K, Q, W et Y sont utilisées uniquement dans les mots étrangers et les noms propres.
Une curiosité historique : â et î représentent le même son. Jusqu’en 1953, seul â était utilisé ; lors de la réforme orthographique communiste, seul î fut employé ; depuis 1993, l’Académie roumaine a rétabli un système mixte — â apparaît à l’intérieur des mots et î aux frontières des mots (început, « début »). La Moldavie n’a pas adopté immédiatement la réforme orthographique roumaine de 1993, et l’usage est resté mixte pendant des années ; les normes officielles et éducatives se sont depuis largement alignées sur l’orthographe roumaine.
Notes de prononciation
Le roumain possède 7 phonèmes vocaliques : /a, e, i, o, u, ə, ɨ/. Les deux derniers — le schwa ă et le central fermé â/î — sont les sons qui distinguent immédiatement le roumain des autres langues romanes, et ceux qui demandent le plus de pratique aux anglophones.
Au-delà des voyelles individuelles, le roumain conserve des diphtongues et triphtongues latines qui ont été simplifiées en espagnol et en français — les combinaisons courantes incluent ea, oa, ie, ia, et même des triphtongues comme eai (beai, « tu buvais »). L’accent tonique peut tomber sur n’importe quelle syllabe et le déplacer peut changer le sens : cópii (« copies ») vs. copíi (« enfants »).
Aperçu de la grammaire
La grammaire roumaine est là où la langue devient vraiment fascinante. C’est à la fois la langue romane la plus archaïque grammaticalement — elle conserve des traits que le français, l’espagnol et l’italien ont depuis longtemps perdus — et une langue balkanique partageant des caractéristiques structurelles avec le bulgare et l’albanais.
Le système des cas
Le roumain est la seule langue romane ayant conservé un système de cas fonctionnel issu du latin. Le roumain moderne possède cinq cas, bien que plusieurs soient fusionnés morphologiquement :
- Nominatif (sujet)
- Accusatif (objet direct) — identique en forme au nominatif
- Génitif (possession)
- Datif (objet indirect) — identique en forme au génitif
- Vocatif (adresse directe) — forme distincte, utilisée pour interpeller quelqu’un
Ainsi, bien qu’il existe cinq cas conceptuellement, il n’y a généralement que trois formes distinctes : nominatif/accusatif, génitif/datatif et vocatif.
Nom féminin singulier "fată" ("fille") :
Nom/Acc : fată / fata (la fille)
Gen/Dat : fete / fetei (de/à la fille)
Vocatif : fato ! (hé, fille !)
L’article défini est un suffixe
C’est la caractéristique la plus surprenante du roumain pour les apprenants issus des langues romanes. Contrairement à l’espagnol la casa, au français la maison ou à l’italien la casa, le roumain attache l’article défini à la fin du nom :
| Anglais | Roumain | Schéma |
|---|---|---|
| une fille | o fată | l’article indéfini précède |
| la fille | fata | suffixe -a |
| un garçon | un băiat | |
| le garçon | băiatul | suffixe -ul |
| une maison | o casă | |
| la maison | casa | suffixe -a |
Cette particularité place le roumain dans le Balkan Sprachbund — un groupe de langues sans lien de parenté (bulgare, albanais, macédonien et roumain) qui partagent des traits structurels en raison de siècles de contact.
Trois genres (y compris le neutre)
Le roumain possède masculin, féminin et neutre — c’est la seule grande langue romane moderne standard à avoir conservé le neutre comme catégorie productive. En roumain, le neutre fonctionne comme un “genre mixte” : les noms neutres se comportent comme masculins au singulier et comme féminins au pluriel.
un scaun → două scaune ("une chaise → deux chaises")
comme masculin comme féminin
Système verbal
Le roumain conjugue les verbes selon la personne, le nombre, le temps, le mode et la voix. Le mode indicatif à lui seul comporte les temps présent, imparfait, parfait simple (littéraire, rare à l’oral), parfait composé, plus-que-parfait et futur. Le mode subjonctif est bien vivant, marqué par la particule să devant le verbe — et il est utilisé bien plus fréquemment qu’en anglais ou même en français.
Vreau să merg. "Je veux aller." (littéralement : "Je veux que j'aille-SUBJ")
Trebuie să plecăm. "Nous devons partir."
Ordre des mots
Comme les autres langues romanes, le roumain suit par défaut l’ordre SVO (sujet-verbe-objet), mais son système de cas lui confère une grande flexibilité pour mettre l’accent sur certains éléments. Les adjectifs suivent généralement le nom (o casă mare, « une grande maison »), bien que certains adjectifs courants puissent le précéder pour insister ou pour un effet poétique.

Vocabulaire & Emprunts
Si l’on analyse le lexique complet du roumain — y compris le vocabulaire technique rare — on trouve environ (PoliLingua) :
- ~75 % d’origine latine (hérité du latin vulgaire ou réemprunté lors de la latinisation du XIXe siècle)
- ~14 % slave (vieux-slave d’église, bulgare, ukrainien, russe)
- ~3 % turc
- ~2 % grec
- ~2 % hongrois
- ~1 % français et autres (emprunts modernes)
Si l’on restreint l’analyse aux 2 500 mots les plus fréquents, la part latine augmente et la part slave diminue — ce qui signifie que le noyau quotidien de la langue est massivement latin, tandis que les mots slaves se concentrent dans les domaines religieux, agricoles et traditionnels.
Quelques exemples d’emprunts :
| Origine | Mot | Sens |
|---|---|---|
| Latin | apă, pâine, carte, lună | eau, pain, livre, lune |
| Slave | prieten, iubire, mulțumesc | ami, amour, merci |
| Turc | cafea, cearșaf, ciorbă | café, drap, soupe aigre |
| Grec | prosop, politicos | serviette, poli |
| Hongrois | oraș, neam | ville, peuple/famille |
| Français | fotoliu, birou, garaj | fauteuil, bureau, garage |
Phrases courantes & Exemple de texte
Un kit de démarrage pour les voyageurs et grands débutants.
Salutations
| Roumain | Anglais | Quand l’utiliser |
|---|---|---|
| Bună! / Salut! | Salut / Bonjour | Informel, avec des amis ou des pairs |
| Bună ziua! | Bonjour / Salut | Formel, avec des inconnus ou des personnes âgées |
| Bună dimineața! | Bonjour | Avant ~11h |
| Bună seara! | Bonsoir | Après la tombée de la nuit |
| Noapte bună! | Bonne nuit | Lorsqu’on se sépare le soir |
| La revedere! | Au revoir | Séparation standard |
| Pa! | Salut ! | Informel |
Phrases de survie
| Roumain | Anglais |
|---|---|
| Mulțumesc. | Merci. |
| Cu plăcere. | De rien. |
| Vă rog. | S’il vous plaît. (formel) |
| Scuze. / Nu vă supărați. | Excusez-moi. / Je suis désolé. |
| Da. / Nu. | Oui. / Non. |
| Nu înțeleg. | Je ne comprends pas. |
| Vorbiți engleză? | Parlez-vous anglais ? |
| Cât costă? | Combien ça coûte ? |
| Unde este toaleta? | Où sont les toilettes ? |
| Mă numesc… | Je m’appelle… |
| Îmi pare bine. | Enchanté. |
| Noroc! | Santé ! / Bonne chance ! |
Les chiffres de 1 à 10
| Chiffre | Roumain | Prononciation |
|---|---|---|
| 1 | unu | /ˈunu/ |
| 2 | doi | /doj/ |
| 3 | trei | /trej/ |
| 4 | patru | /ˈpatru/ |
| 5 | cinci | /tʃintʃʲ/ |
| 6 | șase | /ˈʃase/ |
| 7 | șapte | /ˈʃapte/ |
| 8 | opt | /opt/ |
| 9 | nouă | /ˈnowə/ |
| 10 | zece | /ˈzetʃe/ |
Un texte d’exemple
Un vers du Luceafărul (1883) de Mihai Eminescu, le poème national le plus célèbre de Roumanie :
A fost odată ca-n povești, A fost ca niciodată. Din rude mari împărătești, O prea frumoasă fată.
« Il était une fois, comme dans les contes, / il était comme jamais auparavant, / issue d’une grande lignée royale, / une fille d’une beauté exceptionnelle. »
Le roumain est-il difficile à apprendre ?
Pour les anglophones, non — le roumain fait partie des langues les plus faciles à apprendre. L’U.S. Foreign Service Institute classe le roumain comme une langue de catégorie I, au même titre que l’espagnol, le français, l’italien et le portugais, nécessitant environ 600 à 750 heures de cours pour atteindre un niveau professionnel (Classement FSI de la difficulté des langues). À titre de comparaison, le russe demande environ 1 100 heures, l’arabe ou le japonais environ 2 200 heures.
Ce qui est facile
- Alphabet familier avec seulement 5 lettres supplémentaires
- Orthographe phonétique — la prononciation est en grande partie prévisible à partir de l’écriture
- Vocabulaire latin commun — de nombreux mots académiques et techniques sont facilement reconnaissables (animal, doctor, minut, important, universitate)
- Ordre des mots SVO comme en anglais
- Pas de tons comme en mandarin ou en vietnamien
Ce qui est difficile
- Trois genres grammaticaux dont le neutre, peu courant
- Système de cas avec cinq cas (mais seulement trois formes distinctes)
- Article défini suffixé — une particularité structurelle inhabituelle pour la plupart des apprenants
- Conjugaison des verbes avec de nombreux temps et le subjonctif
- Pluriels irréguliers suivant plusieurs modèles, et non une simple règle en -s/-i
- Les sons ă et â/î demandent un entraînement spécifique pour les anglophones
Le roumain ressemble-t-il à l’italien ?
Grammaticalement, oui — le roumain est la langue la plus proche de l’italien parmi les langues romanes et partage une grande partie de son vocabulaire de base. Un italophone peut souvent deviner le sens de mots roumains sans les avoir étudiés. Cela dit, les déclinaisons, les articles suffixés et les emprunts slaves du roumain resteront des nouveautés, même pour un italien fluent.
Conseils pour apprendre le roumain
Par où commencer
- Maîtrisez d’abord les cinq lettres supplémentaires. Consacrez quelques jours à répéter ă, â, î, ș, ț jusqu’à pouvoir les prononcer à volonté.
- Apprenez tôt l’article défini suffixé. Acceptez que le/la s’attache à la fin du mot. Entraînez-vous avec des paires nom + article (casa, băiatul, cartea) jusqu’à ce que cela devienne automatique.
- Concentrez-vous sur les 1 000 mots les plus fréquents. Utilisez la répétition espacée (Anki, Memrise) et apprenez les noms avec leur genre.
- Ne mémorisez pas les cas — pratiquez-les en contexte. Lisez de courts textes et observez comment les terminaisons changent.
Ressources recommandées
| Ressource | Idéal pour | Remarques |
|---|---|---|
| Pimsleur Romanian | Prononciation, compréhension orale | Leçons uniquement audio, 30 min/jour |
| RomanianPod101 | Débutant à intermédiaire | Leçons audio avec transcriptions PDF |
| italki / Preply | Cours particuliers | Tuteurs natifs à partir de ~$10–20/heure |
| Clozemaster | Vocabulaire intermédiaire | Exercices à compléter dans des phrases |
| Omniglot Romanian | Référence de phrases | Listes de phrases gratuites avec audio |
| LearnRo.com | Leçons gratuites pour débutants | Audio + explications grammaticales |
| r/learnromanian | Communauté | Subreddit actif pour poser des questions |
Calendrier réaliste
Avec 30 à 60 minutes de pratique quotidienne régulière :
- 3 mois — Phrases de survie de base, se présenter, commander à manger
- 6 mois — Tenir de simples conversations, lire de courts articles de presse avec un dictionnaire
- 12 mois — Conversation intermédiaire confortable, regarder la télévision roumaine avec sous-titres
- 2 ans — Maîtrise avancée, lire de la littérature, comprendre le langage familier rapide
Traduction automatique et roumain
Le roumain est l’une des langues à ressources faibles à moyennes les mieux prises en charge dans la traduction automatique moderne, mais il présente encore de vrais défis.
Les défis
Morphologie. Le système casuel du roumain, ses trois genres et la conjugaison verbale multiplient le nombre de formes qu’un seul mot peut prendre. Un nom peut apparaître sous environ six formes de surface (singulier/pluriel × trois groupes de cas) ; un verbe peut avoir plus de 100 formes à travers les temps et les modes. La tokenisation sous-mot dans les modèles neuronaux fragmente souvent ces mots et perd la trace des relations grammaticales.
Richesse idiomatique. Le roumain regorge d’expressions idiomatiques qui, traduites littéralement, n’ont aucun sens : a freca menta (« frotter la menthe » = perdre son temps), te îmbeți cu apă rece (« tu t’enivres avec de l’eau froide » = être naïf), la paștele cailor (« à Pâques des chevaux » = jamais). Les systèmes de traduction entraînés sur des corpus parallèles de presse passent souvent complètement à côté de ces expressions.
Niveaux de formalité. Le roumain distingue tu (le « tu » informel), dumneata (semi-formel) et dumneavoastră (formel). Le choix de la forme a un poids social important, et un moteur de traduction qui se contente d’un seul registre peut produire un texte perçu comme irrespectueux ou excessivement rigide.
Diacritiques. De nombreux textes roumains sur Internet sont écrits sans diacritiques — strazi au lieu de străzi, fata au lieu de față. Cela crée de véritables ambiguïtés (fată « fille » vs. față « visage ») que les systèmes d’IA doivent résoudre grâce au contexte.
Ce qui fonctionne
Les systèmes modernes basés sur les transformeurs gèrent plutôt bien le roumain pour les textes de domaine général. OpenL prend en charge le roumain parmi plus de 100 langues, avec des fonctionnalités adaptées aux langues à morphologie complexe :
- Traduction contextuelle qui gère de façon cohérente le registre (vous formel vs. informel) sur l’ensemble d’un document
- Traduction de PDF, Word et autres documents en préservant la mise en page — un point crucial pour les textes juridiques et académiques roumains où la présentation compte
- Traduction d’images et OCR pour les panneaux de rue, menus et notes manuscrites
- Restauration des diacritiques dans les flux OCR, afin que les textes saisis sans diacritiques soient corrigés avant la traduction
Pour les textes à forts enjeux — contrats juridiques, dossiers médicaux, traduction littéraire — le résultat généré par la machine doit être considéré comme une première ébauche. Une révision humaine reste indispensable, en particulier pour les contenus riches en expressions idiomatiques ou fortement ancrés dans une culture spécifique.
Guides associés :
- Comment traduire un document Word
- Comment traduire des fichiers PDF tout en conservant la mise en forme
- Comment apprendre une nouvelle langue en 30 jours
Sources
- Langue roumaine — Wikipédia — aperçu linguistique et historique complet
- Grammaire roumaine — Wikipédia — système des cas, genres, conjugaisons verbales
- Histoire de la langue roumaine — Wikipédia — de la latinisation dace à la roumaine moderne
- Langue moldave — Wikipédia — le changement de nom en 2023 et contexte politique
- Britannica : Langue roumaine — notions de base et dialectes
- Langues de la Roumanie — Wikipédia — langues minoritaires et statistiques
- Romanian Online : Histoire et caractéristiques — chronologie historique et Lettre de Neacșu
- Optilingo : Tout sur le roumain — alphabet et phonologie
- PoliLingua : Ce qui rend le roumain unique — caractéristiques du Sprachbund balkanique
- Romania Insider, mars 2026 — statistiques actuelles sur l’apprentissage des langues étrangères par les Roumains
- Talkpal : Le roumain est-il difficile pour les anglophones ? — catégorie FSI et analyse de difficulté
- Clozemaster : Meilleures applications pour apprendre le roumain 2026 — recommandations actuelles d’applications d’apprentissage
- Omniglot : Phrases utiles en roumain — tableaux de phrases avec audio
- Culture Trip : 21 phrases essentielles pour la Roumanie — phrases de voyage et contexte culturel
- Language Magazine : La Moldavie adopte le roumain comme langue nationale (2023) — la loi de mars 2023


