Le catalan : la plus grande langue sans État d'Europe
TABLE OF CONTENTS
Le catalan était autrefois passible de la peine de mort. Aujourd’hui, il compte plus de locuteurs que le danois, le finnois ou le grec — et en 2026, l’Espagne a déclaré que son statut officiel dans l’UE n’était « qu’une question de temps ».
Classification
Le catalan est une langue romane occidentale située au carrefour de deux branches romanes. Historiquement, il appartient au groupe gallo-roman — son plus proche parent est l’occitan (parlé dans le sud de la France), et non l’espagnol. Mais des siècles de contact avec le castillan l’ont rapproché de l’orbite ibéro-romane, conférant au catalan un profil hybride sans équivalent parmi les langues romanes. Si vous connaissez l’espagnol ou le français, vous reconnaîtrez environ 85 % du vocabulaire catalan — mais les 15 % restants recèlent quelques surprises.
Il descend du latin vulgaire et a commencé à diverger vers le IXe siècle dans les Pyrénées orientales. Le plus ancien texte connu présentant des traits catalans est les Homilies d’Organyà, un recueil de sermons de la fin du XIe ou du début du XIIe siècle.
Le catalan utilise l’alphabet latin standard avec quelques ajouts : l’accent aigu (é, í, ó, ú), l’accent grave (à, è, ò), le tréma (ï, ü) et le point médian (ŀl) — le punt volat — utilisé dans le digramme l·l pour indiquer que les deux L se prononcent séparément (comme dans col·lecció), contrairement au ll palatal.
Où le catalan est-il parlé
Le catalan est parlé par environ 10 millions de personnes dans quatre pays.

Il a un statut officiel en Andorre (où il est la seule langue officielle) et un statut co-officiel dans trois communautés autonomes espagnoles :
| Territoire | Population | Statut |
|---|---|---|
| Catalogne (Espagne) | ~7,7 millions | Co-officiel avec l’espagnol et l’aranais |
| Communauté valencienne (Espagne) | ~5 millions | Co-officiel avec l’espagnol (sous le nom de valencien) |
| Îles Baléares (Espagne) | ~1,2 million | Co-officiel avec l’espagnol |
| Andorre | ~80 000 | Seule langue officielle |
| Catalogne Nord (France) | ~450 000 | Langue minoritaire reconnue uniquement |
| Alghero, Sardaigne (Italie) | ~40 000 | Statut municipal semi-officiel |
| La Franja (Aragon, Espagne) | ~45 000 | Reconnue mais pas officielle |
C’est la 9e langue la plus parlée de l’Union européenne en nombre de locuteurs — devant le suédois, le danois, le finnois et le grec. Pourtant, contrairement à ces langues, elle n’a pas de statut officiel dans l’UE.

La lutte pour le statut officiel
En janvier 2026, le ministre espagnol des Affaires étrangères, José Manuel Albares, a déclaré que faire du catalan une langue officielle de l’UE n’était « qu’une question de temps ». L’Espagne négocie en coulisses avec les États membres sceptiques, liant cette initiative à un accord politique entre le Parti socialiste au pouvoir et le parti indépendantiste catalan Junts.
Les enjeux sont réels : le statut officiel dans l’UE débloquerait des financements pour les technologies linguistiques, intégrerait le catalan dans la plateforme eTranslation de l’UE et soutiendrait l’objectif du gouvernement catalan de créer 600 000 nouveaux locuteurs en cinq ans. En 2025, le Pacte national pour la langue, nouvellement créé, a réservé 140 000 places de cours de catalan pour adultes pour 2026, plus 50 000 places supplémentaires pour les immigrés récemment régularisés.
Au niveau municipal, Barcelone introduit en 2026 une règle exigeant la connaissance du catalan pour renouveler les permis de séjour — une mesure controversée visant à inverser le déclin de l’usage habituel.
Malgré des taux élevés de compréhension passive (plus de 90 % de la population de Catalogne peut parler catalan), seulement 32,6 % l’utilisent habituellement. La langue est décrite par les linguistes comme « minorisée » plutôt que « minoritaire » — toujours en concurrence avec l’espagnol et le français, les langues dominantes sur ses territoires.
Dialectes et variétés
Le catalan se divise en deux principaux blocs dialectaux, une classification établie pour la première fois par le linguiste Manuel Milà i Fontanals en 1861 :
| Catalan oriental | Catalan occidental |
|---|---|
| Catalan central (région de Barcelone) | Catalan nord-occidental |
| Baléare (Majorque, Minorque, Ibiza) | Valencien |
| Septentrional (Roussillon, France) | |
| Alguérois (Sardaigne, Italie) |
L’intercompréhension est très élevée — estimée entre 90 et 95 % entre les variétés. Les principales différences résident dans la réduction vocalique et une poignée d’éléments lexicaux.
La division vocalique
C’est la plus grande différence entre les variétés orientales et occidentales. En position inaccentuée :
| Occidental (valencien, NO) | Majorquin (baléare) | Central/oriental | |
|---|---|---|---|
| /a/ | reste [a] | → [ə] (schwa) | → [ə] |
| /e, ɛ/ | restent [e, ɛ] | → [ə] | → [ə] |
| /o, ɔ/ | restent [o] | reste [o] | → [u] |
| /u/ | reste [u] | reste [u] | reste [u] |
Ainsi, le mot cançó (« chanson ») se prononce [kanˈso] à Valence, [kənˈso] à Majorque et [kənˈsu] à Barcelone. Si vous avez appris un peu d’espagnol, le système occidental vous semblera plus familier — les voyelles restent plus proches de leurs formes accentuées.
Le valencien : une langue, deux noms
Le valencien est la variété parlée par environ un tiers de tous les locuteurs catalans. Il possède sa propre académie de la langue, l’Acadèmia Valenciana de la Llengua (AVL), et maintient une norme écrite distincte aux côtés de la norme de l’Institut d’Estudis Catalans (IEC) utilisée en Catalogne et aux Baléares.
Caractéristiques clés du valencien :
- /r/ final préservé dans tous les contextes — unique parmi les variétés catalanes modernes
- Démonstratifs à trois degrés (este/« ceci », eixe/« cela », aquell/« cela là-bas ») — contrairement au système à deux degrés du catalan central
- Terminaison en -e pour la 1re personne du présent : parle (« je parle ») contre parlo en catalan central
- Vocabulaire caractéristique : espill (miroir), xiquet (garçon), eixir (sortir)
Le baléare : l’article salat
Les îles Baléares possèdent le trait dialectal le plus distinctif du catalan : l’article salat. Au lieu du standard el/la/els/les, les Baléares utilisent es/sa/ets/ses, dérivé du latin ipse (« celui-là même ») plutôt que ille :
| Standard | Baléare | Français |
|---|---|---|
| el llibre | es llibre | le livre |
| la casa | sa casa | la maison |
| els amics | ets amics | les amis |
| les taules | ses taules | les tables |
Le baléare connaît également des cas de /ə/ accentué (schwa), une voyelle qui n’apparaît qu’inaccentuée dans toutes les autres variétés. Là où un Barcelonais dit set [ˈsɛt] (« soif »), un Majorquin dit [ˈsət].
Histoire
L’âge d’or (XIIe–XVe siècles)
L’histoire du catalan commence avec l’expansion de la Couronne d’Aragon. À mesure que les comtes catalans descendaient des Pyrénées vers le sud, conquérant les territoires musulmans, la langue s’est répandue à Valence, aux îles Baléares, puis à travers la Méditerranée jusqu’en Sardaigne, en Sicile et même jusqu’à Athènes.
Au XVe siècle, le catalan était la langue d’un empire méditerranéen. La ville de Valence devint une capitale littéraire et culturelle, produisant des œuvres comme le roman de chevalerie Tirant lo Blanch (1490) — le livre que Miguel de Cervantes qualifiera plus tard de « meilleur livre de son genre au monde ».
La répression avant Franco
L’idée que le catalan n’a été réprimé que sous Franco est une idée reçue courante. En réalité, la pression a commencé des siècles plus tôt :
- 1700 : Louis XIV interdit le catalan en Catalogne Nord, qualifiant son usage de « répugnant et contraire à l’honneur de la nation française ».
- 1714–1716 : Après la guerre de Succession d’Espagne, le roi Philippe V promulgue les décrets de Nueva Planta, abolissant les institutions catalanes et interdisant la langue dans l’administration et l’éducation.
- XIXe siècle : Le catalan est progressivement interdit dans les cimetières (1838), l’affichage commercial (1860), les actes notariés (1862) et le théâtre (1867).
Pourtant, le XIXe siècle a également vu la Renaixença — un mouvement de renaissance culturelle qui a ravivé la littérature catalane, mené par des poètes comme Jacint Verdaguer. Cela a jeté les bases du Modernisme, le mouvement artistique qui a produit Antoni Gaudí et donné à Barcelone son identité architecturale.

Les années Franco (1939–1975) : un linguicide actif
Le régime franquiste représente la période la plus intense de répression linguistique de l’histoire catalane, décrite par les chercheurs comme une tentative de « génocide culturel et identitaire ».
| Domaine | Mesures |
|---|---|
| Gouvernement | Le catalan totalement interdit ; l’espagnol, seul idioma nacional |
| Éducation | L’enseignement en catalan criminalisé ; les élèves punis pour l’avoir parlé |
| Espace public | Toute publicité, signalisation et communication commerciale exigée en espagnol uniquement |
| Médias | Le catalan interdit dans les journaux, la radio, le cinéma |
| Noms personnels | Interdiction pour les parents d’enregistrer leurs enfants avec des noms catalans |
| Édition | Double censure : idéologique et linguistique |
| Sanctions | Amendes, emprisonnement, torture ou exécution pour « infractions » linguistiques |
Une directive policière ordonnait aux citoyens : « Hable el idioma del imperio » — « Parlez la langue de l’empire ». Le catalan était relégué au rang de simple « dialecte », et le parler était assimilé à être un « ennemi de l’Espagne » — même dans la littérature pour enfants.
En 1940, l’ancien président catalan Lluís Companys fut exécuté par un peloton d’exécution au château de Montjuïc à Barcelone. Il reste le seul président européen démocratiquement élu à avoir été exécuté.
Les chercheurs ont caractérisé la politique linguistique franquiste de « linguicide actif » — conçue non seulement pour contrôler l’usage public, mais pour instiller la culpabilité et l’infériorité associées à la pratique du catalan, poussant les locuteurs vers un abandon volontaire.
Résistance et renaissance (1975–aujourd’hui)
Franco est mort en 1975. Avec la transition de l’Espagne vers la démocratie, la Constitution de 1978 a reconnu le pluralisme linguistique et le Statut d’autonomie de 1979 a restauré le statut co-officiel du catalan en Catalogne.
Mais le catalan a survécu à la dictature non pas grâce aux protections juridiques, mais grâce à ce qui s’est passé dans les foyers, autour des tables de cuisine et dans les réunions clandestines. Le mouvement de la Nova Cançó (Nouvelle Chanson) des années 1960 — des auteurs-compositeurs-interprètes comme Lluís Llach et Joan Manuel Serrat — a donné à une génération une bande-son pour la résistance. Des éditeurs clandestins produisaient des traductions catalanes de Shakespeare, malgré le risque d’emprisonnement.
L’écrivain irlandais Colm Tóibín, qui a vécu à Barcelone à la fin de la période franquiste, a saisi l’ambiance : « Le catalan, la langue, était considéré comme une façon d’être libre… les gens considéraient que c’était une manière fondamentale de résister. »
La Generalitat a lancé une série de campagnes de normalisation dans les années 1980, avec des slogans comme « El català, cosa de tots » (« Le catalan, l’affaire de tous ») et « El català: eina de feina » (« Le catalan : un outil de travail »). En désignant le catalan comme la llengua pròpia (« langue propre ») de la Catalogne, le gouvernement lui a accordé la priorité dans l’éducation, l’administration et les médias publics.
Aujourd’hui, le catalan produit 6 000 titres de livres par an (12 % du total espagnol), est diffusé sur plus de 80 chaînes de télévision et plus de 100 stations de radio, et est enseigné dans plus de 150 universités dans le monde, dont 22 au Royaume-Uni et 24 aux États-Unis.
Il y a une ironie frappante dans l’histoire du catalan : interdire la langue a sans doute renforcé son emprise émotionnelle. Un chercheur a observé qu’« interdire une langue peut être un moyen efficace de la préserver » — les locuteurs ressentent l’intrusion autoritaire dans leur culture et résistent avec plus de vigueur. Mais le travail est inachevé. La langue est largement connue mais pas largement utilisée, et la tension entre le succès institutionnel et le déclin quotidien reste le défi central du catalan.
Phonologie
Le système sonore du catalan le distingue de ses voisins ibériques à plusieurs égards.
Les voyelles : sept accentuées, plus le schwa
Là où l’espagnol possède un système simple de cinq voyelles (/a, e, i, o, u/), le catalan distingue sept voyelles accentuées (/a, ɛ, e, i, ɔ, o, u/) — deux de plus que l’espagnol. (Les variétés baléares en ajoutent une huitième : le /ə/ accentué.) Ces distinctions supplémentaires ont une importance sémantique : déu [ˈdew] (« dix ») contre deu [ˈdɛw] (« dieu »), ou ós [ˈos] (« ours ») contre os [ˈɔs] (« os »). Cela confère au catalan une richesse vocalique plus proche de l’italien que de l’espagnol.
Le schwa
La voyelle neutre /ə/ — le même son « euh » à la fin du mot anglais sofa — apparaît partout en catalan oriental comme forme réduite de /a, e, ɛ/ dans les syllabes inaccentuées. Ce son est étranger aux hispanophones, mais vient naturellement aux anglophones. Des mots comme Barcelone se prononcent [bəɾsəˈlonə], et non [baɾθeˈlona].
Le rythme accentuel
L’espagnol est une langue à rythme syllabique — chaque syllabe reçoit une durée à peu près égale. Le catalan, comme l’anglais, est une langue à rythme accentuel — les syllabes inaccentuées sont comprimées entre les temps forts. Cela donne au catalan une sonorité plus proche du portugais ou de l’anglais que du rythme « mitraillette » de l’espagnol.
Les groupes consonantiques et les fricatives voisées
Contrairement à l’espagnol, qui tend à simplifier les groupes de consonnes, le catalan conserve de nombreux groupes consonantiques finaux : serp (« serpent »), trist (« triste »), porc (« cochon »). Cela donne au catalan une texture plus rugueuse, plus riche en consonnes que ses voisins.
Comme l’espagnol, le catalan voise les occlusives entre voyelles (amiga [əˈmiɣə]), mais contrairement à l’espagnol, il possède également des fricatives voisées comme /z/ et /ʒ/ — des sons absents de la plupart des variétés d’espagnol.
Grammaire
Le passé périphrastique : unique dans les langues romanes
Le trait grammatical le plus distinctif du catalan est la façon dont il forme le passé. Seul parmi les langues romanes, le catalan utilise le verbe anar (« aller ») + infinitif pour former un passé — et non un futur :
| Catalan | Français |
|---|---|
| Ahir vaig parlar amb ella. | Hier j’ai parlé avec elle. |
| Vam arribar a les vuit. | Nous sommes arrivés à huit heures. |
| Què vas dir? | Qu’as-tu dit ? |
Toutes les autres langues romanes utilisent « aller » + infinitif pour le futur (français je vais parler, espagnol voy a hablar). Le catalan fait l’inverse. Ce passé périphrastique coexiste avec le passé simple (parlí = je parlai), mais dans le langage courant, la forme avec anar domine.
L’article personnel
Le catalan place un article personnel devant les prénoms — un trait partagé avec certaines variétés de sarde et d’occitan, mais absent de toutes les grandes langues romanes :
| Catalan | Français |
|---|---|
| En Joan arriba demà. | Joan arrive demain. |
| La Maria és metgessa. | Maria est médecin. |
| Na Caterina (baléare) | Caterina |
En (masculin) et la ou na (féminin) précèdent les noms propres dans la plupart des contextes. Les étrangers trouvent souvent cela déroutant — « la Maria » sonne bizarrement en français — mais c’est aussi naturel pour un catalanophone que « Monsieur » ou « Madame » l’est en français.
La construction haver-hi
Pour « il y a », le catalan combine le verbe haver (« avoir ») avec le clitique locatif hi :
- Hi ha tres estudiants a l’aula. — « Il y a trois étudiants dans la salle de classe. »
- Hi havia molta gent. — « Il y avait beaucoup de monde. »
Le hi est obligatoire — * ha tres estudiants est agrammatical. Le même clitique peut apparaître avec d’autres verbes pour marquer le sens existentiel ou locatif : Aquí hi treballen forners (« Il y a des boulangers qui travaillent ici »).
Les pronoms clitiques : empilés et transformés
Les pronoms objets faibles du catalan sont un défi même pour les apprenants expérimentés. Ils s’attachent aux verbes, se combinent entre eux et changent de forme selon leur position :
| Autonome | Avant le verbe | Après le verbe | Signification |
|---|---|---|---|
| el | El veig | Vull veure*‘l*** | Je le vois / Je veux le voir |
| la | La compro | Vaig a comprar*-la*** | Je l’achète / Je vais l’acheter |
| li + el | L’hi dono | — | Je le lui donne |
Ces combinaisons — me’l, te’ls, li’n, l’hi — s’empilent en séquences sans équivalent direct en français. Le placement et la combinaison des pronoms sont systématiquement cités comme la partie la plus difficile de la grammaire catalane pour les apprenants.
Genre et nombre
Les noms catalans sont masculins ou féminins. Contrairement à l’espagnol avec son schéma révélateur en -o/-a, les noms masculins catalans se terminent généralement par une consonne ou -e — un héritage de la perte du -o latin final (verd/verda « vert/verte » contre l’espagnol verde). Les adjectifs doivent s’accorder : un llibre interessant → una idea interessant.
Vocabulaire et emprunts
Le vocabulaire catalan reflète sa position de carrefour linguistique. Le lexique de base est gallo-roman, partagé avec l’occitan : finestra (fenêtre), formatge (fromage), parlar (parler). Mais des couches d’influence l’ont enrichi :
- Arabe (via l’Al-Andalus médiéval) : albergínia (aubergine), sucre (sucre), cotó (coton)
- Français : bricolatge (bricolage), xofer (chauffeur), bistec (bifteck)
- Espagnol : cansar-se (se fatiguer), desayuno → desdejuni, bien que de nombreux castillanismes soient signalés comme des « barbarismes » en catalan formel
- Italien (via le commerce maritime) : piano, macarrons
- Anglais (moderne) : clic, xat, màrqueting
Un détail amusant : le mot paella vient du catalan valencien, où il désignait à l’origine une « poêle à frire » (du latin patella). Le plat et son nom sont sans doute l’exportation mondiale la plus réussie de Catalogne.
Phrases courantes
| Catalan | Prononciation | Français |
|---|---|---|
| Bon dia | [bɔn ˈdi.ə] | Bonjour (matin) |
| Bona tarda | [ˈbɔ.nə ˈtaɾ.ðə] | Bonjour (après-midi) |
| Bona nit | [ˈbɔ.nə ˈnit] | Bonne nuit |
| Com estàs? | [ˈkɔm əsˈtas] | Comment vas-tu ? (informel) |
| Molt bé, gràcies | [ˈmol ˈbe ˈgɾa.si.əs] | Très bien, merci |
| Si us plau | [siwsˈplaw] | S’il vous plaît |
| Gràcies (ou Merci) | [ˈgɾa.si.əs] / [ˈmɛɾ.si] | Merci |
| De res | [də ˈrɛs] | De rien |
| Adéu | [əˈðew] | Au revoir |
| Fins després | [finz dəsˈpɾes] | À plus tard |
| Parles anglès? | [ˈpaɾ.ləz əŋˈglɛs] | Parlez-vous anglais ? |
| Bon profit! | [ˈbɔm pɾuˈfit] | Bon appétit ! |
| Salut! | [səˈlut] | Santé ! / À tes souhaits ! |
Quelques remarques : Merci (du français) s’utilise couramment à côté de gràcies — un vestige des connexions septentrionales de la Catalogne. Bon profit est l’équivalent du français bon appétit — il n’existe pas d’équivalent direct en espagnol, et les Espagnols l’empruntent souvent.
Est-ce difficile à apprendre ?
Pour les francophones, le catalan est l’une des langues les plus faciles à apprendre. Le FSI le classe dans le même niveau général que l’espagnol, le français et l’italien — environ 550 à 600 heures de cours pour atteindre une compétence professionnelle. Des milliers de cognats romans (centre, important, família) sont déjà familiers, l’ordre des mots par défaut correspond au français, et il n’y a pas de système de cas à mémoriser. Le schwa et le rythme accentuel, abordés dans la section Phonologie ci-dessus, semblent plus naturels aux francophones que le rythme syllabique rigide de l’espagnol.
Ce qui le rend plus difficile
| Difficulté | Détails |
|---|---|
| Pronoms clitiques | La partie la plus difficile. Me’l, te’ls, li’n — ceux-ci s’empilent et se transforment. Pas d’équivalent en français. |
| Genre grammatical | Chaque nom est masculin ou féminin ; les adjectifs doivent s’accorder |
| Conjugaisons verbales | Personne, nombre, temps, mode — plus deux temps du passé (périphrastique vs. simple) et le subjonctif |
| Rareté des ressources | Beaucoup moins de manuels, d’applications et de médias que pour l’espagnol ou le français. Duolingo ne propose que le parcours espagnol→catalan, pas français→catalan. |
L’avantage du français
Si vous parlez déjà le français ou une autre langue romane, le catalan devient nettement plus facile — souvent atteignable en 3 à 4 mois au niveau conversationnel. Les deux langues partagent une origine gallo-romane, une syntaxe similaire et des structures grammaticales parallèles.
Mais cette même proximité provoque également un transfert négatif — des habitudes françaises qui produisent des erreurs en catalan. L’interférence se produit à tous les niveaux :
| Ce que les francophones ont tendance à faire | Pourquoi c’est incorrect en catalan |
|---|---|
| Prononcer le e final comme un é français | Le catalan oriental réduit le /a, e, ɛ/ inaccentué en [ə]. Barcelona se prononce [bəɾsəˈlonə], pas [baʁsəlɔna]. |
| Confondre les e et o ouverts et fermés (é vs è, ó vs ò) | Le catalan distingue /e/–/ɛ/ et /o/–/ɔ/. Déu [ˈdew] (« dix ») ≠ deu [ˈdɛw] (« dieu »). |
| Omettre le clitique partitif en : dire Jo vull au lieu de Jo en vull (« J’en veux ») | Le catalan exige en là où le français utilise aussi « en » — mais les contextes diffèrent. Une des erreurs les plus courantes des débutants. |
| Utiliser des gallicismes avec une prononciation catalane | Les vrais mots catalans diffèrent souvent. Ces « barbarismes » sont le signe révélateur d’un francophone écrivant en catalan. |
Les recherches montrent que même les bilingues élevés à Barcelone dont la langue dominante est l’espagnol peuvent ne jamais distinguer pleinement les contrastes de voyelles moyennes du catalan — un phénomène que les linguistes appellent la « surdité fonctionnelle » à la distinction /e/–/ɛ/. Le défi n’est pas d’apprendre de nouvelles règles ; c’est de désapprendre les habitudes de sa langue romane qui sont presque justes mais pas tout à fait.
Conseils pour apprendre le catalan
Commencez par les sons. Concentrez-vous sur le schwa et les contrastes de voyelles ouvertes/fermées dès le début. La prononciation catalane est plus indulgente que l’espagnole à certains égards (le schwa est votre ami), mais les distinctions vocaliques ont une importance sémantique.
Utilisez le pont du français — avec prudence. Si vous connaissez le français, les médias catalans avec sous-titres espagnols sont un moyen efficace d’entrer dans la langue. Restez simplement attentif aux faux amis et aux interférences d’habitudes.
Tournez-vous vers les ressources gratuites de la Generalitat. Le gouvernement catalan a massivement investi dans les outils d’apprentissage des langues. Parla.cat propose des cours en ligne gratuits à plusieurs niveaux. TV3 (télévision publique catalane) diffuse en ligne avec des sous-titres.
Lisez les actualités en catalan. Ara, El Punt Avui et VilaWeb sont des quotidiens d’information. Lire ne serait-ce que 10 minutes par jour enrichit rapidement le vocabulaire.
Apprenez d’abord les expressions toutes faites. Les salutations et formules de politesse catalanes font beaucoup d’effet en Catalogne. Les habitants apprécient sincèrement l’effort — la plupart des visiteurs n’essayent jamais — et passer au catalan, même pour les politesses de base, change la dynamique de toute interaction.
Faites un échange linguistique. Des plateformes comme Tandem et HelloTalk ont des communautés catalanophones actives. Les rencontres d’échange linguistique à Barcelone sont réputées pour être sociales et accueillantes.
Traduction IA et catalan
La relation du catalan avec la traduction automatique raconte l’histoire d’une langue prise entre le succès et la marginalisation.
En février 2026, DeepL a ajouté le catalan à sa plateforme de traduction aux côtés du basque, du galicien et de l’aragonais — une étape majeure qui a reconnu le poids économique et culturel du catalan. La Catalogne représente à elle seule près de 19 % du PIB espagnol.
Le projet AINA, hébergé au Centre de supercalcul de Barcelone, a construit le corpus CATalog : plus de 17,4 milliards de mots répartis sur 34 millions de documents. Son modèle de traduction catalan-espagnol, entraîné sur environ 92 millions de phrases parallèles, surpasse désormais Google Translate en scores BLEU (55,1 contre 53,2) — la preuve que des projets open source bien financés peuvent battre les systèmes commerciaux lorsque les données d’entraînement sont correctement organisées.
Mais la situation du catalan est précaire. En 2026, la plateforme eTranslation de l’Union européenne et la base de données terminologiques IATE excluent toujours le catalan — non pas pour des raisons techniques, mais parce que le catalan n’a pas de statut officiel dans l’UE. Maite Melero, du Centre de supercalcul de Barcelone, le dit sans détour : « Le statut officiel apporterait plus de demande et d’investissements soutenus dans les outils linguistiques pour le catalan. »
Pour les utilisateurs quotidiens, OpenL prend en charge la traduction du catalan pour le texte, les documents et les images — pratique lorsque vous avez besoin de traduire un PDF, une page web ou une conversation vers ou depuis le catalan. Les caractéristiques uniques de la langue — le passé périphrastique, le système de pronoms clitiques, la phonologie riche en schwa — en font un cas test intéressant pour tout moteur de traduction automatique. Les outils s’améliorent rapidement. La question est de savoir si le soutien institutionnel suivra.
Pour en savoir plus sur la traduction avec l’IA, consultez nos guides sur OpenL vs DeepL et les meilleurs traducteurs en ligne gratuits en 2026.
Sources
- Catalan language — Wikipedia — speaker numbers, classification, history
- Catalan dialects — Wikipedia — Valencian, Balearic, and other varieties
- Catalan grammar — Wikipedia — periphrastic past, clitic pronouns, personal article
- History of Catalan — Wikipedia — origins through modern period
- The rebirth of Catalan: how a once-banned language is thriving — The Local — Franco-era suppression and revival
- Catalan could become an official EU language — EuroWeekly News — January 2026 EU status push
- First year of the National Pact for Language — ARA — 2025–2026 language policy in Catalonia
- DeepL adds Catalan — Novobrief — February 2026 DeepL expansion
- AINA Catalan-Spanish Translator — Hugging Face — open-source translation model details
- European AI will not speak Catalan if it is not an official language — ARA — eTranslation exclusion, Maite Melero interview
- Can machine translation really help minority languages in Europe? — UAB — Alvarez Vidal & Koponen (2026) value scenarios study
- Catalan language — Queen Mary University of London — university courses, speaker statistics
- How Long Does It Take to Learn Catalan? — Preply — FSI classification, timelines
- Essential Catalan phrases — Omniglot — common phrases and pronunciation


