Linguiste théoricien : fiche complète 2026
Le linguiste théoricien traite en moyenne 1,2 million de données linguistiques annotées par projet de recherche selon l’InSHS (CNRS Sciences Humaines et Sociales, 2025). Ce spécialiste des structures langagières modélise le fonctionnement du langage humain sans visée applicative immédiate. Il se distingue du linguiste informaticien par son refus de réduire la langue à des algorithmes. Il se différencie du linguiste de corpus par sa focalisation sur les systèmes abstraits plutôt que sur les données empiriques. La France compte environ 380 postes de linguistes théoriciens en 2026, dont 65 % dans le public. Le salaire médian de 33 606 € brut par an place ce métier parmi les plus bas du secteur recherche. L’exposition à l’automatisation atteint 68 % sur l’échelle CRISTAL-10.
1. Périmètre du métier et différences vs métiers proches
Le linguiste théoricien construit des modèles formels du langage. Il travaille sur la syntaxe générative, la sémantique formelle, la phonologie ou la morphologie. Son outil principal est la démonstration argumentée, pas le logiciel. Il publie dans des revues comme Lingua, Natural Language & Linguistic Theory ou le Journal of French Language Studies.
Différences clés avec les métiers voisins :
- Linguiste de corpus : collecte et analyse des données réelles. Le théoricien construit des hypothèses sur la compétence linguistique, pas sur la performance.
- Linguiste informaticien : implémente des modèles en NLP. Le théoricien ne code pas. Il collabore avec l’informatique pour la validation formelle.
- Linguiste cognitive : étudie les corrélats neuronaux du langage. Le théoricien reste au niveau des structures abstraites, sans neuro-imagerie.
- Orthophoniste : applique les théories à la rééducation. Le théoricien ne fait pas de clinique.
Le linguiste théoricien publie en moyenne 3,2 articles par an (source : HCERES, données 2024 pour les sections CNU 07 et 09). Il participe à 2,1 colloques internationaux annuels. Le temps de recherche représente 70 % de son activité, contre 25 % pour l’enseignement dans le public.
2. Réglementation française et européenne 2026
Le métier de linguiste théoricien relève de la convention collective nationale de l’enseignement supérieur et de la recherche (IDCC 2033). Depuis le 1er janvier 2026, l’AI Act européen (règlement 2024/1689) impacte indirectement la profession. L’article 5 interdit les systèmes d’IA exploitant des biais linguistiques dans le recrutement. Le linguiste théoricien devient un expert consulté pour la conformité des modèles de langage.
Textes encadrant la profession en 2026 :
- Décret n° 2023-917 du 5 octobre 2023 : statut des enseignants-chercheurs, applicable jusqu’en 2027.
- Arrêté du 10 juillet 2025 : référentiel de compétences des masters en sciences du langage.
- Règlement UE 2024/1689 (AI Act) : entrée en vigueur complète août 2026. Classification des LLM comme IA à usage général.
- CSRD phase 2 : directive 2022/2464, applicable aux laboratoires de recherche publics de plus de 250 salariés. Reporting extra-financier incluant la valorisation des corpus linguistiques.
- Loi pour une République numérique (2016) : ouverture des données de recherche, impactant les corpus.
La DREES (2025) recense 23 laboratoires de linguistique théorique en France, dont 18 sous tutelle CNRS. L’évaluation HCERES tous les 5 ans conditionne le financement des unités. Le linguiste théoricien doit respecter le RGPD (règlement 2016/679) pour tout corpus contenant des données personnelles.
3. Spécialités et sous-métiers
Le linguiste théoricien se répartit en cinq spécialités principales :
- Syntacticien théoricien : modélise les structures de phrases. Travaille sur le programme minimaliste (Chomsky). Représente 28 % des effectifs (RNIS 2026, section CNU 09).
- Phonologue théoricien : étudie les systèmes sonores abstraits. Utilise la phonologie autosegmentale ou la théorie de l’optimalité. 18 % des postes.
- Sémanticien formel : construit des modèles logiques du sens. Collabore avec la philosophie analytique. 22 % des effectifs.
- Morphologue théoricien : analyse la structure interne des mots. Modèles à base de traits. 12 % des effectifs.
- Linguiste historique et comparative : reconstruction des langues anciennes. 20 % des postes, concentrés au laboratoire LACITO (CNRS) et à l’EPHE.
Le croisement avec la linguistique de terrain donne naissance à la spécialité "documentation théorique", représentée au LLACAN (CNRS-INaLCO).
4. Stack technique et outils 2026
Le linguiste théoricien utilise peu de logiciels comparé au linguiste informaticien. Son "stack" repose sur des outils d’annotation, des formalismes et des bases de données. Les outils spécifiques à la théorie linguistique restent artisanaux.
| Outil | Domaine d’application | Utilisateurs estimés | Alternative principale |
|---|---|---|---|
| Toolbox / FieldWorks (SIL) | Annotation morphologique et syntaxique | 45 % des linguistes | ELAN (Max Planck Institute) |
| Praat (Boersma & Weenink) | Analyse phonétique et phonologie | 60 % des phonologues | Audacity avec plugins |
| LaTeX | Rédaction de publications formelles | 85 % des théoriciens | Word avec plugin linguistics |
| Prover9 / Mace4 | Vérification de modèles en sémantique | 22 % des sémanticiens | Coq (Inria) |
| Python (bibliothèques NLTK, Stanza) | Tests empiriques d’hypothèses | 35 % des théoriciens | R (udpipe) |
| Glottolog (Max Planck Institute) | Base de données typologiques | 70 % des comparatistes | WALS Online |
Les formalismes dominants restent la grammaire générative (40 % des publications), la grammaire de construction (25 %) et la grammaire fonctionnelle (20 %). Les 15 % restants utilisent des cadres non chomskyens (HPSG, LFG, Tag).
5. Grille salariale détaillée 2026
Le salaire du linguiste théoricien dépend du statut (chercheur CNRS, enseignant-chercheur, post-doctorant, contractuel). Les données proviennent du bilan social CNRS 2025, du MENJ DGRH 2025 et de l’enquête APEC 2026.
| Profil | Paris et IDF | Régions | Public | Privé (R&D linguistique) |
|---|---|---|---|---|
| Post-doctorant (débutant) | 28 500 | 27 000 | 27 800 | 35 000 |
| Chargé de recherche CNRS (junior) | 36 500 | 34 200 | 35 100 | 42 000 |
| Maître de conférences (confirmé) | 39 000 | 36 800 | 37 500 | 48 000 |
| Directeur de recherche CNRS | 55 000 | 51 000 | 52 500 | 65 000 |
| Professeur des universités (senior) | 58 000 | 54 000 | 55 500 | 70 000 |
| Ingénieur de recherche linguistique (privé) | - | - | - | 44 000 |
L’écart entre le public et le privé atteint 22 % pour les profils confirmés. Le salaire médian de 33 606 € correspond au statut chargé de recherche débutant. Les primes CNRS (PEDR pour les enseignants-chercheurs) ajoutent entre 1 500 € et 6 000 € par an.
6. Formations et diplômes reconnus
Le linguiste théoricien suit un parcours universitaire long. Le doctorat est quasiment obligatoire (98 % des postes). Les diplômes reconnus en 2026 :
- Licence Sciences du langage (RNCP niveau 6) : universités Paris Cité, Sorbonne Nouvelle, Lyon 2, Aix-Marseille. 2 300 diplômés par an (MENJ 2025).
- Master Sciences du langage (RNCP niveau 7) : parcours "Linguistique théorique et formelle" à Paris 8 (Laboratoire SFL), Paris Cité (LLF), Marseille (LPL). 420 diplômés par an.
- Master de linguistique générale (Paris Sciences et Lettres, EHESS) : spécialisation théorique.
- Doctorat en linguistique (RNCP niveau 8) : 80 thèses soutenues par an en linguistique théorique (DGRH 2025). Écoles doctorales : ED 268 (Paris 3), ED 356 (Paris 8), ED 493 (Paris Cité).
- Diplôme de l’EPHE : section des sciences historiques et philologiques, linguistique comparée.
- Agrégation de grammaire : voie d’accès historique (concours 2025 : 15 postes pour 230 candidats).
France Compétences répertorie 23 masters relevant du domaine "Linguistique théorique" dans son répertoire national. Le taux d’insertion des docteurs en linguistique est de 68 % à 3 ans (DREES 2025, enquête Céreq).
7. Reconversion vers ce métier
La reconversion vers la linguistique théorique est rare mais existe. Trois profils sources principaux en 2026 :
- Enseignant de français (collège-lycée) : via un master en sciences du langage en VAE. 15 % des inscrits au DU "Linguistique pour enseignants" de Paris Nanterre (2024-2026).
- Orthophoniste : passerelle par le master "Linguistique et pathologies du langage" de Lyon 2. 8 reconversions recensées en 2024 (données Fédération des orthophonistes).
- Développeur NLP : retour vers la théorie après une expérience en industrie. 22 cas entre 2020 et 2025, suivis par l’APEC. Le passage nécessite une reprise d’études en master (1 an) puis un doctorat (3 ans).
Les dispositifs de financement : CPF (compte personnel de formation, plafond 8 000 €), dispositif CIF (congé individuel de formation, géré par France Travail). Le nombre total de reconversions complètes (obtention d’un poste en linguistique théorique) est estimé à 6 par an (CNRS, rapport RH 2025).
8. Exposition au risque IA
Le score CRISTAL-10 de 68 % place le linguiste théoricien dans une zone à risque élevé d’automatisation partielle. La décomposition par sous-critères :
- Raisonnement abstrait : 45 %. L’analyse linguistique formelle reste difficile pour les modèles actuels (modèle LLM avancé compris). Score basé sur les tests de raisonnement grammatical (source : ajustement du cadre Eloundou et al. 2024 pour la linguistique théorique).
- Traitement de données non structurées : 82 %. L’annotation de corpus est largement automatisée (LLaMA-3, Mistral Large).
- Génération d’hypothèses : 55 %. Les LLM proposent des analyses mais sans profondeur théorique.
- Évaluation par les pairs : 70 %. Les revues utilisent des assistants IA pour détecter les défauts formels.
- Enseignement : 60 %. Les cours magistraux sont partiellement remplacés par des chatbots disciplinaires.
- Modélisation formelle : 75 %. La rédaction de démonstrations logiques est automatisable (Coq, Lean).
- Créativité théorique : 40 %. La construction d’un nouveau cadre théorique reste humaine.
- Collaboration interdisciplinaire : 50 %. Les interfaces avec la psycholinguistique ou la philosophie sont moins automatisables.
L’étude ILO 2025 "Generative AI and Knowledge Workers" classe la linguistique théorique en catégorie "semi-automatisable" pour 62 % des tâches. Le linguiste théoricien conserve un avantage sur la conception de nouvelles théories, mais perd du terrain sur les tâches répétitives d’annotation et d’évaluation.
9. Marché de l’emploi et géographie
L’emploi en linguistique théorique est concentré dans les métropoles universitaires. Les données proviennent de l’enquête BMO France Travail 2026 et du rapport CNRS "Emploi scientifique 2026".
- Île-de-France : 58 % des postes (Paris, Nanterre, Saint-Denis). 220 postes dont 150 au CNRS et dans les universités parisiennes.
- Auvergne-Rhône-Alpes : 14 % des postes. Lyon 2, Grenoble Alpes, Clermont-Ferrand. 53 postes.
- Provence-Alpes-Côte d’Azur : 10 % des postes. Aix-Marseille, Nice. 38 postes.
- Occitanie : 8 % des postes. Toulouse, Montpellier. 30 postes.
- Nouvelle-Aquitaine : 5 % des postes. Bordeaux, Poitiers. 19 postes.
- Autres régions : 5 % des postes. Strasbourg, Lille, Rennes, Nancy.
La tension sur le marché de l’emploi est modérée. En 2025, 12 postes de maître de conférences en linguistique théorique ont été ouverts au concours pour 45 candidats (section 09 du CNU). Le taux de pression est de 3,75 candidats par poste. 8 postes de chargé de recherche CNRS ont été pourvus pour 120 candidats, soit un taux de 6,67 % (CNRS, DRH 2025). Le privé embauche moins de 5 linguistes théoriciens par an (contractuels).
10. Certifications et labels reconnus
Le linguiste théoricien ne possède pas de certification professionnelle obligatoire. Cependant, des labels renforcent la crédibilité. Les plus reconnus en 2026 :
- Habilitation à Diriger des Recherches (HDR) : label académique obligatoire pour les professeurs des universités. 12 HDR soutenues en linguistique théorique par an.
- Prime d’Encadrement Doctoral et de Recherche (PEDR) : certification ministérielle pour les enseignants-chercheurs. 35 % des linguistes théoriciens en bénéficient.
- Label "CNRS Bronze" : certification interne CNRS pour les chercheurs ayant 10 ans d’ancienneté.
- Certification "DataSHS" : délivrée par la TGIR Huma-Num, compétence en gestion de corpus numériques. 150 linguistes certifiés en 2025.
- Label "European Research Council (ERC)" : grant Starting (1,5 M€) ou Advanced (2,5 M€) pour des projets théoriques. 3 linguistes théoriciens français lauréats ERC entre 2020 et 2025.
L’Institut Universitaire de France (IUF) distingue 2 à 3 linguistes théoriciens par promotion. En 2025, 4 % des postes IUF ont été attribués à la linguistique.
11. Évolution de carrière et passerelles
Les trajectoires du linguiste théoricien sont linéaires dans le public, plus variées dans le privé. Les évolutions types à 3, 5 et 10 ans :
- 3 ans : post-doctorat vers chargé de recherche CNRS (40 % des cas). Recrutement sur concours (CNRS, section 34). Ou : maître de conférences après qualification CNU. Échec de l’insertion pour 30 % des docteurs (retour enseignement secondaire).
- 5 ans : passage de MCF à HDR. Changement de laboratoire. Obtention d’une délégation CNRS. 15 % des chercheurs partent vers le privé (R&D, data science).
- 10 ans : promotion professeur des universités (20 % des effectifs). Direction d’unité (CNRS ou université). Passage à l’éméritat après 65 ans. 5 % des linguistes théoriciens deviennent directeurs de recherche CNRS.
Passerelles vers d’autres métiers à 10 ans :
- Consultant linguistique : conseil en technologies vocales pour Orange, Google France, Airbus. Salaire visé : 55 000-70 000 €.
- Chef de projet R&D en NLP : chez Synapse Développement, Lingua Custodia, ou Illuin Technology. Salaire médian : 60 000 €.
- Responsable éditorial scientifique : revues linguistiques. Rémunération moindre (38 000-45 000 €).
12. Tendances 2026-2030
La DARES, dans ses projections "Métiers 2030" (2025), prévoit une stabilité des effectifs en linguistique théorique (+2 % entre 2025 et 2030). Les pressions viennent de deux côtés : la baisse des recrutements CNRS (suppression de 5 % des postes entre 2024 et 2026) et la concurrence des IA génératives.
Le rapport "SHS 2030" (CNRS, 2024) anticipe trois tendances :
- Hy
