Sources et transparence — méthodologie CRISTAL-10 v14.0
Pourquoi cette page existe
MonJobEnDanger.fr est un observatoire indépendant. Son utilité repose entièrement sur une condition : vous devez pouvoir vérifier chaque affirmation, contester chaque score, remonter jusqu’à la donnée brute. C’est pourquoi cette page documente exhaustivement l’ensemble des sources mobilisées par CRISTAL-10 v14.0 — notre modèle d’évaluation de l’exposition à l’automatisation pour 10 001 métiers référencés.
Nous appliquons une philosophie open-data cohérente avec la licence CC BY-SA 4.0 sous laquelle les résultats agrégés sont publiés. Cela signifie que les scores CRISTAL-10 sont réutilisables librement, à condition de citer la source et de conserver la même licence. Les données brutes provenant des institutions publiques conservent leurs propres conditions d’usage, précisées ci-dessous pour chaque source.
CRISTAL-10 n’est pas une boîte noire. Chaque pilier du modèle est pondéré de façon explicite, chaque source est datée, chaque mise à jour est versionnée. Quand une donnée est manquante, nous le disons. Quand une projection est incertaine, nous le signalons. Cette transparence n’est pas un ornement éditorial — c’est la condition sine qua non de la crédibilité d’un observatoire sur un sujet aussi structurant que l’impact de l’IA sur l’emploi.
Pour le détail des formules de pondération et des calculs de score, voir la page méthodologie complète. Pour l’historique des versions et les audits tiers, voir la page transparence.
Sources institutionnelles françaises
Le socle de CRISTAL-10 repose sur les référentiels officiels produits par les institutions publiques françaises. Ces données sont considérées comme la source de vérité pour la dénomination des métiers, leur volume, leur dynamique territoriale et leurs trajectoires à moyen terme.
France Travail (anciennement Pôle emploi)
France Travail est le premier contributeur de données à CRISTAL-10. Nous accédons à ses ressources via l’API officielle api.francetravail.io.
- ROME V4 (Répertoire Opérationnel des Métiers et Emplois) : référentiel de référence pour la classification des 10 001 métiers couverts par notre observatoire.
- BMO 2025 (Besoins en Main-d'Œuvre) : enquête annuelle conduite avec la DARES auprès de 1,9 million d’établissements. Elle alimente le pilier "Réalité marché" (15% de la pondération).
- Statistiques territoriales de l’emploi : données régionales et départementales sur les volumes d’emploi par code ROME.
- Anotea : base d’avis sur les formations professionnelles.
Les données France Travail sont actualisées quotidiennement via un cron automatisé.
INSEE — Institut National de la Statistique et des Études Économiques
L’INSEE (insee.fr) fournit trois ensembles de données structurants :
- PCS 2020 (Professions et Catégories Socioprofessionnelles) : nomenclature officielle française en vigueur depuis 2020.
- Salaires médians par métier : données de rémunération issues des DADS et du dispositif ESANE.
- NAF rév. 2 (Nomenclature d’Activités Française) : codes sectoriels utilisés pour le mapping métiers — secteurs.
DARES — Direction de l’Animation de la Recherche, des Études et des Statistiques
La DARES (dares.travail-emploi.gouv.fr) est la direction statistique du Ministère du Travail. Deux productions alimentent directement CRISTAL-10 :
- Les métiers en 2030 : étude prospective publiée conjointement avec France Stratégie. Constitue la colonne vertébrale du pilier "Prospective 2030" (15% de la pondération).
- BMO 2025 (co-production avec France Travail).
Data.gouv.fr — RNCP
Le Répertoire National des Certifications Professionnelles (RNCP), accessible via data.gouv.fr, est utilisé pour évaluer la densité de l’écosystème de formation associé à chaque métier — entre dans le pilier "Frictions protectrices" (10% de la pondération).
Sources européennes et internationales
ESCO — European Skills, Competences, Qualifications and Occupations
ESCO (esco.ec.europa.eu) est la classification multilingue européenne. Deux dimensions sont mobilisées :
- Mapping ROME — ISCO — O*NET : table de correspondance trilatérale.
- Taxonomie des compétences EU : ontologie de 13 890 compétences.
ILO — Organisation Internationale du Travail
Le document de référence est le Working Paper 140 de Gmyrek, Berg et Bescond (2025), Generative AI and Jobs, publié par le Bureau International du Travail (ilo.org).
OCDE — AI Occupational Exposure Index
L’indice AIOE de l’OCDE, développé par Felten, Raj et Seamans (2021) et mis à jour en 2023, mesure l’exposition de chaque profession aux capacités de l’IA. Données oecd.org.
Études académiques de référence
Eloundou, Manning, Mishkin, Rock (2024)
GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models, OpenAI/Penn/OpenResearch. Étude annotée évaluant l’exposition aux LLM pour 1 000 occupations O*NET. Disponible sur arXiv.
Frey & Osborne (2013, mise à jour 2017)
The Future of Employment, Oxford Martin School. Méthode fondatrice de décomposition par tâches. Disponible sur oxfordmartin.ox.ac.uk.
Acemoglu, Autor, Hazell, Restrepo (2022)
Artificial Intelligence and Jobs: Evidence from Online Vacancies — MIT et Boston University. Travaux disponibles sur economics.mit.edu.
Brynjolfsson & Mitchell — Suitability for Machine Learning Index (SML)
Stanford HAI et Carnegie Mellon. Cadre d’évaluation de la "suitability for machine learning" (SML). Travaux via hai.stanford.edu.
Comment CRISTAL-10 combine ces sources
CRISTAL-10 v14.0 repose sur cinq piliers pondérés, chacun alimenté par un sous-ensemble spécifique des sources documentées ci-dessus :
- Exposition technique (42%) : Eloundou et al. (2024), AIOE OCDE, ESCO.
- Déployabilité (18%) : INSEE NAF, France Travail offres.
- Réalité marché (15%) : BMO 2025 France Travail / DARES.
- Prospective 2030 (15%) : DARES "Les métiers en 2030", ILO WP140.
- Frictions protectrices (10%) : RNCP, réglementation sectorielle.
Pour le détail des formules, des seuils et des transformations appliquées à chaque variable, voir la page méthodologie.
Mises à jour et versioning des données
CRISTAL-10 est un modèle vivant. Plusieurs couches de données sont mises à jour selon des fréquences différentes :
- Données live : statistiques de tension du marché de l’emploi via API France Travail — synchronisation quotidienne automatisée.
- Données annuelles : BMO publié chaque printemps, salaires INSEE annuels.
- Données prospectives : projections DARES 2030 stables sur cycle pluriannuel.
- Versioning du modèle : chaque évolution de pondération donne lieu à un incrément de version. Historique v1.0 à v14.0 sur la page transparence.
Limites et incertitudes assumées
- Les projections ne sont pas des prédictions. Les données DARES 2030 et ILO modélisent des scénarios sous hypothèses définies.
- Le mapping ROME — O*NET est imparfait. Des ajustements manuels ont été appliqués pour 312 fiches ROME sans équivalent O*NET direct.
- L’exposition ne préjuge pas de la transition. Un score CRISTAL-10 élevé signifie que les tâches sont techniquement exposables, pas que les emplois disparaîtront.
- Les biais de données sont déclarés. Le BMO sous-représente travailleurs indépendants et professions libérales.
Pour toute question méthodologique, voir le profil de Samuel Morin.
Citation académique recommandée
Morin, S. (2025). CRISTAL-10 v14.0 — Modèle d’évaluation de l’exposition à l’automatisation pour 10 001 métiers. MonJobEnDanger.fr, Observatoire indépendant impact IA. Licence CC BY-SA 4.0. Disponible sur : https://www.monjobendanger.fr/sources
Pour aller plus loin