Aller au contenu principal
FORTEMENT EXPOSÉ · SCORE 79.0%TECH / DIGITAL

Experte Data

Verdict CRISTAL-10 v14.0 : Augment — l’IA assiste, le métier se transforme

Experte Data - métier face à l’IA en 2026
79.0% exposition IAScore CRISTAL-10 v14.0

Chiffres clés 2026

42 000 €Salaire médian / an
543Offres live FT
3 675Intentions BMO 2026

Tension marché : 2.42% postes vacants (39 688 postes secteur DARES).

Source : France Travail / DARES BMO 2026 / INSEE TIC 2025. Données pack mises à jour 15 mars 2026.

Impact IA sur le métier

Automatisable par l’IA

  • Modéliser une base de données
  • Déployer, intégrer un logiciel, un système d’informations, une application
  • Recueillir et analyser les besoins client
  • Mobiliser une vision stratégique et d’anticipation
  • Collaborer dans un groupe pour réaliser un projet

Reste humain

  • Animer une démarche agile et innovante
  • Piloter des opérations de tests informatiques
  • Possibilité de télétravail
  • Travail selon un rythme irrégulier et des pics d’activité
  • Salarié secteur privé (CDI, CDD)

Compétences clés

Système d’exploitation LinuxModélisation informatiqueSystèmes d’information de gestionIntelligence artificielleJavaAnglais techniqueBusiness Intelligence (BI) - Informatique décisionnelleProgrammation en PythonAccompagner l’appropriation d’un outil par ses utilisateursAnalyser, exploiter, structurer des donnéesCréer, élaborer et identifier des concepts innovantsApporter une assistance technique aux équipesDéterminer des mesures correctivesMettre en place des solutions d’amélioration de la performanceExpliquer et faire respecter les règles et procéduresRendre compte de son activité

20 compétences ROME. Source : France Travail.

Carrière et formation

Formations RNCP

5 fiches disponibles. Top 4 :

  • RNCP35353 — Qualité, Logistique Industrielle et Organisation : Management de la tr (Niveau 6)
  • RNCP35401 — Science des données : exploration et modélisation statistique (Niveau 6)
  • RNCP35402 — Science des données : visualisation, conception d’outils décisionnels (Niveau 6)
  • RNCP35408 — Génie Électrique et Informatique Industrielle : Automatisme et Informa (Niveau 6)

Reconversion & CPF

  • 4 paths de reconversion disponibles →
  • Durée moyenne formation : 36 mois
  • 15 formations CPF éligibles
  • Top organismes : DAWAN, YYYOURS FORMATIONS 78, AFPA ENTREPRISES
  • Financement CPF + Pôle Emploi possibles

Salaire détaillé

Voir grille junior/médiane/senior + méthodologie
NiveauMédian estiméP90 estiméBase
Junior (0-2 ans)29 399 €33 808 €0.70 × médian
Médian (3-7 ans)42 000 €48 299 €DARES+INSEE
Senior (8+ ans)52 500 €56 700 €1.25 × médian

Méthodologie : Médian = données DARES/INSEE salaires bruts annuels 2024-2025 pour le code ROME associé. Junior/Senior = extrapolations ratios standards (0.70x / 1.25x). P90 = niveau atteint par 10 % des supérieurs de la catégorie. Pour précision par expérience/secteur/région : consulter Michael Page, Robert Half, Talent.com.

Tendances 2026-2030

2026
3 675 intentions de recrutement (BMO France Travail).
2027
Eurobarometer : 21% des Français utilisent l’IA au travail, 49% craignent pour leur emploi.
2028
BPI France : 20% des PME adoptent IA générative, 35% planifient sous 12 mois.
2029
INSEE TIC : 13% du secteur adopte IA (vs 8% moyenne France).
2030
L’experte data automatise les pipelines de traitement grâce à l’IA, mais l’interprétation des anomalies métier, la gouvernance des données et la communication des insights restent de sa compétence.

Freins adoption IA (BPI France 2024) : 42% citent le manque de compétences, 38% citent les coûts.

Questions fréquentes & sources

L’IA va-t-elle remplacer ce métier ?
Non. Avec environ 79.0% des tâches exposées, le métier se réorganise autour de ce que la machine ne couvre pas : le jugement, la validation et la relation humaine.
Quel salaire pour Experte Data en 2026 ?
Médian estimé : 42 000 €/an brut. Source : France Travail (DARES et INSEE).
Quelle formation pour devenir experte data ?
5 fiches RNCP disponibles (code ROME M1811). CPF + Pôle Emploi finançables. Voir la section Carrière ci-dessus.

Sources officielles

Metiers proches face a l IA

Analyse approfondie

Le data quality analyst occupe une position centrale dans toute organisation qui dépend de données fiables pour décider, se conformer et automatiser. Son rôle n’est pas cosmétique : une donnée incorrecte dans un reporting bancaire peut déclencher une pénalité BCBS 239. Une adresse client erronée dans un CRM peut coûter un contrat. Ce métier est à la jonction de la technique, de la gouvernance et du business.

Data quality analyst, data steward et data engineer : trois rôles distincts

La confusion entre ces trois fonctions est fréquente dans les offres d’emploi françaises. Les frontières sont pourtant nettes.

Le data quality analyst mesure, surveille et corrige la qualité des données existantes. Il définit des règles de validation, détecte les anomalies et produit des tableaux de bord de santé data. Il travaille sur des données en production.

Le data steward est responsable de la définition métier des données. Il gère les glossaires, les règles de nommage et les politiques d’usage. Il répond à la question « que signifie ce champ ? » et non « ce champ est-il correct ? »

Le data engineer construit les pipelines. Il ingère, transforme et charge les données. La qualité l’intéresse au niveau de l’infrastructure, pas de la sémantique métier.

En pratique, le data quality analyst collabore avec les deux. Il dépend du data engineer pour corriger les sources en amont. Il s’appuie sur le data steward pour définir ce que « correct » veut dire pour chaque entité métier.

Dans les organisations matures, un data quality lead chapeaute ces trois fonctions et rend compte au Chief Data Officer.

Les six dimensions de la qualité des données selon DAMA-DMBOK

Le DAMA-DMBOK, référence mondiale de la gestion des données, identifie six dimensions fondamentales. Chaque dimension fait l’objet de métriques précises dans un programme DQ sérieux.

Dimension Définition Exemple de règle
Complétude Proportion de valeurs non nulles sur les champs obligatoires Le champ SIRET doit être renseigné à 100 % sur les clients B2B
Exactitude Conformité des valeurs à la réalité ou à une source de référence L’adresse postale est validée contre la base INSEE
Cohérence Absence de contradiction entre systèmes ou au sein d’une même table La date de fin de contrat est postérieure à la date de début
Fraîcheur (timeliness) Délai entre l’événement réel et la mise à jour en base Les cours boursiers sont mis à jour en moins de 15 secondes
Unicité Absence de doublons sur les entités clés Un client n’a qu’un seul identifiant actif dans le CRM
Validité Conformité aux formats, plages et référentiels attendus Un code postal français contient exactement 5 chiffres

La norme ISO 8000 complète ce cadre. Elle fournit des spécifications formelles pour la qualité des données de produits et des données maîtres. Elle est particulièrement utilisée dans l’industrie manufacturière et la supply chain.

Un programme DQ efficace instrumente ces six dimensions via des sondes automatisées. Les seuils d’alerte sont fixés par domaine métier, pas de façon générique.

Stack technique 2026 : Soda, Great Expectations, dbt tests, Monte Carlo

L’outillage du data quality analyst a profondément évolué entre 2022 et 2026. Les solutions monolithiques ont cédé la place à un écosystème modulaire centré sur l’observabilité des données.

Soda Core et Soda Cloud permettent de définir des checks YAML directement dans le pipeline. Soda Core est open source et s’intègre à Airflow, dbt et les plateformes cloud natives. Soda Cloud ajoute un plan de monitoring centralisé avec alertes et traçabilité des incidents.

Great Expectations (GX) repose sur le concept d’Expectation Suite. On définit des attentes sur chaque dataset, GX les exécute et produit des Data Docs navigables. La version 1.x introduit les Validation Definitions et les Checkpoints pour une meilleure intégration CI/CD.

dbt tests est devenu le standard minimal dans les équipes analytics. Les tests natifs couvrent not_null, unique, accepted_values et relationships. Le package dbt-expectations étend ces capacités avec des tests statistiques inspirés de GX.

Monte Carlo est la référence de la data observability automatisée. Il détecte les anomalies volumétriques, les dérives de schéma et les ruptures de fraîcheur sans règles prédéfinies. Son ML de détection d’anomalies surveille les tables critiques en continu.

Bigeye propose une approche similaire à Monte Carlo avec un focus sur les métriques statistiques (distribution, cardinalité, corrélations). Il s’intègre nativement à Snowflake, BigQuery et Databricks.

Ataccama ONE et Collibra DQ complètent cet écosystème côté enterprise. Talend Data Quality reste présent dans les environnements on-premise. Alation intervient sur la couche catalogue et lignage, en aval du profiling.

MDM (Master Data Management) : Informatica, Reltio, Profisee

Le Master Data Management est le domaine adjacent au data quality le plus stratégique. Il s’agit de créer un référentiel unique et fiable pour les entités clés de l’entreprise : clients, fournisseurs, produits, salariés, sites géographiques.

Le data quality analyst intervient en amont du MDM pour nettoyer les données avant leur consolidation. Il intervient aussi en aval pour monitorer la qualité du Golden Record produit par la plateforme MDM.

Informatica MDM (anciennement Siperian) est la solution la plus déployée dans les grandes entreprises françaises. Elle gère les flux de matching, de merge et de survivorship sur des volumes de plusieurs centaines de millions d’enregistrements.

Reltio est un MDM cloud-native particulièrement adopté dans les secteurs pharma et life sciences. Son modèle de données graph facilite la gestion des relations complexes entre entités.

Profisee s’est imposé comme la référence MDM pour les environnements Microsoft (Azure Data Factory, Synapse, Fabric). Son interface stewardship est accessible aux équipes métier non techniques.

La maîtrise d’une de ces plateformes augmente significativement la valeur marchande d’un data quality analyst. Les projets MDM en France durent entre 18 et 36 mois. Les consultants spécialisés Informatica MDM facturent entre 650 et 950 euros par jour.

BCBS 239 et obligations data quality dans le secteur bancaire

Le BCBS 239 est le cadre réglementaire le plus exigeant en matière de data quality. Publié en janvier 2013 par le Comité de Bâle, il impose aux banques d’importance systémique mondiale (G-SIB) de démontrer la qualité de leurs données de risque.

Les 14 principes BCBS 239 couvrent la gouvernance, l’infrastructure IT, les capacités d’agrégation des données de risque et les pratiques de reporting. Le principe 2 impose explicitement la qualité des données : exactitude, intégrité, complétude et fraîcheur.

En France, BNP Paribas, Société Générale et Crédit Agricole Group ont recruté massivement des data quality analysts et des data stewards entre 2018 et 2025 pour se conformer à ces exigences. Les programmes de conformité BCBS ont créé plusieurs centaines de postes permanents dans le secteur.

Le DCAM (Data Management Capability Assessment Model) de l’EDM Council est l’autre référence incontournable pour les institutions financières. Il évalue la maturité data sur huit domaines, dont la qualité des données et la gestion des données de référence.

Un data quality analyst en banque doit maîtriser ces deux cadres. La connaissance de BCBS 239 est souvent mentionnée comme critère éliminatoire dans les offres de grandes banques françaises.

  • Principe 2 BCBS 239 : exactitude et intégrité des données de risque
  • Principe 3 : complétude des données de risque agrégées
  • Principe 4 : timeliness (fraîcheur) des reportings de risque

Salaires data quality analyst en France en 2026

Les rémunérations varient fortement selon l’expérience, le secteur et la maîtrise des outils MDM et des cadres réglementaires.

Profil Expérience Salaire brut annuel Contexte typique
Data quality analyst junior 0-2 ans 42 000 - 52 000 € ESN, PME tech, première expérience post-master
Data quality analyst confirmé 3-5 ans 55 000 - 68 000 € Scale-up, grande entreprise, spécialisation sectorielle
Data quality analyst senior 6-10 ans 68 000 - 82 000 € Banque, assurance, programme BCBS 239, MDM lead
Lead data quality / Head of DQ 10 ans et plus 82 000 - 110 000 € Grand groupe, scope international, management d’équipe

Paris concentre 60 à 70 % des offres. Les secteurs bancaire et assurance paient en moyenne 15 % de plus que la moyenne du marché. Les certifications DAMA CDMP et EDM Council DCAM ajoutent 5 à 10 % à la rémunération négociée selon les retours de professionnels du secteur.

En freelance ou consulting, les TJM oscillent entre 450 et 800 euros pour un senior, et dépassent 900 euros pour les experts Informatica MDM ou Monte Carlo.

Formations et certifications pour devenir data quality analyst

La filière formation est plus structurée en 2026 qu’elle ne l’était cinq ans plus tôt. Plusieurs masters universitaires mentionnent explicitement la gouvernance et la qualité des données dans leur programme.

Master Data Management et gouvernance : des formations de niveau bac+5 existent à Paris-Dauphine (Master Intelligence des données), à l’ENSAI, à Télécom Paris et dans plusieurs IAE. Certaines ESC proposent des M2 spécialisés en data governance.

DAMA CDMP (Certified Data Management Professional) est la certification internationale de référence. Elle couvre 14 domaines du DAMA-DMBOK, dont la qualité des données, le MDM, la gouvernance et l’architecture. L’examen Fundamentals est accessible sans prérequis. Les niveaux Practitioner et Master nécessitent de l’expérience terrain.

EDM Council DCAM : le Data Management Capability Assessment Model certification cible spécifiquement les profils finance et asset management. Elle est reconnue par les régulateurs européens dans le contexte BCBS 239.

  • DAMA CDMP Fundamentals : examen en ligne, 100 questions, 60 % de réussite requis
  • Certifications Informatica, Talend, Collibra : formation officielle plus examen éditeur
  • Certifications cloud (AWS, GCP, Azure) : complément utile pour les profils data engineering

Les formations courtes Soda, dbt et Great Expectations sont accessibles en autoformation via la documentation officielle et les cours Udemy. Elles ne remplacent pas une certification DAMA mais complètent le profil technique.

Reconversion vers le métier de data quality analyst

Ce métier est accessible par reconversion depuis plusieurs fonctions analytiques ou qualité. Les passerelles sont réelles et plusieurs transitions ont été validées sur le marché français.

Depuis data analyst ou BI analyst : c’est la reconversion la plus naturelle. La maîtrise de SQL, la compréhension des modèles de données et l’habitude de produire des tableaux de bord accélèrent l’apprentissage des outils DQ. Il manque généralement la connaissance des frameworks de gouvernance et des outils MDM. Un projet personnel sur dbt plus Great Expectations suffit à combler le gap technique en trois mois.

Depuis contrôle qualité industriel ou audit qualité : les profils issus des normes ISO 9001 ou ISO 17025 ont une solide culture de la mesure, des indicateurs et des plans d’action correctifs. Le gap est technique (SQL, Python, outils data). Un bootcamp de trois à six mois couvre l’essentiel.

Depuis audit interne ou contrôle de gestion : la compréhension des enjeux réglementaires et des processus métier est un atout réel. Ces profils comprennent rapidement l’impact business d’une donnée erronée. Le gap est également technique.

Dans tous les cas, la certification DAMA CDMP Fundamentals constitue un signal crédible pour les recruteurs. Elle démontre une compréhension systémique du domaine, au-delà de la maîtrise d’un outil spécifique.

Risque IA sur ce métier : niveau MOYEN

L’automatisation par l’IA transforme certaines tâches du data quality analyst sans supprimer le métier. Le risque est réel sur les tâches répétitives, limité sur les responsabilités de gouvernance et de décision.

Ce que l’IA automatise déjà en 2026 :

  • La détection d’anomalies statistiques sur des volumes massifs (Monte Carlo, Bigeye, Soda AI)
  • La suggestion automatique de règles de qualité à partir du profiling des données
  • La classification des incidents de qualité et le routing vers les équipes responsables

Ce que l’IA ne remplace pas : la définition des seuils d’acceptabilité métier, la négociation avec les équipes sources sur les corrections à apporter, la rédaction des politiques de gouvernance, la conformité réglementaire (BCBS 239, RGPD). Ces tâches requièrent un jugement humain ancré dans le contexte organisationnel.

L’émergence des data contracts (accord formel entre producteurs et consommateurs de données sur les garanties de qualité) crée également de nouvelles responsabilités qui ne s’automatisent pas. Le data quality analyst de 2026 est de plus en plus un interlocuteur stratégique, moins un technicien de profiling.

RGPD et data lineage : des obligations structurantes

Le RGPD impose depuis 2018 des contraintes directes sur la qualité des données. L’article 5(1)(d) exige que les données personnelles soient exactes et tenues à jour. L’article 5(1)(e) impose des durées de conservation limitées. Ces obligations créent un mandat réglementaire clair pour les programmes de data quality.

La gestion du droit à l’effacement (article 17) et du droit à la portabilité (article 20) nécessite un inventaire précis des données personnelles et de leur localisation dans les systèmes. C’est ici que le data lineage devient critique.

Le data lineage trace le chemin d’une donnée depuis sa source jusqu’à ses usages finaux. Il permet de répondre à trois questions essentielles : d’où vient cette donnée, comment a-t-elle été transformée, où est-elle utilisée. Les outils comme Collibra, Alation et OpenMetadata gèrent le lineage automatiquement en s’intégrant aux pipelines dbt, Spark et Airflow.

En cas de violation de données (article 33 RGPD), le lineage permet d’identifier en moins de 72 heures les systèmes impactés et les personnes concernées. Sans lineage, cette analyse prend plusieurs semaines et expose l’organisation à des sanctions CNIL.

Le data quality analyst qui maîtrise Collibra ou Alation pour le lineage est positionné sur un segment très demandé en 2026, particulièrement dans les secteurs santé, banque et assurance.

Évolutions de carrière : head of data quality, CDO, consulting

Le data quality analyst dispose de plusieurs trajectoires d’évolution selon ses appétences pour le management, la technique ou le conseil.

Head of Data Quality ou Data Quality Lead : c’est l’évolution naturelle après six à dix ans. Le head of DQ manage une équipe de trois à dix personnes selon la taille de l’organisation. Il est responsable du programme DQ global : choix des outils, animation du comité de gouvernance, suivi des KPI de qualité. Il rapporte au Chief Data Officer ou au directeur de la data.

Chief Data Officer (CDO) : certains data quality analysts évoluent vers le CDO après avoir assumé des responsabilités de gouvernance plus larges. Ce parcours est plus fréquent dans les organisations où le CDO est issu de la gouvernance plutôt que de la data science.

Consulting et freelance : après cinq à huit ans d’expérience, le passage en consulting indépendant ou en cabinet est une option attractive. Les cabinets spécialisés en data governance (Wavestone, Micropole, Hardis Group, Devoteam) recrutent des profils seniors. Les TJM élevés (650-950 euros) compensent l’absence de stabilité.

Éditeurs et customer success : Collibra, Talend, Informatica et Monte Carlo recrutent des data quality analysts comme technical account managers ou solution engineers. Ces postes combinent expertise technique et relation client.

Perspectives du métier

La data observability se généralise avec des composants natifs intégrés dans les grandes stacks de données comme Snowflake et Databricks, orientant l’analyste vers le pilotage plutôt que la configuration manuelle. Les LLM permettent désormais de suggérer des règles de qualité à partir d’une description métier en langage naturel, et le concept de data contracts s’impose comme pratique opérationnelle pour formaliser les garanties entre producteurs et consommateurs de données. L’AI Act européen pousse les organisations à démontrer l’absence de biais dans leurs données d’entraînement, élargissant le périmètre de l’analyste à la détection de biais démographiques dans les datasets.