Le data leakage survient quand des informations du futur ou du test set fuient dans le train set, creant des performances artificiellement elevees.
Aussi appelé : contamination des données d'entraînement, fuite d'information dans le train set, sélection biaisée des données, data snooping
Le data leakage survient quand des informations du futur ou du test set fuient dans le train set, creant des performances artificiellement elevees.
Utiliser le prix de cloture pour predire le prix de cloture du meme jour est un leakage evident.
Utiliser le prix de cloture pour predire le prix de cloture du meme jour est un leakage evident.
La France vise 20 milliards d'euros d'investissement dans l'IA d'ici 2026. Le nombre de modèles d'IA déployés par les entreprises françaises a bondi de 45% en 2024. Or, une étude du CNRS révèle que 23% des projets IA en entreprise française présentent des cas de data leakage. Les régulateurs français intègre des checks anti-leakage dans les auditsques demands par la future application de l'AI Act européen. Le risque de performances trompeuses est done croissant.
Métiers directement touchés par ce concept dans leur quotidien professionnel.
| Métier | Score IA | Impact |
|---|---|---|
| Data Scientist | — / 100 | Concerné par Data Leakage |
Concepts complémentaires pour approfondir votre compréhension.
Découvrez 6 autres concepts essentiels de cette catégorie.