Vos agents IA ne marchent pas. Le modèle n'y est pour rien.

1/5

des entreprises ont une gouvernance data mature

80%

de données piégées dans PDF, Slack, Zoom

d’audit data avant tout projet agent

On s’est trompés de bataille

En 2024-2025, le marché s’est battu sur le bon modèle. GPT-4 contre Claude contre Gemini. Benchmarks, contextes longs, multi-modal. Des centaines de millions dépensés sur des POCs qui changeaient de stack tous les trois mois.

En 2026, le constat tombe. Les entreprises qui livrent réellement des agents en production ne se sont pas distinguées par leur choix de modèle. Elles se sont distinguées par leur tuyauterie data.

Jennifer Li (a16z) l’a posé sans détour. La data d’entreprise reste piégée. Et les agents ont besoin de structure pour tourner de manière fiable.

Le vrai bottleneck

Vos données ne sont pas absentes. Elles sont éparpillées.

PDF non parsés qui contiennent vos process produit
Transcripts Zoom non indexés qui contiennent les vraies objections client
Threads Slack qui ont la décision mais pas le contexte
Screenshots collés dans Notion sans métadonnées
Comptes-rendus de réunion dans des Google Docs sans structure

Sans données structurées et accessibles, votre agent hallucine ou refuse de répondre. Le modèle n’y peut rien.

Gartner et Deloitte confirment dans leurs derniers rapports 2026. 1 client sur 5 seulement a une gouvernance data mature. Les 80% qui restent ont trois problèmes à régler avant même de penser « agent ».

Le test brutal

Avant de lancer un projet agent, posez-vous cette question.

Si je remplace mon LLM par un humain expert avec un accès direct à mes données actuelles, est-ce qu’il pourrait répondre à 80% des questions ?

Si la réponse est « non, il faudrait qu’il fouille dans 8 outils », votre problème n’est pas le modèle. C’est la tuyauterie.

Et aucun GPT-5, aucun Claude 5, aucun modèle frontier ne résoudra ça pour vous.

Les trois sources à auditer en priorité

Avant tout projet agent, on regarde trois zones précises chez nos clients :

Connaissance produit et process - Où est-elle ? PDF, Notion, Confluence, Wiki interne ? Indexable ?
Conversations clients - Transcripts d’appels, threads support, emails. Structurés ? Cherchables ?
Décisions historiques - Threads Slack, comptes-rendus de réunion. Traçables ?

Si les trois sont épars, aucun agent ne tournera de manière fiable. Pas en production. Pas avec des utilisateurs réels. Et certainement pas à l’échelle.

Le diagnostic redevient la phase de cadrage

On a intégré cette étape dans tous nos cadrages depuis début 2026. Un audit data de 5 jours, systématique, avant tout projet agent.

Ce qu’on regarde :

Cartographie des sources de données exploitables
Évaluation du niveau de structure (du brut au structuré)
Identification des trois sources à nettoyer en priorité
Estimé du coût de plumbing avant le coût de l’agent
Roadmap réaliste : si data immature, on construit pas l’agent tout de suite

Résultat côté client. On détecte avant le POC les sources qui doivent être nettoyées ou structurées. Plus rapide. Moins cher. Et surtout, l’agent qu’on construit derrière a une chance de tourner en production.

La vraie question

Si vous n’avez pas commencé à structurer votre donnée non structurée, les modèles continueront d’être les prétextes pour expliquer pourquoi ça ne marche pas.

Mais le vrai goulot, c’est la tuyauterie. Pas le modèle.

Et pendant que vos concurrents s’épuisent à changer de stack tous les 3 mois, ceux qui ont fait ce travail en amont passent en production. Sans bruit.

On audite la maturité data avant tout projet agent. Si vous voulez en discuter - yann@selego.co

Vos agents IA ne marchent pas. Le modèle n'y est pour rien.

On s’est trompés de bataille

Le vrai bottleneck

Le test brutal

Les trois sources à auditer en priorité

Le diagnostic redevient la phase de cadrage

La vraie question

Sources

Articles connexes

Audit IA - Diagnostic & Roadmap

57% ont des agents IA. 11% s’en servent.

Parlons de votre projet