Vos agents IA ne marchent pas. Le modèle n'y est pour rien.
20% des entreprises ont la data pour faire tourner des agents en production. Les 80% autres se trompent de bataille. Le vrai bottleneck est ailleurs.
On s’est trompés de bataille
En 2024-2025, le marché s’est battu sur le bon modèle. GPT-4 contre Claude contre Gemini. Benchmarks, contextes longs, multi-modal. Des centaines de millions dépensés sur des POCs qui changeaient de stack tous les trois mois.
En 2026, le constat tombe. Les entreprises qui livrent réellement des agents en production ne se sont pas distinguées par leur choix de modèle. Elles se sont distinguées par leur tuyauterie data.
Jennifer Li (a16z) l’a posé sans détour. La data d’entreprise reste piégée. Et les agents ont besoin de structure pour tourner de manière fiable.
Le vrai bottleneck
Vos données ne sont pas absentes. Elles sont éparpillées.
- PDF non parsés qui contiennent vos process produit
- Transcripts Zoom non indexés qui contiennent les vraies objections client
- Threads Slack qui ont la décision mais pas le contexte
- Screenshots collés dans Notion sans métadonnées
- Comptes-rendus de réunion dans des Google Docs sans structure
Sans données structurées et accessibles, votre agent hallucine ou refuse de répondre. Le modèle n’y peut rien.
Gartner et Deloitte confirment dans leurs derniers rapports 2026. 1 client sur 5 seulement a une gouvernance data mature. Les 80% qui restent ont trois problèmes à régler avant même de penser « agent ».
Le test brutal
Avant de lancer un projet agent, posez-vous cette question.
Si je remplace mon LLM par un humain expert avec un accès direct à mes données actuelles, est-ce qu’il pourrait répondre à 80% des questions ?
Si la réponse est « non, il faudrait qu’il fouille dans 8 outils », votre problème n’est pas le modèle. C’est la tuyauterie.
Et aucun GPT-5, aucun Claude 5, aucun modèle frontier ne résoudra ça pour vous.
Les trois sources à auditer en priorité
Avant tout projet agent, on regarde trois zones précises chez nos clients :
- Connaissance produit et process - Où est-elle ? PDF, Notion, Confluence, Wiki interne ? Indexable ?
- Conversations clients - Transcripts d’appels, threads support, emails. Structurés ? Cherchables ?
- Décisions historiques - Threads Slack, comptes-rendus de réunion. Traçables ?
Si les trois sont épars, aucun agent ne tournera de manière fiable. Pas en production. Pas avec des utilisateurs réels. Et certainement pas à l’échelle.
Le diagnostic redevient la phase de cadrage
On a intégré cette étape dans tous nos cadrages depuis début 2026. Un audit data de 5 jours, systématique, avant tout projet agent.
Ce qu’on regarde :
- Cartographie des sources de données exploitables
- Évaluation du niveau de structure (du brut au structuré)
- Identification des trois sources à nettoyer en priorité
- Estimé du coût de plumbing avant le coût de l’agent
- Roadmap réaliste : si data immature, on construit pas l’agent tout de suite
Résultat côté client. On détecte avant le POC les sources qui doivent être nettoyées ou structurées. Plus rapide. Moins cher. Et surtout, l’agent qu’on construit derrière a une chance de tourner en production.
La vraie question
Si vous n’avez pas commencé à structurer votre donnée non structurée, les modèles continueront d’être les prétextes pour expliquer pourquoi ça ne marche pas.
Mais le vrai goulot, c’est la tuyauterie. Pas le modèle.
Et pendant que vos concurrents s’épuisent à changer de stack tous les 3 mois, ceux qui ont fait ce travail en amont passent en production. Sans bruit.
On audite la maturité data avant tout projet agent. Si vous voulez en discuter - yann@selego.co
Sources
Envie d'aller plus loin ?
Parlons de votre projet
Conseil, audit, build - nous accompagnons votre transformation tech et IA de A a Z.