HealthTechIntelligence ArtificielleRAG / Agentic AI

HBI
Healthcare Business International

Plateforme B2B SaaS d'intelligence de marché santé. Investisseurs, analystes et consultants interrogent en langage naturel une base propriétaire de milliers d'entreprises — avec citations sources et zéro hallucination tolérée.

Conception & run — plateforme IA en production

9 000

entreprises en base

11

collections vectorisées

RAG

sourcé multi-tours

En prod

depuis 2026

0

hallucination tolérée

Le problème

La donnée marché santé est partout, interrogeable nulle part

CRM, articles, vidéos de conférences, PDF, charts : l'intelligence de marché santé est dispersée et non interrogeable. Les analystes perdent un temps précieux à fouiller, pendant que les IA génériques inventent des chiffres sur des questions de marché chiffrées — un risque inacceptable pour des décisions d'investissement.

Donnée éparpillée

L'intelligence de marché santé vit dans des silos hétérogènes — CRM, articles de presse, vidéos de conférences, PDF, charts — sans aucun moyen unifié de l'interroger.

Recherche chronophage

Investisseurs, analystes et consultants perdent un temps considérable à fouiller manuellement des sources dispersées pour répondre à une seule question de marché.

Risque d'hallucination

Les IA génériques inventent des chiffres sur des questions de marché — CA, M&A, tailles de marché. Inacceptable pour des décisions d'investissement.

Selego a conçu et opère la plateforme IA — en production depuis 2026
La solution

Un pipeline RAG de bout en bout

De l'ingestion multi-sources à la réponse sourcée streamée en temps réel — chaque étape outillée pour la fiabilité.

01

Ingestion multi-sources

12 crons quotidiens agrègent Salesforce CRM, GNews, WordPress, YouTube, market reports MySQL et PDF Google Drive dans une base propriétaire unifiée.

02

Parsing & Vision

Parsing adapté à chaque format. Les PDF et images passent par un LLM Vision : Claude décrit graphiques et schémas — pas d'OCR classique qui les ignore.

03

Vectorisation

Chunking puis embeddings VoyageAI 1024 dimensions, stockés dans MongoDB Atlas Vector Search réparti sur 11 collections.

04

Orchestration agents

Réécriture de requête → classification → recherche + reranking, ou boucle d'outils jusqu'à 10 rounds → réponse sourcée streamée en temps réel.

Quatre modules en production

Assistant IA RAG

Interrogation en langage naturel d'une base propriétaire couvrant des milliers d'entreprises (Providers/Investors), investissements et CA. Réponses complexes avec citations sources.

Market reports

Génération automatique de rapports de marché par sous-secteur et géographie : résumé exécutif, taille de marché, M&A, risques.

Back-office admin

Curation de contenus, monitoring de la consommation LLM et gestion des tickets pour l'équipe interne.

Agent journaliste

Génération automatique d'emails d'outreach pour enrichir les profils d'entreprises et de contacts de la base.

Fiabilité critique

Anti-hallucination par conception, pas par espoir

Chaque réponse est ancrée au contexte et vérifiable. Le chiffré ne passe jamais par de la génération libre.

Garde-fous outillés

Réponse strictement ancrée au contexte récupéré
Citations et liens sources obligatoires
Le chiffré passe par des requêtes MongoDB déterministes, pas par génération libre
Question trop large → demande de précision plutôt qu'hallucination

Évaluation continue

DeepEvalLLM-as-a-judge sur chaque réponse
Sonnet 4.5modèle juge des évaluations
0,7seuil de pertinence requis
Anti-hallumesure dédiée à la fidélité aux sources
Des réponses sourcées, vérifiables et reproductibles
En production

Les volumes interrogeables

Une base propriétaire dense, ingérée en continu et entièrement vectorisée — équipe interne depuis fin janvier 2026, clients externes depuis avril 2026.

9 000

entreprises

9 000

contacts

2 700

opérations d'investissement

52 000

répartitions de ventes

40 000

CA annuels

650

vidéos de conférences

450

market reports

10 000

articles

1 000

special reports

11

collections vectorisées

12

crons quotidiens

11 collections vectorisées, ré-ingérées par 12 crons quotidiens
Architecture technique

Stack & Infrastructure

Backend & Données

Node.js v22 + Express
MongoDB Atlas (Mongoose, 33 modèles)
2 bases MySQL
Socket.io (streaming tokens LLM)
Hébergé Clever Cloud (France)

Intelligence Artificielle

Google Vertex AI (Gemini) principal
Anthropic Claude en fallback
Embeddings VoyageAI (1024 dims)
MongoDB Atlas Vector Search
DeepEval (LLM-as-a-judge)

Intégrations & Front

Salesforce, Google Drive, YouTube, GNews
Scraping Companies House, Pappers
Playwright / Cheerio
Front client + admin React Vite
~49 500 lignes de code

Vous avez un projet RAG ou agentique ?

Parlons de votre ambition

Pipeline d'ingestion, recherche vectorielle, réponses sourcées et anti-hallucination outillée — nous concevons et opérons des plateformes IA fiables, jusqu'en production.