Retour à tous les travaux
IA souveraine & intelligence documentaire

CARAG — RAG conforme sur un corpus entreprise de 1,2M documents

Entreprise UE · 2025–2026 · build RAG de production + publication

RAGComplianceHNSWAudit logLire le brouillon CARAG

Problème

Un client entreprise avait besoin de génération augmentée par récupération sur un corpus interne de 1,2M documents où l'éligibilité au moment de la récupération — qui peut voir quoi, pour quelle finalité — compte autant que la pertinence. Le RAG standard échoue ici : le passage le plus pertinent peut être le plus inadmissible juridiquement.

Approche

Architecture en cinq étapes traitant la conformité comme propriété de premier ordre de l'index, du récupérateur, du générateur et du journal d'audit. Chaque chunk porte une bitmask de politique 27 bits empaquetée dans un mot 32 bits. Tests d'admissibilité bitwise évalués dans la boucle interne HNSW, avant la mise à jour du heap de résultats. Le générateur voit explicitement les buckets admissibles et inadmissibles séparés, avec une refusal head lorsqu'aucune évidence admissible n'existe. Chaque requête produit un journal d'audit ancré Merkle, suffisant pour l'Article 12 de l'AI Act européen.

Stack

Qdrant with custom HNSW patches · FastAPI · Claude / GPT-4 · Python audit-log substrate

Résultat

Latence de récupération p95 sous 300 ms sur un graphe de 2,5M nœuds. Posture de conformité de niveau production, défendable en audit par conception. L'architecture a été validée indépendamment sur un benchmark public de 26 595 chunks issus de dépôts SEC EDGAR réels — publié en brouillon de travail, démontrant que la même architecture réduit les violations de contraintes de 81,12 % à 0,00 % et les divulgations en sortie de 21,29 % à 0,00 % pour un coût F1 de 4,8 points.

Service associé

IA souveraine

Vous voulez un engagement similaire sur votre stack ?

La plupart des engagements comme celui-ci ont commencé par un appel de cadrage de 60 minutes.

Autres travaux

Aru Bhardwaj

Fractional CTO architecting sovereign AI systems for startups and scale-ups across Europe. Custom ML, agentic RAG, and secure LLM infrastructure. 7+ years turning complex data into production intelligence.

Malt
Upwork

Contact

Services

  • Fractional CTO & AI Strategy
  • MVP Development & Rapid Prototyping
  • Sovereign LLM Deployment (OVHcloud, Scaleway)
  • Multi-Cloud AI (AWS Bedrock, Vertex AI, Azure)
  • RAG Pipelines & Autonomous Agents
  • GDPR & EU AI Act Compliance
  • Generative AI & Prompt Engineering
  • Machine Learning & Predictive Analytics

Monthly playbook

Practical AI essays for founders and tech leaders. One email a month.

Essais tactiques sur l'IA, chaque mois.

© 2026 Insightrix SASU. All rights reserved.Aru Bhardwaj, Fractional CTO & AI Strategist

60 Rue François Ier, 75008 Paris, France · SIRET 989 236 856 00013 · TVA FR42989236856