Torna a tutti i lavori
AI sovrana e intelligence documentale

CARAG — RAG conforme su un corpus enterprise di 1,2M documenti

Enterprise UE · 2025–2026 · build RAG di produzione + paper di ricerca

RAGComplianceHNSWAudit logLeggi il paper CARAG

Problema

Un cliente enterprise aveva bisogno di retrieval-augmented generation su un corpus interno di 1,2M documenti dove l'ammissibilità al momento del retrieval — chi può vedere cosa, per quale scopo — conta quanto la rilevanza. Il RAG off-the-shelf si rompe qui: il passaggio più rilevante può essere il più inammissibile dal punto di vista legale.

Approccio

Costruita un'architettura a cinque stadi che tratta la compliance come proprietà di primo livello di indice, retriever, generatore e audit log. Ogni chunk porta una bitmask di policy a 27 bit impacchettata in una parola da 32 bit. Test di ammissibilità bitwise valutati dentro il loop interno HNSW, prima che l'heap dei risultati venga aggiornato. Il generatore vede esplicitamente bucket ammissibili e inammissibili separati, con una refusal head quando non esistono evidenze ammissibili. Ogni query produce un audit log con ancoraggio Merkle, sufficiente per l'Articolo 12 dell'AI Act europeo.

Stack

Qdrant with custom HNSW patches · FastAPI · Claude / GPT-4 · Python audit-log substrate

Risultato

Latenza di retrieval p95 sotto i 300 ms su un grafo da 2,5M nodi. Postura di compliance production-grade, difendibile in audit per design. L'architettura è stata validata indipendentemente su un benchmark pubblico di 26.595 chunk da filings SEC EDGAR reali — pubblicato come bozza di lavoro, dimostrando che la stessa architettura riduce le violazioni dei vincoli dall'81,12% allo 0,00% e le disclosure di output dal 21,29% allo 0,00% a un costo F1 di 4,8 punti.

Servizio correlato

Sovereign AI

Vuoi un ingaggio simile sul tuo stack?

La maggior parte degli ingaggi come questo è iniziata con una call di scoping di 60 minuti.

Altri lavori

Aru Bhardwaj

Fractional CTO architecting sovereign AI systems for startups and scale-ups across Europe. Custom ML, agentic RAG, and secure LLM infrastructure. 7+ years turning complex data into production intelligence.

Malt
Upwork

Contact

Services

  • Fractional CTO & AI Strategy
  • MVP Development & Rapid Prototyping
  • Sovereign LLM Deployment (OVHcloud, Scaleway)
  • Multi-Cloud AI (AWS Bedrock, Vertex AI, Azure)
  • RAG Pipelines & Autonomous Agents
  • GDPR & EU AI Act Compliance
  • Generative AI & Prompt Engineering
  • Machine Learning & Predictive Analytics

Monthly playbook

Practical AI essays for founders and tech leaders. One email a month.

Saggi tattici sull'AI, ogni mese.

© 2026 Insightrix SASU. All rights reserved.Aru Bhardwaj, Fractional CTO & AI Strategist

60 Rue François Ier, 75008 Paris, France · SIRET 989 236 856 00013 · TVA FR42989236856