Torna alla home

Servizio

AI Sovrana & Infrastruttura LLM GDPR-Compliant

Deployment LLM privato, self-hosted e UE-sovrano. OVHcloud, Scaleway, Hetzner, Mistral AI. Piena residenza dati UE, zero esposizione al CLOUD Act, audit-ready per settori regolamentati.

A chi è rivolto

  • Banche, assicurazioni e fintech regolamentate da ACPR, BaFin, FINMA, CONSOB o DNB
  • Organizzazioni sanitarie che richiedono AI HDS-compliant (Francia) o deployment allineati al KHZG (Germania)
  • Studi legali e legaltech con preoccupazioni di segreto professionale
  • Settore pubblico e contractor della difesa per cui l'esposizione al CLOUD Act è un deal-breaker
  • Scale-up che si preparano agli obblighi EU AI Act per sistemi ad alto rischio
  • Qualsiasi azienda europea il cui DPO o Compliance officer ha bloccato le API AI ospitate negli USA

Cosa è incluso

  • Selezione del provider: OVHcloud (AI Endpoints, AI Deploy, AI Training, AI Notebooks, HDS) vs Scaleway (Generative APIs, Inference, cluster H100) vs Hetzner (GPU ottimizzato sui costi) vs on-prem
  • Selezione dei modelli: Mistral Large / Codestral / Pixtral, Aleph Alpha Luminous, Llama 3 self-hosted, Mixtral, Qwen, DeepSeek, SLM fine-tuned
  • Stack di inferenza: vLLM, TGI, Ollama, load-balanced, osservabili, token-metered
  • Architettura di retrieval: Qdrant, Weaviate, pgvector, Milvus; ricerca ibrida; reranking
  • Orchestrazione: LangChain, LangGraph, LlamaIndex, DSPy; eval harness e guardrail
  • Deliverable di compliance: DPIA, Transfer Impact Assessment, template DPA Articolo 28, classificazione del rischio AI Act, allineamento ISO/IEC 42001
  • Modellazione costi: economia dei token, forecast di ore GPU, ottimizzazione del cache-hit
  • Observability: Langfuse, OpenTelemetry, Helicone, audit trail completo di ogni inferenza

Come lavoriamo

  1. 1

    Scoping regolatorio

    Identificare le regolamentazioni applicabili (GDPR, EU AI Act, NIS2, DORA, settori specifici) e la postura di compliance richiesta: residenza dati, ritenzione, audit, spiegabilità, supervisione umana.

  2. 2

    Design dell'architettura

    Selezione provider e modelli, topologia di rete (VPC, endpoint privati, zero egress extra-UE), gestione dei secret, audit logging.

  3. 3

    Build & integrazione

    Mettere in piedi lo stack di inferenza, orchestrazione, retrieval e guardrail. Integrazione con l'applicazione cliente e con IAM/SSO esistenti.

  4. 4

    Artefatti di compliance

    Scrivere DPIA, DPA, TIA, memo di classificazione del rischio AI Act e runbook operativo. Handoff al DPO / CISO.

  5. 5

    Operare o trasferire

    O operiamo lo stack in retainer, o lo trasferiamo completamente al team interno con formazione e runbook.

Risultati che puoi aspettarti

  • Stack LLM con zero egress di prompt/response verso giurisdizioni extra-UE
  • Documenti DPIA e TIA che il tuo DPO può firmare
  • Classificazione del rischio AI Act con motivazione difendibile
  • Audit trail che copre ogni richiesta di inferenza (chi, cosa, quando, versione del modello)
  • Proiezioni di costi del provider per 12 e 24 mesi
  • Baseline SLO di latenza e disponibilità di inferenza
  • Un percorso di migrazione dalle API ospitate negli USA se dovesse diventare obbligatorio
  • Una storia di compliance che i tuoi clienti enterprise accetteranno in procurement

Prezzi

Discovery sprint (3-5 giorni)

da €2.500

Scoping regolatorio + memo di opzioni di architettura.

Deployment completo

da €25.000

Dipende da scala e profondità di compliance. Tipicamente 3-6 settimane end-to-end.

Retainer continuo

da €2.100/mese

Monitor, aggiustamenti e manutenzione degli artefatti di compliance.

Tutti i prezzi escludono l'IVA. I clienti B2B UE con un numero di partita IVA intracomunitaria valido beneficiano del reverse charge.

Domande frequenti

È davvero possibile far girare qualità GPT-4 su infrastruttura UE?

Sì, nella maggior parte dei casi d'uso. Mistral Large e Claude Sonnet via Bedrock UE, combinati con Llama-3 o Mixtral fine-tuned sul tuo dominio, coprono l'85%+ dei casi d'uso con qualità competitiva. Le differenze si riducono ogni mese.

E il CLOUD Act se uso Bedrock UE?

Bedrock UE riduce ma non elimina l'esposizione al CLOUD Act perché AWS è un'entità US-owned. Per esigenze a zero esposizione (difesa, alcuni settori pubblici) la risposta è OVHcloud, Scaleway o on-prem: tutti con sede UE, proprietà UE.

Sarà più lento delle API OpenAI/Anthropic?

Per Llama/Mixtral self-hosted su Scaleway H100: 50-200ms TTFT a throughput di token simile. Per API hosted Mistral: parità. Per OVHcloud AI Endpoints: 100-300ms TTFT a seconda del modello. La latenza raramente è il collo di bottiglia; l'auditabilità sì.

Puoi garantire la compliance all'EU AI Act?

Nessun consulente può "garantire" la compliance a una legge ancora in fase di rollout. Quello che consegno è una postura di compliance difendibile: classificazione del rischio, controlli documentati, DPIA, monitoring e audit trail. La firma spetta al tuo DPO e team legale.

Lavori con il nostro DPO e CISO esistenti?

Sì. Gli artefatti di compliance sono scritti proprio per loro. Posso anche partecipare a review cross-funzionali e rispondere direttamente ai loro questionari di security/privacy.

Cosa succede se un modello viene deprecato?

L'architettura è model-agnostic. Sostituire Mistral-Large con Mixtral o Llama-4 richiede tipicamente 1-3 giorni di lavoro più un re-run dell'eval. Observability e modelli di costo seguono il cambio automaticamente.

Stima rapida

Quanto potrebbe costarti?

Fasce indicative basate su una tariffa giornaliera di €700. Il prezzo finale dipende dallo scope, dalla profondità di compliance e dalla tempistica, confermato nella Proposta dopo una call di discovery.

Accordi di Partnership (cash ridotto + equity) possono tagliare la componente cash del 30-40% per startup early-stage allineate. È sempre richiesta una tariffa di servizio.

Fascia stimata

€2,800 – €3,500al mese

4-5 × €700/day

Leadership tecnica attiva: sync settimanale, review di architettura, decisioni sui vendor, call con investitori.

Tutti i prezzi escludono l'IVA.

Parliamo del tuo progetto

Prenota una discovery call gratuita di 30 min. Nessun pagamento, nessun deck, nessuna sequenza di follow-up. Se l'AI non è la risposta giusta per il tuo problema, lo saprai durante la call.

Aru Bhardwaj

Fractional CTO architecting sovereign AI systems for startups and scale-ups across Europe. Custom ML, agentic RAG, and secure LLM infrastructure. 7+ years turning complex data into production intelligence.

Malt
Upwork

Contact

Services

  • Fractional CTO & AI Strategy
  • MVP Development & Rapid Prototyping
  • Sovereign LLM Deployment (OVHcloud, Scaleway)
  • Multi-Cloud AI (AWS Bedrock, Vertex AI, Azure)
  • RAG Pipelines & Autonomous Agents
  • GDPR & EU AI Act Compliance
  • Generative AI & Prompt Engineering
  • Machine Learning & Predictive Analytics

Monthly playbook

Practical AI essays for founders and tech leaders. One email a month.

Saggi tattici sull'AI, ogni mese.

© 2026 Insightrix SASU. All rights reserved.Aru Bhardwaj, Fractional CTO & AI Strategist

60 Rue François Ier, 75008 Paris, France · SIRET 989 236 856 00013 · TVA FR42989236856