Servizio
AI Sovrana & Infrastruttura LLM GDPR-Compliant
Deployment LLM privato, self-hosted e UE-sovrano. OVHcloud, Scaleway, Hetzner, Mistral AI. Piena residenza dati UE, zero esposizione al CLOUD Act, audit-ready per settori regolamentati.
A chi è rivolto
- Banche, assicurazioni e fintech regolamentate da ACPR, BaFin, FINMA, CONSOB o DNB
- Organizzazioni sanitarie che richiedono AI HDS-compliant (Francia) o deployment allineati al KHZG (Germania)
- Studi legali e legaltech con preoccupazioni di segreto professionale
- Settore pubblico e contractor della difesa per cui l'esposizione al CLOUD Act è un deal-breaker
- Scale-up che si preparano agli obblighi EU AI Act per sistemi ad alto rischio
- Qualsiasi azienda europea il cui DPO o Compliance officer ha bloccato le API AI ospitate negli USA
Cosa è incluso
- Selezione del provider: OVHcloud (AI Endpoints, AI Deploy, AI Training, AI Notebooks, HDS) vs Scaleway (Generative APIs, Inference, cluster H100) vs Hetzner (GPU ottimizzato sui costi) vs on-prem
- Selezione dei modelli: Mistral Large / Codestral / Pixtral, Aleph Alpha Luminous, Llama 3 self-hosted, Mixtral, Qwen, DeepSeek, SLM fine-tuned
- Stack di inferenza: vLLM, TGI, Ollama, load-balanced, osservabili, token-metered
- Architettura di retrieval: Qdrant, Weaviate, pgvector, Milvus; ricerca ibrida; reranking
- Orchestrazione: LangChain, LangGraph, LlamaIndex, DSPy; eval harness e guardrail
- Deliverable di compliance: DPIA, Transfer Impact Assessment, template DPA Articolo 28, classificazione del rischio AI Act, allineamento ISO/IEC 42001
- Modellazione costi: economia dei token, forecast di ore GPU, ottimizzazione del cache-hit
- Observability: Langfuse, OpenTelemetry, Helicone, audit trail completo di ogni inferenza
Come lavoriamo
- 1
Scoping regolatorio
Identificare le regolamentazioni applicabili (GDPR, EU AI Act, NIS2, DORA, settori specifici) e la postura di compliance richiesta: residenza dati, ritenzione, audit, spiegabilità, supervisione umana.
- 2
Design dell'architettura
Selezione provider e modelli, topologia di rete (VPC, endpoint privati, zero egress extra-UE), gestione dei secret, audit logging.
- 3
Build & integrazione
Mettere in piedi lo stack di inferenza, orchestrazione, retrieval e guardrail. Integrazione con l'applicazione cliente e con IAM/SSO esistenti.
- 4
Artefatti di compliance
Scrivere DPIA, DPA, TIA, memo di classificazione del rischio AI Act e runbook operativo. Handoff al DPO / CISO.
- 5
Operare o trasferire
O operiamo lo stack in retainer, o lo trasferiamo completamente al team interno con formazione e runbook.
Risultati che puoi aspettarti
- Stack LLM con zero egress di prompt/response verso giurisdizioni extra-UE
- Documenti DPIA e TIA che il tuo DPO può firmare
- Classificazione del rischio AI Act con motivazione difendibile
- Audit trail che copre ogni richiesta di inferenza (chi, cosa, quando, versione del modello)
- Proiezioni di costi del provider per 12 e 24 mesi
- Baseline SLO di latenza e disponibilità di inferenza
- Un percorso di migrazione dalle API ospitate negli USA se dovesse diventare obbligatorio
- Una storia di compliance che i tuoi clienti enterprise accetteranno in procurement
Prezzi
Discovery sprint (3-5 giorni)
da €2.500
Scoping regolatorio + memo di opzioni di architettura.
Deployment completo
da €25.000
Dipende da scala e profondità di compliance. Tipicamente 3-6 settimane end-to-end.
Retainer continuo
da €2.100/mese
Monitor, aggiustamenti e manutenzione degli artefatti di compliance.
Tutti i prezzi escludono l'IVA. I clienti B2B UE con un numero di partita IVA intracomunitaria valido beneficiano del reverse charge.
Domande frequenti
È davvero possibile far girare qualità GPT-4 su infrastruttura UE?
Sì, nella maggior parte dei casi d'uso. Mistral Large e Claude Sonnet via Bedrock UE, combinati con Llama-3 o Mixtral fine-tuned sul tuo dominio, coprono l'85%+ dei casi d'uso con qualità competitiva. Le differenze si riducono ogni mese.
E il CLOUD Act se uso Bedrock UE?
Bedrock UE riduce ma non elimina l'esposizione al CLOUD Act perché AWS è un'entità US-owned. Per esigenze a zero esposizione (difesa, alcuni settori pubblici) la risposta è OVHcloud, Scaleway o on-prem: tutti con sede UE, proprietà UE.
Sarà più lento delle API OpenAI/Anthropic?
Per Llama/Mixtral self-hosted su Scaleway H100: 50-200ms TTFT a throughput di token simile. Per API hosted Mistral: parità. Per OVHcloud AI Endpoints: 100-300ms TTFT a seconda del modello. La latenza raramente è il collo di bottiglia; l'auditabilità sì.
Puoi garantire la compliance all'EU AI Act?
Nessun consulente può "garantire" la compliance a una legge ancora in fase di rollout. Quello che consegno è una postura di compliance difendibile: classificazione del rischio, controlli documentati, DPIA, monitoring e audit trail. La firma spetta al tuo DPO e team legale.
Lavori con il nostro DPO e CISO esistenti?
Sì. Gli artefatti di compliance sono scritti proprio per loro. Posso anche partecipare a review cross-funzionali e rispondere direttamente ai loro questionari di security/privacy.
Cosa succede se un modello viene deprecato?
L'architettura è model-agnostic. Sostituire Mistral-Large con Mixtral o Llama-4 richiede tipicamente 1-3 giorni di lavoro più un re-run dell'eval. Observability e modelli di costo seguono il cambio automaticamente.
Stima rapida
Quanto potrebbe costarti?
Fasce indicative basate su una tariffa giornaliera di €700. Il prezzo finale dipende dallo scope, dalla profondità di compliance e dalla tempistica, confermato nella Proposta dopo una call di discovery.
Accordi di Partnership (cash ridotto + equity) possono tagliare la componente cash del 30-40% per startup early-stage allineate. È sempre richiesta una tariffa di servizio.
Fascia stimata
€2,800 – €3,500al mese
4-5 × €700/day
Leadership tecnica attiva: sync settimanale, review di architettura, decisioni sui vendor, call con investitori.
Tutti i prezzi escludono l'IVA.
Parliamo del tuo progetto
Prenota una discovery call gratuita di 30 min. Nessun pagamento, nessun deck, nessuna sequenza di follow-up. Se l'AI non è la risposta giusta per il tuo problema, lo saprai durante la call.