custom background image

Istanze GPU H100


Accelera i tuoi progetti IA con le istanze GPU H100

Prestazioni di punta per l'addestramento, l'inferenza e i workload di dati più esigenti — in un cloud europeo, affidabile e trasparente.

Perché scegliere le GPU NVIDIA H100?

Potenti

Fino a 4× più veloci delle A100 per l'addestramento di modelli IA complessi e la generazione di contenuti.

Performanti.

Il Transformer Engine FP8 ottimizza il calcolo per i LLM e la GenAI, offrendo un guadagno di prestazioni e di energia significativo.

compatibili

Totalmente compatibili con CUDA, PyTorch, TensorFlow e JAX: sfrutta le tue ottimizzazioni esistenti senza adattamenti.

Sovrano

Disponibili nel nostro Public Cloud, garantendo flessibilità, trasparenza e conformità europea.

Ottimizzato per i tuoi workload IA e Data

Addestramento e inferenza di LLM

Accelera i tuoi modelli fino a 70B di parametri (Llama 2, Mistral, Falcon, ecc.) grazie alla potenza del Transformer Engine e alla larghezza di banda della memoria del H100.

IA generativa multimodale

Crea, addestra e distribuisci i tuoi modelli di generazione di immagini, audio e video su larga scala, in modo fluido.

Data Science e HPC

Ottimizza i tuoi calcoli intensivi: simulazioni, modellazione scientifica o elaborazione parallela massiva — con prestazioni costanti e bassa latenza.

SPECIFICHE

Caratteristiche tecniche

GPU

Da 1 a 4 GPU per istanza

Memoria GPU

80 GB di HBM3 ultra-veloce per GPU

Storage performante

NVMe Passthrough locale sulla maggior parte delle istanze

Rete pubblica e privata

Fino a 25 Gbps inclusi

Automazione

Gestione tramite il tuo spazio cliente, API, OVHcloud CLI, ...

Sicuro e privato

Certificazioni ISO 27001, SOC, dati sanitari, etc.

Massimizza il tuo ROI con un'infrastruttura GPU flessibile

Trasparenza dei prezzi

Paga solo per le risorse che utilizzi, senza costi nascosti. Mantieni il controllo dei tuoi costi mentre godi di prestazioni ottimali.

Scalabilità istantanea

Aumenta o riduci le tue risorse GPU su richiesta, in pochi clic. Adatta la tua capacità ai tuoi carichi di lavoro IA e dati con facilità.

Sovranità e conformità

I tuoi dati sono ospitati su un cloud europeo certificato, garantendo sicurezza, trasparenza e conformità alle normative (GDPR, ISO, HDS).

Accessibilità senza barriere all’ingresso

GPU H100 accessibili a tutti: dal proof of concept al deployment in produzione, senza impegno di volume né vincoli hardware.

Come scegliere la propria GPU per fare inferenza?

Modelli compatti

Fino a 7B di parametri, un A100 offre un eccellente rapporto prestazioni/prezzo.

LLM intermedi

Fino a 30B, l'H100 è il miglior equilibrio tra velocità, efficienza energetica e compatibilità con i framework.

Modelli voluminosi

Da 65B+ o finestre contestuali estese, l'H200 fornisce la larghezza di banda di memoria necessaria per tempi di risposta stabili.

Le risposte alle tue domande

Qual è lo SLA garantito da OVHcloud sulle istanze GPU?

Lo SLA delle istanze GPU prevede una disponibilità mensile del 99,99%. Per maggiori informazioni, consulta le condizioni generali del servizio.

Quale hypervisor viene utilizzato per la virtualizzazione delle istanze?

Le istanze GPU, proprio come le altre, sono virtualizzate dall'hypervisor KVM del kernel Linux.

Cos'è PCI Passthrough?

Le schede con processori grafici sono accessibili tramite il bus PCI del server fisico. PCI Passthrough è una funzionalità dell'hypervisor che permette di dedicare un hardware a una macchina virtuale dando l'accesso direttamente al bus PCI, senza passare per la virtualizzazione.

È possibile ridimensionare un'istanza Cloud GPU?

Sì, le istanze Cloud GPU possono evolversi verso un modello superiore dopo un riavvio, ma non passare a un modello inferiore.

Le istanze Cloud GPU usufruiscono di una protezione anti-DDoS?

Sì, il nostro sistema anti-DDoS è incluso su tutte le soluzioni OVHcloud, senza costi aggiuntivi.

È possibile modificare la fatturazione di un'istanza da mensile a oraria?

Se è attivo il forfait mensile, non è possibile passare a una fatturazione oraria. Prima di avviare l'istanza è quindi importante selezionare con la massima attenzione la modalità di fatturazione più adatta al proprio progetto.

Cos'è il Cloud GPU?

Cloud GPU indica un servizio di calcolo nel cloud che fornisce unità di elaborazione grafica (GPU) per l'esecuzione di attività che hanno bisogno di una grande potenza di calcolo. Queste attività possono includere rendering grafico, apprendimento automatico, analisi dei dati e simulazioni scientifiche. A differenza delle GPU on site, che richiedono un investimento importante in hardware, le Cloud GPU offrono una certa flessibilità e scalabilità. Gli utenti possono così accedere on demand a risorse di calcolo ad alte prestazioni e pagare solo ciò che utilizzano.

Cos'è un server H100 e A100?

I server dotati di GPU NVIDIA H100 e A100 sono sistemi progettati per fornire prestazioni eccezionali nei settori del calcolo ad alte prestazioni (HPC), dell'Intelligenza Artificiale (IA) e dell'analisi dei dati.

Cos'è NGC?

NVIDIA GPU Cloud (NGC) è una piattaforma di cloud computing proposta da NVIDIA. Fornisce un catalogo completo di software ottimizzati per l'accelerazione tramite GPU per l'Intelligenza Artificiale (IA), l'apprendimento automatico (ML) e i calcoli ad alte prestazioni (HPC). NGC mira a semplificare e accelerare il deploy delle applicazioni di IA e di calcolo scientifico fornendo container, modelli pre-addestrati, SDK e altri strumenti ottimizzati per sfruttare appieno le GPU NVIDIA.

Perché utilizzare un Cloud GPU?

L'utilizzo di un Cloud GPU presenta numerosi vantaggi, in particolare per aziende, ricercatori e sviluppatori che si muovono in domini esigenti come Intelligenza Artificiale (IA), rendering grafico, apprendimento automatico (ML) e calcolo ad alte prestazioni (HPC).