Istanze GPU H100

Perché scegliere le GPU NVIDIA H100?

Potenti

Fino a 4 volte più rapide del modello A100 per l'addestramento di modelli IA complessi e la generazione di contenuti.

Performanti

Il Transformer Engine FP8 ottimizza il calcolo per i LLM e la GenAI, offrendo un miglioramento significativo in termini di prestazioni ed energia.

Compatibili

Totalmente compatibili con CUDA, PyTorch, TensorFlow e JAX. Utilizza le tue ottimizzazioni esistenti senza bisogno di modifiche.

Sovrane

Disponibili nel nostro Public Cloud, che garantisce flessibilità, trasparenza e conformità europea.

Ottimizzata per i tuoi carichi di lavoro di IA e dati

Addestramento e inferenza di LLM

Accelera i tuoi modelli fino a 70 miliardi di parametri (Llama 2, Mistral, Falcon, ecc.) grazie alla potenza del Transformer Engine e alla banda passante della memoria del modello H100.

IA generativa multimodale

Crea, addestra ed esegui i tuoi modelli di generazione di immagini, audio e video su larga scala, con la massima fluidità.

Data science e calcolo ad alte prestazioni

Ottimizza i tuoi calcoli intensivi: simulazione, modellazione scientifica ed elaborazione parallela massiva. Il tutto, con prestazioni costanti e bassa latenza.

Specifiche tecniche

Caratteristiche tecniche

GPU

Da 1 a 4 GPU per istanza

Memoria GPU

80 GB di HBM3 ultrarapida per GPU

Storage performante

Passthrough NVMe locale sulla maggior parte delle istanze

Rete pubblica e privata

Fino a 25 Gbps inclusi

Automazione

Gestione tramite Spazio Cliente, API, CLI OVHcloud…

Sicuro e privato

Certificazioni ISO 27001, SOC, hosting di dati sanitari…

La nostra gamma Cloud GPU

H200

Fino a 1,4 volte più rapido del modello H100. Ideale per LLM con oltre 65 miliardi di parametri.

A100

Equilibrio eccellente tra prestazioni, costo e flessibilità IA.

V100

GPU affidabile per il Machine Learning e il calcolo scientifico.

V100S

Versione potenziata del modello V100 con banda passante e frequenza aumentate.

L40S

Versatilità per GenAI multimodale e rendering 3D avanzato.

L4

Efficiente ed economico per l'inferenza IA e l'elaborazione video.

A10

Versatilità IA + grafica per l'inferenza e la computer vision.

RTX 5000 Quadro

Pensato per il rendering 3D, la visualizzazione e il design professionale.

Pronto ad accelerare i tuoi progetti IA?

Crea un account e attiva i tuoi servizi in un minuto.

Approfitta di 200 € gratis sul tuo primo progetto Public Cloud

Massimizza il tuo ROI con un'infrastruttura GPU flessibile

Trasparenza dei prezzi

Paga esclusivamente per le risorse che utilizzi, senza costi nascosti. Mantieni il controllo dei tuoi costi usufruendo di prestazioni ottimali.

Scalabilità istantanea

Aumenta o riduci le tue risorse GPU on demand e in pochi clic. Adatta la tua capacità ai carichi di lavoro di IA e dati con la massima semplicità.

Sovranità e conformità

I tuoi dati sono ospitati su un cloud europeo certificato che garantisce sicurezza, trasparenza e rispetto delle normative (GDPR, ISO, HDS).

Accessibilità senza barriere d'ingresso

GPU H100 accessibili a tutti: dal proof of concept al deploy in produzione, senza impegno sul volume né limitazioni hardware.

Come scegliere una GPU per effettuare inferenze?

Modelli compatti

Con fino a 7 miliardi di parametri, il modello A100 offre un eccellente rapporto performance/prezzo.

LLM intermedi

Con fino a 30 miliardi di parametri, il modello H100 offre il miglior equilibrio tra velocità, efficienza energetica e compatibilità framework.

Modelli voluminosi

Con oltre 65 miliardi di parametri o finestre contestuali estese, il modello H200 fornisce la banda passante della memoria necessaria per tempi di risposta stabili.

Configura le tue istanze GPU

Scegli la tua GPU per l'inferenza LLM

Scopri come definire la tua architettura GPU per rispondere alle esigenze dei modelli IA.

Scopri le principali differenze tra le nostre soluzioni AI Notebooks, AI Training e AI Deploy

Scegli la soluzione più adatta alle tue esigenze grazie alla tabella comparativa.

Scopri le principali differenze tra le nostre soluzioni AI Notebooks, AI Training e AI Deploy

Ti guidiamo nella configurazione della tua GPU su Managed Kubernetes, dallo Spazio Cliente e via Helm.

Le risposte alle tue domande

Qual è l’accordo sul livello di servizio garantito da OVHcloud per le istanze GPU?

L'accordo sul livello di servizio (SLA) prevede il 99,99% di disponibilità mensile sulle istanze GPU. Per maggiori informazioni è possibile consultare le Condizioni Generali di Servizio.

Quale hypervisor viene utilizzato per la virtualizzazione delle istanze?

Le istanze GPU, proprio come le altre, sono virtualizzate dall'hypervisor KVM del kernel Linux.

Cos'è il PCI Passthrough?

Le schede con processori grafici sono accessibili tramite il bus PCI del server fisico. PCI Passthrough è una funzionalità dell'hypervisor che permette di dedicare un hardware a una macchina virtuale dando l'accesso direttamente al bus PCI, senza passare per la virtualizzazione.

È possibile ridimensionare un'istanza Cloud GPU?

Sì, le istanze Cloud GPU possono evolversi verso un modello superiore dopo un riavvio, ma non passare a un modello inferiore.

Le istanze Cloud GPU usufruiscono di una protezione anti-DDoS?

Sì, il nostro sistema anti-DDoS è incluso su tutte le soluzioni OVHcloud, senza costi aggiuntivi.

È possibile modificare la fatturazione di un'istanza da mensile a oraria?

Se è attivo il forfait mensile, non è possibile passare a una fatturazione oraria. Prima di avviare l'istanza è quindi importante selezionare con la massima attenzione la modalità di fatturazione più adatta al proprio progetto.

Cos'è il Cloud GPU?

Cloud GPU indica un servizio di calcolo nel cloud che fornisce unità di elaborazione grafica (GPU) per l'esecuzione di attività che hanno bisogno di una grande potenza di calcolo. Queste attività possono includere rendering grafico, apprendimento automatico, analisi dei dati e simulazioni scientifiche. A differenza delle GPU on site, che richiedono un investimento importante in hardware, le Cloud GPU offrono una certa flessibilità e scalabilità. Gli utenti possono così accedere on demand a risorse di calcolo ad alte prestazioni e pagare solo ciò che utilizzano.

Cos'è un server H100 e A100?

I server dotati di GPU NVIDIA H100 e A100 sono sistemi progettati per fornire prestazioni eccezionali nei settori del calcolo ad alte prestazioni (HPC), dell'Intelligenza Artificiale (IA) e dell'analisi dei dati.

Cos'è NGC?

NVIDIA GPU Cloud (NGC) è una piattaforma di cloud computing proposta da NVIDIA. Fornisce un catalogo completo di software ottimizzati per l'accelerazione tramite GPU destinati a Intelligenza Artificiale (IA), Machine Learning (ML) e calcolo ad alte prestazioni (HPC). NGC mira a semplificare e accelerare il deploy delle applicazioni di IA e di calcolo scientifico fornendo container, modelli pre-addestrati, SDK e altri strumenti ottimizzati per sfruttare appieno le GPU NVIDIA.

Perché utilizzare una Cloud GPU?

L'utilizzo di Cloud GPU presenta numerosi vantaggi, in particolare per aziende e team di ricerca e sviluppo che si muovono in domini esigenti come Intelligenza Artificiale (IA), rendering grafico, Machine Learning (ML) e calcolo ad alte prestazioni (HPC).

Istanze GPU H100

Accelera i tuoi progetti IA con le istanze GPU H100

Perché scegliere le GPU NVIDIA H100?

Potenti

Performanti

Compatibili

Sovrane

Ottimizzata per i tuoi carichi di lavoro di IA e dati

Addestramento e inferenza di LLM

IA generativa multimodale

Data science e calcolo ad alte prestazioni

Specifiche tecniche

Caratteristiche tecniche

GPU

Memoria GPU

Storage performante

Rete pubblica e privata

Automazione

Sicuro e privato

La nostra gamma Cloud GPU

H200

A100

V100

V100S

L40S

L4

A10

RTX 5000 Quadro

Pronto ad accelerare i tuoi progetti IA?

Crea un account e attiva i tuoi servizi in un minuto.

Massimizza il tuo ROI con un'infrastruttura GPU flessibile

Trasparenza dei prezzi

Scalabilità istantanea

Sovranità e conformità

Accessibilità senza barriere d'ingresso

Come scegliere una GPU per effettuare inferenze?

Modelli compatti

LLM intermedi

Modelli voluminosi

Configura le tue istanze GPU

Scegli la tua GPU per l'inferenza LLM

Scopri le principali differenze tra le nostre soluzioni AI Notebooks, AI Training e AI Deploy

Scopri le principali differenze tra le nostre soluzioni AI Notebooks, AI Training e AI Deploy

Le risposte alle tue domande

Qual è l’accordo sul livello di servizio garantito da OVHcloud per le istanze GPU?

Quale hypervisor viene utilizzato per la virtualizzazione delle istanze?

Cos'è il PCI Passthrough?

È possibile ridimensionare un'istanza Cloud GPU?

Le istanze Cloud GPU usufruiscono di una protezione anti-DDoS?

È possibile modificare la fatturazione di un'istanza da mensile a oraria?

Cos'è il Cloud GPU?

Cos'è un server H100 e A100?

Cos'è NGC?

Perché utilizzare una Cloud GPU?