Istanze GPU L4
Distribuisci i tuoi workload di inferenza e grafica con le GPU NVIDIA L4
Una performance ottimale per l'inferenza IA, l'elaborazione video e il rendering 3D — in un cloud europeo, affidabile e trasparente.
Perché scegliere le GPU NVIDIA L4?
Economiche
Un eccellente rapporto qualità/prezzo per distribuire l'inferenza IA e l'elaborazione video su larga scala.
Ottimizzato
Descrizione: Ideali per l'inferenza di modelli compatti (fino a 7B) e i workload multimediali.
Sostenibili
Un'impronta di carbonio ridotta e un costo controllato.
Sovrano
Disponibili nel nostro Public Cloud, garantendo flessibilità, trasparenza e conformità europea.
Ottimizzato per i vostri carichi di lavoro di inferenza e grafica
Inferenza IA su larga scala
Distribuite i vostri modelli di visione, NLP o classificazione su GPU economici.
Elaborazione e streaming video
Godetevi la codifica/decodifica AV1, HEVC e H.264 hardware, ideale per il transcodifica, la rilevazione di oggetti o lo streaming dal vivo.
Creazione e IA generativa leggera
Genera visivi, avatar o contenuti multimediali tramite la potenza grafica Ada Lovelace, mantenendo un'impronta energetica minima.
SPECIFICHE
Caratteristiche tecniche
GPU
Da 1 a 4 GPU per istanza
Memoria GPU
24 GB per GPU
Storage performante
NVMe locale sulla maggior parte delle istanze
Rete pubblica e privata
Fino a 25 Gbps inclusi
Automazione
Gestione tramite il vostro spazio cliente, API, OVHcloud CLI, ...
Sicuro e privato
Certificazioni ISO 27001, SOC, dati sanitari, etc.
Massimizza il tuo ROI con un'infrastruttura GPU flessibile
Trasparenza dei prezzi
Approfitta della GPU più economica della gamma, perfetta per l'inferenza IA e il video.
Versatilità IA & grafica
Sfrutta un'unica GPU per i tuoi carichi di lavoro di GenAI, rendering 3D e inferenza IA — una flessibilità unica per le tue pipeline di produzione.
Sovranità e conformità
I tuoi dati sono ospitati su un cloud europeo certificato, garantendo sicurezza, trasparenza e conformità alle normative (GDPR, ISO, HDS).
Accessibilità totale
GPU L4 disponibili senza vincoli di impegno, per accelerare i vostri progetti IA e multimediali su larga scala.
Come scegliere la propria GPU per fare inferenza?
Inferenza leggera
L4: economico e a basso consumo energetico.
Modelli voluminosi
A100 / H100 / H200 a seconda delle tue esigenze di larghezza di banda e prestazioni.
Configura le tue istanze GPU
Le risposte alle tue domande
Qual è lo SLA garantito da OVHcloud sulle istanze GPU?
Lo SLA delle istanze GPU prevede una disponibilità mensile del 99,99%. Per maggiori informazioni, consulta le condizioni generali del servizio.
Quale hypervisor viene utilizzato per la virtualizzazione delle istanze?
Le istanze GPU, proprio come le altre, sono virtualizzate dall'hypervisor KVM del kernel Linux.
Cos'è PCI Passthrough?
Le schede con processori grafici sono accessibili tramite il bus PCI del server fisico. PCI Passthrough è una funzionalità dell'hypervisor che permette di dedicare un hardware a una macchina virtuale dando l'accesso direttamente al bus PCI, senza passare per la virtualizzazione.
È possibile ridimensionare un'istanza Cloud GPU?
Sì, le istanze Cloud GPU possono evolversi verso un modello superiore dopo un riavvio, ma non passare a un modello inferiore.
Le istanze Cloud GPU usufruiscono di una protezione anti-DDoS?
Sì, il nostro sistema anti-DDoS è incluso su tutte le soluzioni OVHcloud, senza costi aggiuntivi.
È possibile modificare la fatturazione di un'istanza da mensile a oraria?
Se è attivo il forfait mensile, non è possibile passare a una fatturazione oraria. Prima di avviare l'istanza è quindi importante selezionare con la massima attenzione la modalità di fatturazione più adatta al proprio progetto.
Cos'è il Cloud GPU?
Cloud GPU indica un servizio di calcolo nel cloud che fornisce unità di elaborazione grafica (GPU) per l'esecuzione di attività che hanno bisogno di una grande potenza di calcolo. Queste attività possono includere rendering grafico, apprendimento automatico, analisi dei dati e simulazioni scientifiche. A differenza delle GPU on site, che richiedono un investimento importante in hardware, le Cloud GPU offrono una certa flessibilità e scalabilità. Gli utenti possono così accedere on demand a risorse di calcolo ad alte prestazioni e pagare solo ciò che utilizzano.
Cos'è un server H100 e A100?
I server dotati di GPU NVIDIA H100 e A100 sono sistemi progettati per fornire prestazioni eccezionali nei settori del calcolo ad alte prestazioni (HPC), dell'Intelligenza Artificiale (IA) e dell'analisi dei dati.
Cos'è NGC?
NVIDIA GPU Cloud (NGC) è una piattaforma di cloud computing proposta da NVIDIA. Fornisce un catalogo completo di software ottimizzati per l'accelerazione tramite GPU per l'Intelligenza Artificiale (IA), l'apprendimento automatico (ML) e i calcoli ad alte prestazioni (HPC). NGC mira a semplificare e accelerare il deploy delle applicazioni di IA e di calcolo scientifico fornendo container, modelli pre-addestrati, SDK e altri strumenti ottimizzati per sfruttare appieno le GPU NVIDIA.
Perché utilizzare un Cloud GPU?
L'utilizzo di un Cloud GPU presenta numerosi vantaggi, in particolare per aziende, ricercatori e sviluppatori che si muovono in domini esigenti come Intelligenza Artificiale (IA), rendering grafico, apprendimento automatico (ML) e calcolo ad alte prestazioni (HPC).