Instancias GPU H100

¿Por qué elegir los GPU NVIDIA H100?

Potentes

Hasta 4 veces más rápidos que los A100 para el entrenamiento de modelos de IA complejos y la generación de contenidos.

Eficientes

El Transformer Engine FP8 optimiza el cálculo para los LLM y la GenAI, ofreciendo una mejora significativa en rendimiento y energía.

Compatibles

Totalmente compatibles con CUDA, PyTorch, TensorFlow y JAX. Aprovecha tus optimizaciones existentes sin necesidad de adaptar tu infraestructura.

Soberanas

Disponibles en nuestro Public Cloud, garantizando flexibilidad, transparencia y cumplimiento normativo europeo.

Optimizada para tus cargas de trabajo de IA y datos

Entrenamiento e inferencia de LLM

Acelera tus modelos hasta 70 mil millones de parámetros (Llama 2, Mistral, Falcon, etc.) aprovechando la potencia del Transformer Engine y el ancho de banda de memoria del H100.

IA generativa multimodal

Crea, entrena y despliega tus modelos de generación de imágenes, audio y vídeo a gran escala, con total fluidez.

Data science y computación de alto rendimiento

Optimiza tus cálculos intensivos: simulación, modelado científico o procesamiento paralelo masivo. Todo esto, con un rendimiento constante y baja latencia.

Especificaciones

Características técnicas

GPU

De 1 a 4 GPU por instancia

Memoria GPU

80 GB de HBM3 ultrarrápida por GPU

Almacenamiento potente

Passthrough NVMe local en la mayoría de las instancias

Red pública y privada

Hasta 25 Gb/s incluidos

Automatización

Gestión a través del área de cliente, API, OVHcloud CLI…

Seguro y privado

Certificaciones ISO27001, SOC, alojamiento de datos de salud…

Nuestra gama de Cloud GPU

H200

Hasta un 40 % más rápido que el H100, ideal para LLM de más de 65B.

A100

Excelente equilibrio entre rendimiento, costes y flexibilidad de IA.

V100

GPU fiable para el aprendizaje automático y el cálculo científico.

V100S

Versión mejorada del V100 con mayor ancho de banda y frecuencia.

L40S

Versátil para GenAI multimodal y renderizado 3D avanzado.

L4

Eficiente y económico para la inferencia de IA y el procesamiento de vídeo.

A10

Flexible en IA y gráficos para inferencia y visión por ordenador.

RTX 5000 Quadro

Pensada para el renderizado 3D, la visualización y el diseño profesional.

¿Listo para acelerar tus proyectos de IA?

Cree una cuenta y active sus servicios en cuestión de minutos

¡Disfrute de US$ 200 gratis en su primer proyecto Public Cloud!

Maximiza tu ROI con una infraestructura GPU flexible

Precios transparentes

Paga solo por los recursos que utilizas, sin costes ocultos. Mantén el control de tus costes mientras disfrutas de un rendimiento óptimo.

Escalabilidad instantánea

Aumenta o reduce tus recursos GPU bajo demanda, en unos pocos clics. Adapta tu capacidad a tus cargas de trabajo de IA y datos con facilidad.

Soberanía y cumplimiento normativo

Tus datos se alojan en un cloud europeo certificado, garantizando la seguridad, la transparencia y el cumplimiento de las regulaciones (RGPD, ISO, HDS).

Accesibilidad sin barreras de entrada

GPU H100 accesibles para todos: desde el «proof of concept» hasta el despliegue en producción, sin requerir un volumen mínimo ni restricciones en el hardware.

¿Cómo elegir mi GPU para hacer inferencia?

Modelos compactos

Con hasta 7 mil millones de parámetros, el A100 ofrece una excelente relación rendimiento-precio.

LLM de escala intermedia

Con hasta 30 mil millones de parámetros, el H100 ofrece el mejor equilibrio entre velocidad, eficiencia energética y compatibilidad con «frameworks».

Modelos grandes

Con 65 mil millones o ventanas contextuales ampliadas, el H200 proporciona el ancho de banda de memoria necesario para tiempos de respuesta estables.

Configura tus instancias GPU

Elegir la GPU adecuada para la inferencia de LLM

Descubre cómo definir tu arquitectura GPU para satisfacer las necesidades de modelos de IA.

Descubre las principales diferencias entre nuestras soluciones AI Notebooks, AI Training y AI Deploy

Elige el modelo que mejor se adapta a tus necesidades con nuestra comparativa.

Descubre las principales diferencias entre nuestras soluciones AI Notebooks, AI Training y AI Deploy

Te ayudamos a configurar tu GPU en Managed Kubernetes Service desde el área de cliente y a través de Helm.

FAQ

¿Cuál es el SLA garantizado por OVHcloud en las instancias GPU?

El compromiso de nivel de servicio (SLA) es del 99,99 % de disponibilidad mensual en las instancias GPU. Para más información, consulta las Condiciones Generales de Servicio.

¿Qué hipervisor se utiliza para la virtualización de las instancias?

Al igual que otros modelos, las instancias GPU están virtualizadas mediante el hipervisor KVM del núcleo Linux.

¿Qué es PCI Passthrough?

Las tarjetas con procesadores gráficos son accesibles a través del bus PCI del servidor físico. PCI Passthrough es una funcionalidad del hipervisor que permite dedicar hardware a una máquina virtual, ofreciéndo directamente acceso al bus PCI, sin capa de virtualización.

¿Es posible redimensionar una instancia Cloud GPU?

Sí, es posible migrar una instancia Cloud GPU a un modelo superior tras un reinicio. Sin embargo, no podrás migrar a un modelo inferior.

¿Las instancias Cloud GPU disfrutan de protección anti-DDoS?

Sí, la protección anti-DDoS está incluida en todas las soluciones de OVHcloud sin coste adicional.

¿Es posible pasar de una facturación mensual a una facturación por horas en mi instancia?

Si tienes activada la modalidad de facturación mensual, no podrás pasar a la facturación por horas. Antes de iniciar la instancia, selecciona atentamente el tipo de facturación que mejor se adapta a tu proyecto.

¿Qué son las Cloud GPU?

Las Cloud GPU hacen referencia a un servicio de cálculo en la nube que proporciona unidades de procesamiento gráfico (GPU) para realizar tareas que requieren una gran potencia de cálculo. Estas tareas pueden incluir el renderizado gráfico, el aprendizaje automático, el análisis de datos o las simulaciones científicas, entre otros. A diferencia de las GPU «on-premises», que requieren una gran inversión en hardware, las Cloud GPU ofrecen flexibilidad y escalabilidad. De este modo, los/as usuarios/as pueden acceder a recursos informáticos de alto rendimiento bajo demanda y pagar solo por lo que consumen.

¿Qué son los servidores H100 y A100?

Los servidores equipados con GPU NVIDIA H100 y A100 son sistemas diseñados para ofrecer un rendimiento excepcional en los ámbitos de la computación de alto rendimiento (HPC), la inteligencia artificial (IA) y la analítica de datos.

¿Qué es NGC?

NVIDIA GPU Cloud (NGC) es una plataforma de cloud computing ofrecida por NVIDIA. Esta plataforma proporciona un completo catálogo de programas optimizados para la aceleración por GPU destinados a la inteligencia artificial (IA), el aprendizaje automático (ML) y la computación de alto rendimiento (HPC). El objetivo de NGC es simplificar y acelerar el despliegue de aplicaciones de IA y cálculo científico, proporcionando contenedores, modelos preentrenados, SDK y otras herramientas optimizadas para sacar el máximo partido a las GPU NVIDIA.

¿Por qué utilizar una Cloud GPU?

El uso de un Cloud GPU presenta numerosas ventajas, especialmente para las empresas, los equipos de investigación y desarrollo que trabajan en ámbitos exigentes como la inteligencia artificial (IA), el renderizado gráfico, el aprendizaje automático (ML) y la computación de alto rendimiento (HPC).

Instancias GPU H100

Acelera tus proyectos de IA con las instancias GPU H100

¿Por qué elegir los GPU NVIDIA H100?

Potentes

Eficientes

Compatibles

Soberanas

Optimizada para tus cargas de trabajo de IA y datos

Entrenamiento e inferencia de LLM

IA generativa multimodal

Data science y computación de alto rendimiento

Especificaciones

Características técnicas

GPU

Memoria GPU

Almacenamiento potente

Red pública y privada

Automatización

Seguro y privado

Nuestra gama de Cloud GPU

H200

A100

V100

V100S

L40S

L4

A10

RTX 5000 Quadro

¿Listo para acelerar tus proyectos de IA?

Cree una cuenta y active sus servicios en cuestión de minutos

Maximiza tu ROI con una infraestructura GPU flexible

Precios transparentes

Escalabilidad instantánea

Soberanía y cumplimiento normativo

Accesibilidad sin barreras de entrada

¿Cómo elegir mi GPU para hacer inferencia?

Modelos compactos

LLM de escala intermedia

Modelos grandes

Configura tus instancias GPU

Elegir la GPU adecuada para la inferencia de LLM

Descubre las principales diferencias entre nuestras soluciones AI Notebooks, AI Training y AI Deploy

Descubre las principales diferencias entre nuestras soluciones AI Notebooks, AI Training y AI Deploy

FAQ

¿Cuál es el SLA garantizado por OVHcloud en las instancias GPU?

¿Qué hipervisor se utiliza para la virtualización de las instancias?

¿Qué es PCI Passthrough?

¿Es posible redimensionar una instancia Cloud GPU?

¿Las instancias Cloud GPU disfrutan de protección anti-DDoS?

¿Es posible pasar de una facturación mensual a una facturación por horas en mi instancia?

¿Qué son las Cloud GPU?

¿Qué son los servidores H100 y A100?

¿Qué es NGC?

¿Por qué utilizar una Cloud GPU?