Instâncias GPU H100
Acelere os seus projetos IA com as instâncias GPU H100
Desempenhos de ponta para o treino, a inferência e as cargas de trabalho de dados mais exigentes — numa cloud europeia, fiável e transparente.
Porquê escolher os GPU NVIDIA H100?
Poderosos
Até 4× mais rápidos que os A100 para o treino de modelos IA complexos e a geração de conteúdos.
Eficientes.
O Transformer Engine FP8 otimiza o cálculo para os LLM e GenAI, oferecendo um ganho significativo de desempenho e energia.
compatibles
Totalmente compatíveis com CUDA, PyTorch, TensorFlow e JAX: explore as suas otimizações existentes sem adaptação.
Soberano
Disponíveis no nosso Public Cloud, garantindo flexibilidade, transparência e conformidade europeia.
Otimizado para as suas cargas de trabalho IA & Data
Treino e inferência de LLM
Acelere os seus modelos até 70B de parâmetros (Llama 2, Mistral, Falcon, etc.) graças à potência do Transformer Engine e à largura de banda de memória do H100.
IA multimodal
Crie, treine e implemente os seus modelos de geração de imagens, de áudio e de vídeo em grande escala com toda a fluidez.
Data Science & HPC
Otimize os seus cálculos intensivos: simulações, modelização científica, ou tratamento paralelo massivo — com performances constantes e uma baixa latência.
ESPECIFICAÇÕES
Características técnicas
GPU
De 1 a 4 GPU por instância
Memória GPU
80 GB de HBM3 ultrarrápida por GPU
Armazenamento eficiente
NVMe Passthrough local na maioria das instâncias
Rede pública e privada
Até 25 Gbps incluídos
Automatização
Gestão através da Área de Cliente, API, OVHcloud CLI, ...
Seguro e Privado
Certificações ISO27001, SOC, Dados de saúde, etc.
Maximize o seu ROI com uma infraestrutura GPU flexível
Transparência tarifária
Pague apenas os recursos que utiliza, sem custos ocultos. Pode manter o controlo dos seus custos e usufruir de desempenhos ótimos.
Escalabilidade instantânea
Aumente ou reduza os seus recursos GPU on demand, em apenas alguns cliques. Adapte as suas capacidades às suas cargas de trabalho IA e dados com toda a simplicidade.
Soberania e conformidade
Os seus dados são alojados numa cloud europeia certificada, que garante segurança, transparência e respeito das regulamentações (RGPD, ISO, HDS).
Acessibilidade sem barreiras à entrada
Desde GPU H100 acessíveis a todos: desde a prova de conceito até à implementação em produção, sem compromisso de volume nem constrangimentos materiais.
Como escolher o seu GPU para fazer a inferência?
Modelos compactos
Até 7B de parâmetros, um A100 oferece uma excelente relação performance/preço.
LLM intermediários
Até 30B, o H100 é o melhor equilíbrio entre velocidade, eficiência energética e compatibilidade framework.
Modelos grandes
De 65B+ ou janelas contextuais estendidas, o H200 traz a largura de banda de memória necessária para tempos de resposta estáveis.
Configure as suas instâncias GPU
Respostas a questões frequentes
Qual é o SLA garantido pela OVHcloud numa instância GPU?
O SLA é de 99,99% de disponibilidade mensal nas instâncias GPU. Para mais informações, consulte as condições gerais de venda.
Qual é o hipervisor utilizado para a virtualização das instâncias?
Tal como as outras instâncias, as instâncias GPU são virtualizadas pelo hipervisor KVM do kernel Linux.
O que é o PCI Passthrough?
As placas com processadores gráficos são servidas através do bus PCI do servidor físico. O PCI Passthrough é uma funcionalidade do hipervisor que permite dedicar um hardware a uma máquina virtual ao dar diretamente acesso ao bus PCI sem passar pela virtualização.
É possível redimensionar uma instância Cloud GPU?
Sim, as instâncias Cloud GPU podem passar para um modelo superior após uma reinicialização. No entanto, não têm capacidade para evoluir para um modelo inferior.
As instâncias Cloud GPU beneficiam de uma proteção Anti-DDoS?
Sim, a nossa proteção Anti-DDoS está incluída em todas as soluções da OVHcloud, sem custos adicionais.
É possível migrar uma instância atualmente faturada mensalmente para uma faturação à hora?
Se tiver sido escolhida uma faturação mensal, não é possível mudar para uma faturação à hora. Antes de iniciar a instância, escolha cuidadosamente o método de faturação mais adequado ao seu projeto.
O que é uma Cloud GPU?
Uma Cloud GPU designa um serviço de cálculo na cloud que fornece unidades de tratamento gráfico (GPU) para a execução de tarefas que requerem uma grande potência de cálculo. Estas tarefas podem incluir renderização gráfica, aprendizagem automática, análise de dados e simulações científicas. Ao contrário das GPU locais, que exigem um grande investimento em termos de hardware, as Cloud GPU oferecem uma certa flexibilidade e escalabilidade. Desta forma, os utilizadores podem aceder, a pedido, a recursos de cálculo de alto desempenho e pagar apenas por aquilo que usam.
O que é um servidor H100 e A100?
Os servidores equipados com GPU NVIDIA H100 e A100 são sistemas concebidos para fornecer desempenhos excecionais nos domínios da computação de alto desempenho (HPC), da inteligência artificial (IA) e da análise de dados.
O que é a NGC?
A NVIDIA Cloud GPU (NGC) é uma plataforma de cloud computing oferecida pela NVIDIA, que fornece um catálogo completo de programas otimizados para a aceleração por GPU destinados à inteligência artificial (IA), à aprendizagem automática (ML) e aos cálculos de alto desempenho (HPC). A NGC visa simplificar e acelerar a implementação das aplicações de IA e de cálculo científico, disponibilizando containers, modelos pré-treinados, SDK e outras ferramentas otimizadas para tirar o máximo proveito das GPU NVIDIA.
Porquê utilizar uma Cloud GPU?
A utilização de uma Cloud GPU apresenta numerosas vantagens, nomeadamente para as empresas, os investigadores e os programadores, em domínios exigentes como a inteligência artificial (IA), a renderização gráfica, a aprendizagem automática (ML) e o cálculo de alto desempenho (HPC).