custom background image

Instâncias GPU H200


Acelere os seus projetos IA com as instâncias GPU H200

Desempenhos de ponta para o treino, a inferência e as cargas de trabalho de dados mais exigentes numa cloud europeia, fiável e transparente.

Porquê escolher os GPU NVIDIA H200?

Poderosos

Até 1,4 × mais rápido que o H100 para o treino e inferência de modelos GenAI.

Eficientes.

141 GB de memória HBM3e ultra rápida: 2 × maior largura de banda da memória, ideal para modelos de grandes dimensões.

compatibles

Compatível com H100: tire partido das configurações e otimizações existentes sem uma migração complexa.

Soberano

Disponíveis no nosso Public Cloud, garantindo flexibilidade, transparência e conformidade europeia.

Otimizado para cargas de trabalho IA e dados

LLM em grande escala

Treine e implemente modelos até 175 B de parâmetros (GPT-3, Llama 3, Falcon 180 B) graças aos seus 141 GB de memória HBM3e e a uma largura de banda de 4,8 TB/s.

IA gerativa avançada

Produza texto, imagem, áudio e vídeo com tempos de resposta estáveis, mesmo em contextos longos.

Contexto alargado e RAG

Melhore os seus assistentes IA e chatbots com longas janelas contextuais.

Características

Características técnicas

GPU

De 1 a 8 GPU por instância

Memória GPU

141 GB de HBM3 ultrarrápida por GPU

Armazenamento eficiente

Passthrough NVMe local na maioria das instâncias

Rede pública e privada

Até 25 Gbps incluídos

Automatização

Gestão através da Área de Cliente, API, OVHcloud CLI...

Seguro e Privado

Certificações ISO27001, SOC, alojamento de dados de saúde...

Maximize o seu ROI com uma infraestrutura GPU flexível

Transparência tarifária

Pague apenas os recursos que utiliza, sem custos ocultos. Pode manter o controlo dos seus custos e usufruir de desempenhos ótimos.

Escalabilidade instantânea

Aumente ou reduza os seus recursos GPU on demand, em apenas alguns cliques. Adapte as suas capacidades às suas cargas de trabalho IA e dados com toda a simplicidade.

Soberania e conformidade

Os seus dados são alojados numa cloud europeia certificada, que garante segurança, transparência e respeito das regulamentações (RGPD, ISO, HDS).

Acessibilidade sem barreiras à entrada

Desde GPU H200 acessíveis a todas as pessoas: desde a prova de conceito até à implementação em produção, sem compromisso de volume nem constrangimentos materiais.

Como escolher o seu GPU para fazer a inferência?

Modelos compactos

Até 7B de parâmetros, um A100 oferece uma excelente relação preço/desempenho.

Modelos grandes

De 65 B+ ou janelas contextuais estendidas, o H200 traz a largura de banda de memória necessária para tempos de resposta estáveis.

Respostas a questões frequentes

Que compromisso de nível de serviço (SLA) é garantido pela OVHcloud numa instância GPU?

O compromisso de nível de serviço (SLA) é de 99,99% de disponibilidade mensal nas instâncias GPU. Para mais informações, consulte as Condições Gerais de Serviço.

Qual é o hipervisor utilizado para a virtualização das instâncias?

Tal como as outras instâncias, as instâncias GPU são virtualizadas pelo hipervisor KVM do kernel Linux.

O que é o PCI Passthrough?

As placas com processadores gráficos são servidas através do bus PCI do servidor físico. O PCI Passthrough é uma funcionalidade do hipervisor que permite dedicar um hardware a uma máquina virtual ao dar diretamente acesso ao bus PCI sem passar pela virtualização.

É possível redimensionar uma instância Cloud GPU?

Sim, as instâncias Cloud GPU podem passar para um modelo superior após uma reinicialização. No entanto, não têm capacidade para evoluir para um modelo inferior.

As instâncias Cloud GPU beneficiam de uma proteção Anti-DDoS?

Sim, a nossa proteção Anti-DDoS está incluída em todas as soluções da OVHcloud, sem custos adicionais.

É possível migrar uma instância atualmente faturada mensalmente para uma faturação à hora?

Se tiver sido escolhida uma faturação mensal, não é possível mudar para uma faturação à hora. Antes do arranque da instância, selecione cuidadosamente o modo de faturação mais adaptado ao seu projeto.

O que é uma Cloud GPU?

Uma Cloud GPU designa um serviço de cálculo na cloud que fornece unidades de tratamento gráfico (GPU) para a execução de tarefas que requerem uma grande potência de cálculo. Estas tarefas podem incluir renderização gráfica, aprendizagem automática, análise de dados e simulações científicas. Ao contrário das GPU locais, que exigem um grande investimento em termos de hardware, as Cloud GPU oferecem uma certa flexibilidade e escalabilidade. Desta forma, os utilizadores podem aceder a recursos de cálculo de alta performance mediante pedido e pagar apenas aquilo que utilizam.

O que é um servidor H100 e A100?

Os servidores equipados com GPU NVIDIA H100 e A100 são sistemas concebidos para fornecer desempenhos excecionais nos domínios da computação de alto desempenho (HPC), da inteligência artificial (IA) e da análise de dados.

O que é a NGC?

A NVIDIA Cloud GPU (NGC) é uma plataforma de cloud computing oferecida pela NVIDIA, Ela fornece um catálogo completo de softwares otimizados para a aceleração por GPU destinados à inteligência artificial (IA), ao machine learning (ML) e ao cálculo de alta performance (HPC). A NGC visa simplificar e acelerar a implementação das aplicações de IA e de cálculo científico, disponibilizando containers, modelos pré-treinados, SDK e outras ferramentas otimizadas para tirar o máximo proveito das GPU NVIDIA.

Porquê utilizar uma Cloud GPU?

A utilização de um Cloud GPU apresenta numerosas vantagens, nomeadamente para as empresas, as equipas de investigação e de desenvolvimento que evoluem em domínios exigentes como a inteligência artificial (IA), a representação gráfica, o machine learning (ML) e o cálculo de alta performance (HPC).