Instâncias GPU H100

Porquê escolher os GPU NVIDIA H100?

Potentes

Até 4 vezes mais rápidos do que os A100 para o treino de modelos IA complexos e a geração de conteúdos.

Eficientes

O Transformer Engine FP8 otimiza o cálculo para LLM e GenAI, oferecendo um ganho significativo em termos de desempenho e energia.

Compatíveis

Totalmente compatíveis com CUDA, PyTorch, TensorFlow e JAX. Explore otimizações existentes sem necessidade de adaptação.

Soberanos

Disponíveis no nosso Public Cloud, garantindo flexibilidade, transparência e conformidade europeia.

Otimização para cargas de trabalho de dados e IA

Treino e inferência de LLM

Acelere os seus modelos até 70 B de parâmetros (Llama 2, Mistral, Falcon, etc.), graças à potência do Transformer Engine e à largura de banda de memória do H100.

IA generativa multimodal

Crie, treine e implemente os seus modelos de geração de imagens, áudio e vídeo em grande escala com toda a fluidez.

Data Science e computação de alto desempenho

Otimize os seus cálculos intensivos: simulação, modelização científica ou processamento paralelo maciço. Tudo isto com desempenhos constantes e uma latência reduzida.

Características

Características técnicas

GPU

De 1 a 4 GPU por instância

Memória GPU

80 GB de HBM3 ultraveloz por GPU

Armazenamento eficiente

Passthrough NVMe local na maioria das instâncias

Rede pública e privada

Até 25 Gbps incluídos

Automatização

Gestão através da Área de Cliente, API, OVHcloud CLI, etc.

Segurança e privacidade

Certificações ISO27001, SOC, alojamento de dados de saúde, etc.

A nossa gama Cloud GPU

H200

Até 1,4 vezes mais veloz do que o H100. Ideal para os LLM 65B+.

A100

Excelente equilíbrio entre desempenho, custo e flexibilidade IA.

V100

GPU fiável para o machine learning e para o cálculo científico.

V100S

Versão melhorada do V100, com largura de banda e frequência acrescidas.

L40S

Versátil para GenAI multimodal e renderização 3D avançada.

L4

Eficiente e económico para a inferência IA e o processamento de vídeo.

A10

Polivalência IA + grafismo para inferência e visão por computador.

RTX 5000 Quadro

Pensado para renderização 3D, visualização e design profissional.

Pronto para acelerar os seus projetos IA?

Crie uma conta e lance os seus serviços imediatamente

Beneficie de 200 € oferecidos no seu primeiro projeto Public Cloud

Maximize o seu ROI com uma infraestrutura GPU flexível

Faturação transparente

Pague apenas pelos recursos que usa, sem custos ocultos. Mantenha o controlo de custos ao mesmo tempo que usufrui de desempenhos máximos.

Escalabilidade instantânea

Em apenas alguns cliques, aumente ou reduza os recursos GPU a pedido. Adapte as capacidades às cargas de trabalho de dados e IA com toda a simplicidade.

Soberania e conformidade

Os seus dados são alojados numa cloud europeia certificada, garantindo segurança, transparência e respeito das regulamentações (RGPD, ISO, HDS).

Acessibilidade sem barreiras à entrada

GPU H100 acessíveis a todos: da prova de conceito à implementação em produção, sem compromissos de volume nem constrangimentos de hardware.

Como escolher um GPU para fazer inferência?

Modelos compactos

Com até 7 B de parâmetros, o A100 oferece uma excelente relação preço/desempenho.

LLM intermédios

Com até 30 B, o H100 oferece o melhor equilíbrio entre velocidade, eficiência energética e compatibilidade de frameworks.

Modelos volumosos

Com 65 B+ ou janelas contextuais alargadas, o H200 traz a largura de banda de memória necessária para tempos de resposta estáveis.

Configure as suas instâncias GPU

Escolher um GPU para a inferência de LLM

Saiba como definir a sua arquitetura GPU para responder às necessidades dos modelos de IA.

Descubra as principais diferenças entre as nossas soluções AI Notebooks, AI Training e AI Deploy

Consulte o quadro comparativo e escolha a que melhor se adequa às suas necessidades.

Descubra as principais diferenças entre as nossas soluções AI Notebooks, AI Training e AI Deploy

Acompanhamo-lo na implementação da sua GPU no Managed Kubernetes a partir da Área de Cliente e via Helm.

Respostas a questões frequentes

Que compromisso de nível de serviço (SLA) é garantido pela OVHcloud numa instância GPU?

O compromisso de nível de serviço (SLA) é de 99,99% de disponibilidade mensal nas instâncias GPU. Para mais informações, consulte as Condições Gerais de Serviço.

Qual é o hipervisor utilizado para a virtualização das instâncias?

Tal como as outras instâncias, as instâncias GPU são virtualizadas pelo hipervisor KVM do kernel Linux.

O que é o PCI Passthrough?

As placas com processadores gráficos são servidas através do bus PCI do servidor físico. O PCI Passthrough é uma funcionalidade do hipervisor que permite dedicar um hardware a uma máquina virtual ao dar diretamente acesso ao bus PCI sem passar pela virtualização.

É possível redimensionar uma instância Cloud GPU?

Sim, as instâncias Cloud GPU podem passar para um modelo superior após uma reinicialização. No entanto, não têm capacidade para evoluir para um modelo inferior.

As instâncias Cloud GPU beneficiam de uma proteção Anti-DDoS?

Sim, a nossa proteção Anti-DDoS está incluída em todas as soluções da OVHcloud, sem custos adicionais.

É possível migrar uma instância atualmente faturada mensalmente para uma faturação à hora?

Se tiver sido escolhida uma faturação mensal, não é possível mudar para uma faturação à hora. Antes de iniciar a instância, escolha cuidadosamente o método de faturação mais adequado ao seu projeto.

O que é uma Cloud GPU?

Uma Cloud GPU designa um serviço de cálculo na cloud que fornece unidades de tratamento gráfico (GPU) para a execução de tarefas que requerem uma grande potência de cálculo. Estas tarefas podem incluir renderização gráfica, aprendizagem automática, análise de dados e simulações científicas. Ao contrário das GPU locais, que exigem um grande investimento em termos de hardware, as Cloud GPU oferecem uma certa flexibilidade e escalabilidade. Desta forma, os utilizadores podem aceder, a pedido, a recursos de cálculo de alto desempenho e pagar apenas por aquilo que usam.

O que é um servidor H100 e A100?

Os servidores equipados com GPU NVIDIA H100 e A100 são sistemas concebidos para fornecer desempenhos excecionais nos domínios da computação de alto desempenho (HPC), da inteligência artificial (IA) e da análise de dados.

O que é a NGC?

O NVIDIA Cloud GPU (NGC) é uma plataforma de cloud computing disponibilizada pela NVIDIA, que fornece um catálogo completo de programas otimizados para a aceleração por GPU e destinados à inteligência artificial (IA), ao machine learning (ML) e ao cálculo de alto desempenho (HPC). A NGC visa simplificar e acelerar a implementação das aplicações de IA e de cálculo científico, disponibilizando containers, modelos pré-treinados, SDK e outras ferramentas otimizadas para tirar o máximo proveito das GPU NVIDIA.

Porquê utilizar uma Cloud GPU?

A utilização de um Cloud GPU apresenta numerosas vantagens, nomeadamente para as empresas, os investigadores e os programadores, em domínios exigentes como a inteligência artificial (IA), a renderização gráfica, o machine learning (ML) e o cálculo de alto desempenho (HPC).

Instâncias GPU H100

Acelere os seus projetos IA com as instâncias GPU H100

Porquê escolher os GPU NVIDIA H100?

Potentes

Eficientes

Compatíveis

Soberanos

Otimização para cargas de trabalho de dados e IA

Treino e inferência de LLM

IA generativa multimodal

Data Science e computação de alto desempenho

Características

Características técnicas

GPU

Memória GPU

Armazenamento eficiente

Rede pública e privada

Automatização

Segurança e privacidade

A nossa gama Cloud GPU

H200

A100

V100

V100S

L40S

L4

A10

RTX 5000 Quadro

Pronto para acelerar os seus projetos IA?

Crie uma conta e lance os seus serviços imediatamente

Maximize o seu ROI com uma infraestrutura GPU flexível

Faturação transparente

Escalabilidade instantânea

Soberania e conformidade

Acessibilidade sem barreiras à entrada

Como escolher um GPU para fazer inferência?

Modelos compactos

LLM intermédios

Modelos volumosos

Configure as suas instâncias GPU

Escolher um GPU para a inferência de LLM

Descubra as principais diferenças entre as nossas soluções AI Notebooks, AI Training e AI Deploy

Descubra as principais diferenças entre as nossas soluções AI Notebooks, AI Training e AI Deploy

Respostas a questões frequentes

Que compromisso de nível de serviço (SLA) é garantido pela OVHcloud numa instância GPU?

Qual é o hipervisor utilizado para a virtualização das instâncias?

O que é o PCI Passthrough?

É possível redimensionar uma instância Cloud GPU?

As instâncias Cloud GPU beneficiam de uma proteção Anti-DDoS?

É possível migrar uma instância atualmente faturada mensalmente para uma faturação à hora?

O que é uma Cloud GPU?

O que é um servidor H100 e A100?

O que é a NGC?

Porquê utilizar uma Cloud GPU?