H100-GPU-Instanzen

Was spricht für die NVIDIA H100-GPUs?

Schnell

Bis zu 4-mal schneller als A100 für das Training komplexer AI-Modelle und die Inhaltserstellung.

Leistungsstark

Die Transformer Engine FP8 optimiert die Berechnung für LLMs und GenAI und bietet einen deutlichen Leistungs- und Energiegewinn.

Kompatibel

Vollständig kompatibel mit CUDA, PyTorch, TensorFlow und JAX. Nutzen Sie Ihre bestehenden Optimierungen, ohne dass Anpassungen erforderlich sind.

Souverän

Verfügbar in unserer Public Cloud, die Flexibilität, Transparenz und europäische Konformität gewährleistet.

Optimiert für Ihre AI- und Daten-Workloads

LLM-Training und -Inferenz

Beschleunigen Sie Ihre Modelle mit bis zu 70 Milliarden Parametern (Llama 2, Mistral, Falcon usw.) dank der Leistung der Transformer Engine und der Speicherbandbreite der H100.

Multimodale generative AI

Erstellen, trainieren und deployen Sie Ihre Modelle zur Generierung von Bildern, Audio und Video im großen Maßstab vollkommen nahtlos.

Data Science und High Performance Computing

Optimieren Sie Ihre intensiven Berechnungen: Simulation, wissenschaftliche Modellierung oder Massively Parallel Processing. Alles mit konstanter Leistung und niedriger Latenz.

Spezifikationen

Technische Eigenschaften

GPU

1 bis 4 GPUs pro Instanz

GPU-Speicher

80 GB ultraschneller HBM3 pro GPU

Leistungsfähiger Storage

Lokaler NVMe-Passthrough bei den meisten Instanzen

Öffentliches und privates Netzwerk

Bis zu 25 Gbit/s inklusive

Automatisierung

Verwaltung über Ihr Kundencenter, API, OVHcloud CLI …

Abgesichert und privat

Verschiedene Zertifizierungen: ISO27001, SOC, HDS …

Unsere Cloud-GPU-Reihe

H200

Bis zu 1,4-mal schneller als H100. Ideal für LLMs mit über 65 Milliarden Parametern.

A100

Ein hervorragendes Preis-Leistungs-Verhältnis, gepaart mit AI-Flexibilität.

V100

Zuverlässige GPU für Machine Learning und wissenschaftliches Rechnen.

V100S

Eine verstärke Version der V100 mit erhöhter Bandbreite und Frequenz.

L40S

Vielseitig für multimodale GenAI und erweitertes 3D-Rendering.

L4

Effizient und sparsam für die AI-Inferenz und Videoverarbeitung.

A10

Vielseitigkeit im Bereich AI und Grafik für Inferenz und Computer Vision.

RTX 5000 Quadro

Für das 3D-Rendering, die Visualisierung und professionelles Designen konzipiert.

Bereit, Ihre KI-Projekte zu beschleunigen?

Account erstellen und im Handumdrehen Dienste starten

Wir bieten Ihnen 200 € Gratis-Guthaben für Ihr erstes Public-Cloud-Projekt.

Mit einer flexiblen GPU-Infrastruktur Ihren ROI maximieren

Preistransparenz

Zahlen Sie nur für die Ressourcen, die Sie nutzen, ohne versteckte Kosten. Sie behalten die Kontrolle über Ihre Kosten und profitieren gleichzeitig von optimaler Leistung.

Sofortige Skalierbarkeit

Erhöhen oder reduzieren Sie Ihre GPU-Ressourcen nach Bedarf, mit nur wenigen Klicks. Passen Sie Ihre Kapazität ganz einfach an Ihre AI- und Daten-Workloads an.

Souveränität und Konformität

Ihre Daten werden in einer zertifizierten europäischen Cloud gehostet, die Sicherheit, Transparenz und die Einhaltung von Vorschriften (DSGVO, ISO, HDS) gewährleistet.

Zugang ohne Hürden

H100-GPUs sind für alle zugänglich: vom Proof of Concept bis hin zur Produktionsbereitstellung, ohne Volumenverpflichtung oder Hardwareeinschränkungen.

Wie wähle ich meine GPU für die Inferenz aus?

Kompakte Modelle

Mit bis zu 7 Milliarden Parametern bietet die A100 ein hervorragendes Preis-Leistungs-Verhältnis.

Intermediäre LLMs

Mit bis zu 30 Milliarden Parametern bietet die H100 das beste Gleichgewicht zwischen Geschwindigkeit, Energieeffizienz und Framework-Kompatibilität.

Große Modelle

Mit mehr als 65 Milliarden Parametern oder erweiterten Kontextfenstern bietet die H200 die erforderliche Speicherbandbreite für stabile Antwortzeiten.

GPU-Instanzen konfigurieren

Ihre GPU für die LLM-Inferenz wählen

Erfahren Sie, wie Sie Ihre GPU-Architektur definieren, um den Anforderungen von AI-Modellen gerecht zu werden.

Die wesentlichen Unterschiede zwischen unseren AI Notebooks, AI Training und AI Deploy Lösungen

Wählen Sie mithilfe der Vergleichstabelle diejenige aus, die am besten zu Ihren Anforderungen passt.

Die wesentlichen Unterschiede zwischen unseren AI Notebooks, AI Training und AI Deploy Lösungen

Wir unterstützen Sie bei der Einrichtung Ihrer GPU auf Managed Kubernetes über Ihr Kundencenter und über Helm.

Häufig gestellte Fragen

Welches Service Level Agreement bietet OVHcloud für eine GPU-Instanz?

Das Service Level Agreement (SLA) sieht 99,99 % monatliche Verfügbarkeit für GPU-Instanzen vor. Weitere Informationen finden Sie in den allgemeinen Nutzungsbedingungen des Dienstes.

Welcher Hypervisor wird für die Virtualisierung der Instanzen verwendet?

Wie alle anderen Instanzen werden auch die GPU-Instanzen über den KVM-Hypervisor des Linux-Kernels virtualisiert.

Was ist PCI Passthrough?

Karten mit Grafikprozessoren sind über den PCI-Bus des physischen Servers erreichbar. PCI Passthrough ist eine Hypervisor-Funktion, mit der Sie Hardware einer virtuellen Maschine zuweisen können, indem Sie direkten Zugriff auf den PCI-Bus gewähren, das heißt ohne dazwischenliegende Virtualisierungsschicht.

Kann ich die Größe einer Cloud-GPU-Instanz ändern?

Ja, Cloud-GPU-Instanzen können nach einem Neustart auf ein höheres Modell umgestellt werden. Es ist jedoch nicht möglich, zu einem niedrigeren Modell zu wechseln.

Verfügen Cloud-GPU-Instanzen über DDoS-Schutz?

Ja, unser DDoS-Schutz ist bei allen OVHcloud Lösungen inklusive – ohne zusätzliche Kosten.

Kann eine monatlich abgerechnete Instanz auf stündliche Abrechnung umgestellt werden?

Ist die monatliche Abrechnung einmal eingerichtet, können Sie nicht zur stündlichen Abrechnung wechseln. Wählen Sie also vor dem Starten der Instanz sorgfältig den für Ihr Projekt am besten geeigneten Abrechnungsmodus aus.

Was ist eine Cloud GPU?

Eine Cloud GPU bezeichnet einen Computing-Dienst in der Cloud, der Grafikprozessoren (GPUs) für die Ausführung von Aufgaben bereitstellt, die eine hohe Rechenleistung erfordern. Zu diesen Aufgaben können grafisches Rendering, maschinelles Lernen, Datenanalysen und wissenschaftliche Simulationen gehören. Im Gegensatz zu On-Premise-GPUs, für die erhebliche Hardwareinvestitionen erforderlich sind, bieten Cloud-GPU-Lösungen eine gewisse Flexibilität und Skalierbarkeit. User können damit on demand auf leistungsstarke Ressourcen zugreifen und zahlen nur für das, was sie verwenden.

Was sind H100- und A100-Server?

Die Server mit NVIDIA H100- und A100-GPU sind für außergewöhnliche Leistung in den Bereichen High Performance Computing (HPC), künstliche Intelligenz (Artificial Intelligence, AI) und Datenanalyse konzipiert.

Was ist NGC?

NVIDIA GPU Cloud (NGC) ist eine von NVIDIA angebotene Cloud-Computing-Plattform. Sie bietet einen umfassenden Katalog an für GPU-Beschleunigung optimierter Software für künstliche Intelligenz (KI, oder Artificial Intelligence, AI), maschinelles Lernen (ML) und High Performance Computing (HPC). NGC zielt darauf ab, die Bereitstellung von AI- und wissenschaftlichen Computing-Anwendungen zu vereinfachen und zu beschleunigen, indem Container, vortrainierte Modelle, SDKs und andere Tools bereitgestellt werden, die allesamt für die Nutzung von NVIDIA-GPUs optimiert sind.

Was spricht für die Verwendung einer Cloud GPU?

Die Verwendung einer Cloud GPU bietet zahlreiche Vorteile, insbesondere für Unternehmen, Forschungs- und Entwicklungsteams in anspruchsvollen Bereichen wie künstliche Intelligenz, grafisches Rendering, maschinelles Lernen und High Performance Computing.

H100-GPU-Instanzen

Mit den H100-GPU-Instanzen Ihre AI-Projekte beschleunigen

Was spricht für die NVIDIA H100-GPUs?

Schnell

Leistungsstark

Kompatibel

Souverän

Optimiert für Ihre AI- und Daten-Workloads

LLM-Training und -Inferenz

Multimodale generative AI

Data Science und High Performance Computing

Spezifikationen

Technische Eigenschaften

GPU

GPU-Speicher

Leistungsfähiger Storage

Öffentliches und privates Netzwerk

Automatisierung

Abgesichert und privat

Unsere Cloud-GPU-Reihe

H200

A100

V100

V100S

L40S

L4

A10

RTX 5000 Quadro

Bereit, Ihre KI-Projekte zu beschleunigen?

Account erstellen und im Handumdrehen Dienste starten

Mit einer flexiblen GPU-Infrastruktur Ihren ROI maximieren

Preistransparenz

Sofortige Skalierbarkeit

Souveränität und Konformität

Zugang ohne Hürden

Wie wähle ich meine GPU für die Inferenz aus?

Kompakte Modelle

Intermediäre LLMs

Große Modelle

GPU-Instanzen konfigurieren

Ihre GPU für die LLM-Inferenz wählen

Die wesentlichen Unterschiede zwischen unseren AI Notebooks, AI Training und AI Deploy Lösungen

Die wesentlichen Unterschiede zwischen unseren AI Notebooks, AI Training und AI Deploy Lösungen

Häufig gestellte Fragen

Welches Service Level Agreement bietet OVHcloud für eine GPU-Instanz?

Welcher Hypervisor wird für die Virtualisierung der Instanzen verwendet?

Was ist PCI Passthrough?

Kann ich die Größe einer Cloud-GPU-Instanz ändern?

Verfügen Cloud-GPU-Instanzen über DDoS-Schutz?

Kann eine monatlich abgerechnete Instanz auf stündliche Abrechnung umgestellt werden?

Was ist eine Cloud GPU?

Was sind H100- und A100-Server?

Was ist NGC?

Was spricht für die Verwendung einer Cloud GPU?