Question 1

Welche DGX-Modelle warten Sie?

Accepted Answer

Aktuelle DGX-Familie: DGX A100 (Ampere-Generation, 320GB-Variante mit 8x A100 40GB und 640GB-Variante mit 8x A100 80GB), DGX H100 (Hopper, 8x H100 SXM5 80GB), DGX H200 (Hopper-Refresh, 8x H200 141GB), DGX GH200 (Grace Hopper, 256x GH200 Superchips mit 144TB Memory) und DGX GB200 NVL72 (Grace Blackwell, 72x B200 GPU plus 36x Grace, Liquid-Cooled Rack-Scale). Inklusive aller GPU-Boards, NVLink/NVSwitch-Module, Power Supplies, Cooling-Loop (GB200) und Networking-Modules. Für ältere DGX-1/-2 haben wir einen separaten Spoke (DGX Legacy).

Question 2

Was kostet TPM für DGX im Vergleich zu NVIDIA-Support?

Accepted Answer

30 bis 60 Prozent Ersparnis. Konkret: DGX A100 640GB mit 24×7×4 kostet bei NVIDIA-Premium-Support typisch 30.000-45.000 Euro pro Jahr, bei TechCare 12.000-19.000 Euro. DGX H100 entsprechend 38.000-60.000 Euro NVIDIA, 15.000-25.000 Euro TechCare. DGX H200 ähnlich, leicht höher. DGX GH200 75.000-120.000 Euro NVIDIA, 30.000-50.000 Euro TechCare. DGX GB200 NVL72 (mit 3 Mio EUR Hardware-Wert) 450.000-750.000 Euro NVIDIA-Premium, mit TechCare 180.000-320.000 Euro. Bei einem 8-Box-DGX-H100-Cluster: 300-480k Euro NVIDIA, 120-200k TechCare. Differenz: 180-280k Euro pro Jahr.

Question 3

Funktionieren CUDA, AI Enterprise und Base Command Manager weiter ohne NVIDIA-Vertrag?

Accepted Answer

Ja. CUDA-Toolkit, GPU-Treiber und alle DGX-OS-Funktionen laufen lizenzfrei auf der Hardware weiter — alle AI-Workloads (PyTorch, TensorFlow, Triton Inference, NeMo) bleiben funktional. NVIDIA AI Enterprise als Software-Subscription läuft separat von Hardware-Wartung — wer die Subscription aktiv nutzt, behält sie bei NVIDIA. Base Command Manager (BCM, Cluster-Orchestrierung) ist Subscription-basiert und unabhängig vom Wartungsvertrag. CUDA-Updates und neuere GPU-Treiber-Versionen sind frei verfügbar von NVIDIA — TPM-Kunden können sie ohne Einschränkung herunterladen. Firmware-Updates auf NVSwitch/BMC brauchen aktiven NVIDIA-Vertrag, sind aber bei stabilen AI-Workloads typisch unkritisch.

Question 4

Wie ist die Komponenten-Verfügbarkeit für DGX-Hardware?

Accepted Answer

Strukturell schwächer als bei Standard-Servern, aber mit gezieltem Component-Pool-Aufbau adressiert. DGX-Hardware ist proprietär — NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery-Boards. Wir halten Replacement-GPU-Boards, NVSwitch-Module, Power Supplies und Networking-Module für DGX A100/H100/H200 vor. Bei sehr neuen Generationen (GH200, GB200) ist die Pool-Tiefe begrenzt, dort empfehlen wir Hybrid-Setups: TPM für Standard-Komponenten (Power Supplies, Fans, Storage) plus selektive NVIDIA-Subscription für GPU-Board-Coverage. Bei Vertragsabschluss erstellen wir eine Risiko-Bewertung pro DGX-Modell — bei kritischen Workloads empfehlen wir On-Site-Spare-Komponenten (im Vertrag verhandelbar).

Question 5

Welche SLA-Stufen empfehlen Sie für DGX?

Accepted Answer

DGX in produktiven AI-Training-Workloads: 24×7×4 mit deutschsprachigem Onsite-Engineer ist Standard. AI-Training-Jobs sind oft mehrtägig — Outage einer DGX-Box mitten in einem Training-Run bedeutet Verlust des Trainings-Fortschritts und ggf. Datenverlust. Bei AI-Inference-Production-Workloads (Customer-Facing-LLMs, Computer-Vision-Pipelines) ist 24×7×4 zwingend wegen direkter Service-Auswirkung. Bei DGX in Test/Dev-Umgebungen oder als Backup-Compute kann 5×9 NBD wirtschaftlich sein. DGX GB200 NVL72 als Liquid-Cooled-Rack-Scale-System: 24×7×4 zwingend wegen Cooling-Loop-Komplexität — Cooling-Failure hat hohe Auswirkungen.

Question 6

Wann ist der natürliche Einstiegspunkt für TPM bei DGX?

Accepted Answer

Werksgarantie-Auslauf. NVIDIA-Werksgarantie für DGX läuft typisch 1-3 Jahre, je nach Vertrag. Konkret: DGX A100-Bestände aus 2020-2022 sind seit 2023+ aus der Werksgarantie und der natürliche TPM-Einstiegspunkt. DGX H100 aus 2022-2023 wird ab 2025-2026 aus der Werksgarantie laufen. DGX H200/GH200/GB200 sind aktuell — TPM ist hier 1-3 Jahre voraus zu planen. Wir empfehlen: Bestandsaufnahme 6 Monate vor Werksgarantie-Auslauf, TPM-Vertrag ab Tag 1 nach Garantie-Ende — keine Lücke, keine NVIDIA-Standard-Support-Verlängerung zum vollen Preis als Brücke.

Question 7

Können wir DGX-Wartung mit Mellanox-Networking im selben Vertrag haben?

Accepted Answer

Ja. Multi-Class-NVIDIA-Verträge sind für AI-Cluster-Builds besonders relevant — DGX-AI-Compute braucht Mellanox-Networking-Backend (Spectrum Ethernet oder Quantum InfiniBand) plus ConnectX-Adapter und ggf. BlueField DPUs. Wir bieten alle vier NVIDIA-Klassen (DGX, Mellanox-Adapter, Mellanox-Switching, plus DGX Legacy) in einem Vertrag, ein Ansprechpartner, ein SLA-Report-Set. Plus alle anderen Hersteller (Supermicro AI-Server, Dell PowerEdge GPU-Knoten, HPE Apollo) im gleichen Konstrukt.

Question 8

Wie schnell bekommen wir ein Angebot?

Accepted Answer

48 Stunden nach Eingang Ihrer Bestandsliste mit Modell, GPU-Konfiguration, Werksgarantie-Status und Seriennummer.

Modellfamilie	Markteinführung	OEM-Support endet	TPM-Status
DGX A100 320GB	2020	ca. 2028+	Unterstützt
DGX A100 640GB	2020	ca. 2028+	Unterstützt
DGX H100	2022	ca. 2030+	Unterstützt
DGX H200	2024	ca. 2031+	Unterstützt
DGX GH200	2024	ca. 2031+	Unterstützt
DGX GB200 NVL72	2024–2025	ca. 2032+	Unterstützt

NVIDIA DGX Wartung — vendor-unabhängiger Service für DGX A100 bis GB200

Welche DGX-Modelle wir warten

Warum TPM-Wartung für NVIDIA DGX

Generations-Timeline & TPM-Abdeckung

Generations-Status der DGX-Linie

Was wir konkret leisten

Original-Komponenten

DGX-Spezialist-Engineer

Flexible SLA pro System

Multi-Vendor-Vertrag

Risiko-Assessment

CUDA & AI-Software bleiben

TechCare vs. NVIDIA DGX A100 / H100 / H200 / GH200 / GB200

Häufige Fragen zur DGX-Wartung

Echte Ist-Werte Q1 2026 — direkt aus unserem ITIL-Ticketing.

NVIDIA DGX A100 / H100 / H200 / GH200 / GB200 sparen ohne Risiko

Andere NVIDIA-Modelle und Service