+49 6430 9227117
NVIDIA DGX · TPM FÜR AI COMPUTE

NVIDIA DGX Wartung — vendor-unabhängiger Service für DGX A100 bis GB200

Wir warten aktuelle NVIDIA DGX AI-Plattformen herstellerunabhängig — DGX A100 (320GB/640GB), DGX H100, DGX H200, DGX GH200 (Grace Hopper), DGX GB200 NVL72 (Grace Blackwell). Mit Original-Komponenten aus eigenem Lager und zertifizierten Refurbishing-Quellen, SLA bis 24×7×4. NVIDIA-Werksgarantie und Standard-Support sind die teuersten OEM-Wartungs-Modelle im Datacenter — typisch 15 bis 25 Prozent des Hardware-Werts pro Jahr. TPM senkt das auf 30 bis 60 Prozent, mit deutschsprachigem Onsite-Engineer und garantierter 4-Stunden-Reaktionszeit. Bei einem DGX H100 mit ~250.000 EUR Hardware-Wert sind das 5-stellige Ersparnisse pro Jahr pro Box.

Welche DGX-Modelle wir warten

DGX-Plattformen sind NVIDIAs Reference-Design-AI-Server für Training und Inference — komplette System-Boxen mit 8 GPUs (DGX A100/H100/H200), Grace-Hopper-Superchips (GH200) oder Grace-Blackwell mit 72 GPUs in einer Rack-Konfiguration (GB200 NVL72). Hardware ist proprietär (NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery), Wartung erfordert spezialisierte Engineer-Erfahrung. Vier aktuelle Generationen koexistieren in DACH-AI-Datacentern.

DGX A100 · Ampere-Generation
DGX A100 320GB (8x A100 40GB) · DGX A100 640GB (8x A100 80GB)
DGX H100 / H200 · Hopper-Generation
DGX H100 (8x H100 SXM5 80GB) · DGX H200 (8x H200 141GB)
DGX GH200 · Grace Hopper
DGX GH200 (Grace+H100, 256x GH200 Superchips, 144TB Memory)
DGX GB200 NVL72 · Grace Blackwell
DGX GB200 NVL72 (72x B200 GPU + 36x Grace, Liquid-Cooled Rack-Scale)
Komponenten
GPU-Boards · NVLink/NVSwitch · Power Supplies · Cooling-Loop (GB200) · Networking-Modules

Warum TPM-Wartung für NVIDIA DGX

DGX-Wartung ist der absolute Höchstwert-Hebel im gesamten TPM-Markt. NVIDIA-Werksgarantie für DGX läuft typisch 1-3 Jahre, danach wird Standard- oder Premium-Support fällig — und der ist proportional zum Hardware-Wert: typisch 15-25 Prozent pro Jahr. Bei einem DGX H100 (~250.000 EUR Hardware-Wert) sind das 38-60.000 EUR Wartung pro Jahr. Bei einer DGX GB200 NVL72 (~3 Mio EUR Hardware-Wert) entsprechend 450-750.000 EUR pro Jahr. TPM senkt das auf 30-50 Prozent — bei einem 8-Box-DGX-Cluster summieren sich Ersparnisse schnell auf 6- bis 7-stellige Beträge pro Jahr.

Wir warten DGX-Plattformen mit Original-Komponenten aus eigenem Lager und zertifizierten Refurbishing-Quellen — DGX-Hardware ist proprietär (NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery, ab GB200 auch Liquid-Cooling-Loop), die Komponenten-Verfügbarkeit ist struktureller schwächer als bei Standard-Servern. Wir bauen den Component-Pool für aktuelle DGX-Generationen kontinuierlich aus, mit Schwerpunkt auf GPU-Board-Replacement, NVSwitch-Module und Power-Supplies. Unsere Engineer sind speziell für DGX-Architektur ausgebildet — DGX-Wartung ist nicht mit Standard-x86-Server-Service vergleichbar. CUDA, AI Enterprise, Base Command bleiben unter TPM lizenzfrei aktiv (Software-Subscriptions laufen unabhängig von Hardware-Wartung bei NVIDIA).

30–60 %
Ersparnis ggü. NVIDIA-Standard/Premium-Support
5- bis 7-stellig
Absolute Jahresersparnis bei DGX-Clustern
DGX-Spezialist
Engineer-Training für NVLink/NVSwitch-Architektur
CUDA bleibt
AI Enterprise, Base Command unabhängig von TPM

Generations-Timeline & TPM-Abdeckung

Pro Hardware-Generation: Hersteller-Phase (Slate) und TechCare-Coverage-Window (Teal) bis ~5 Jahre nach OEM-EOSL.

Generations-Status der DGX-Linie

DGX-Generationen sind alle aktuell — keine EOSL absehbar vor 2030+. Werksgarantie läuft typisch 1-3 Jahre, danach NVIDIA-Support oder TPM. Älteste hier abgedeckte Generation (DGX A100, 2020) ist seit 2023+ aus der Werksgarantie.

Modellfamilie Markteinführung OEM-Support endet TPM-Status
DGX A100 320GB 2020 ca. 2028+ Unterstützt
DGX A100 640GB 2020 ca. 2028+ Unterstützt
DGX H100 2022 ca. 2030+ Unterstützt
DGX H200 2024 ca. 2031+ Unterstützt
DGX GH200 2024 ca. 2031+ Unterstützt
DGX GB200 NVL72 2024–2025 ca. 2032+ Unterstützt

Stand: 2026. EOSL-Daten basieren auf offiziellen Hersteller-Roadmaps und können sich ändern. Verbindliche Auskunft im Einzelfall auf Anfrage.

Was wir konkret leisten

Original-Komponenten

Eigenes Lager und zertifizierte Refurbishing-Quellen für DGX und Mellanox.

DGX-Spezialist-Engineer

Deutschsprachige Techniker mit NVLink/NVSwitch-Training, 4-Stunden-Reaktionszeit garantiert.

Flexible SLA pro System

Parts Only, 5×9 NBD oder 24×7×4 — frei kombinierbar je nach Standort und Kritikalität.

Multi-Vendor-Vertrag

Ein Vertrag für DGX, Mellanox und alle anderen Hersteller. Konsolidierung AI-Cluster-Stack.

Risiko-Assessment

Komponenten-Pool-Status pro Modell vor Vertragsabschluss — ehrlicher Disclosure.

CUDA & AI-Software bleiben

CUDA, AI Enterprise, Base Command Manager unabhängig von Hardware-Wartung.

Häufige Fragen zur DGX-Wartung

Welche DGX-Modelle warten Sie?
Aktuelle DGX-Familie: DGX A100 (Ampere-Generation, 320GB-Variante mit 8x A100 40GB und 640GB-Variante mit 8x A100 80GB), DGX H100 (Hopper, 8x H100 SXM5 80GB), DGX H200 (Hopper-Refresh, 8x H200 141GB), DGX GH200 (Grace Hopper, 256x GH200 Superchips mit 144TB Memory) und DGX GB200 NVL72 (Grace Blackwell, 72x B200 GPU plus 36x Grace, Liquid-Cooled Rack-Scale). Inklusive aller GPU-Boards, NVLink/NVSwitch-Module, Power Supplies, Cooling-Loop (GB200) und Networking-Modules. Für ältere DGX-1/-2 haben wir einen separaten Spoke (DGX Legacy).
Was kostet TPM für DGX im Vergleich zu NVIDIA-Support?
30 bis 60 Prozent Ersparnis. Konkret: DGX A100 640GB mit 24×7×4 kostet bei NVIDIA-Premium-Support typisch 30.000-45.000 Euro pro Jahr, bei TechCare 12.000-19.000 Euro. DGX H100 entsprechend 38.000-60.000 Euro NVIDIA, 15.000-25.000 Euro TechCare. DGX H200 ähnlich, leicht höher. DGX GH200 75.000-120.000 Euro NVIDIA, 30.000-50.000 Euro TechCare. DGX GB200 NVL72 (mit 3 Mio EUR Hardware-Wert) 450.000-750.000 Euro NVIDIA-Premium, mit TechCare 180.000-320.000 Euro. Bei einem 8-Box-DGX-H100-Cluster: 300-480k Euro NVIDIA, 120-200k TechCare. Differenz: 180-280k Euro pro Jahr.
Funktionieren CUDA, AI Enterprise und Base Command Manager weiter ohne NVIDIA-Vertrag?
Ja. CUDA-Toolkit, GPU-Treiber und alle DGX-OS-Funktionen laufen lizenzfrei auf der Hardware weiter — alle AI-Workloads (PyTorch, TensorFlow, Triton Inference, NeMo) bleiben funktional. NVIDIA AI Enterprise als Software-Subscription läuft separat von Hardware-Wartung — wer die Subscription aktiv nutzt, behält sie bei NVIDIA. Base Command Manager (BCM, Cluster-Orchestrierung) ist Subscription-basiert und unabhängig vom Wartungsvertrag. CUDA-Updates und neuere GPU-Treiber-Versionen sind frei verfügbar von NVIDIA — TPM-Kunden können sie ohne Einschränkung herunterladen. Firmware-Updates auf NVSwitch/BMC brauchen aktiven NVIDIA-Vertrag, sind aber bei stabilen AI-Workloads typisch unkritisch.
Wie ist die Komponenten-Verfügbarkeit für DGX-Hardware?
Strukturell schwächer als bei Standard-Servern, aber mit gezieltem Component-Pool-Aufbau adressiert. DGX-Hardware ist proprietär — NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery-Boards. Wir halten Replacement-GPU-Boards, NVSwitch-Module, Power Supplies und Networking-Module für DGX A100/H100/H200 vor. Bei sehr neuen Generationen (GH200, GB200) ist die Pool-Tiefe begrenzt, dort empfehlen wir Hybrid-Setups: TPM für Standard-Komponenten (Power Supplies, Fans, Storage) plus selektive NVIDIA-Subscription für GPU-Board-Coverage. Bei Vertragsabschluss erstellen wir eine Risiko-Bewertung pro DGX-Modell — bei kritischen Workloads empfehlen wir On-Site-Spare-Komponenten (im Vertrag verhandelbar).
Welche SLA-Stufen empfehlen Sie für DGX?
DGX in produktiven AI-Training-Workloads: 24×7×4 mit deutschsprachigem Onsite-Engineer ist Standard. AI-Training-Jobs sind oft mehrtägig — Outage einer DGX-Box mitten in einem Training-Run bedeutet Verlust des Trainings-Fortschritts und ggf. Datenverlust. Bei AI-Inference-Production-Workloads (Customer-Facing-LLMs, Computer-Vision-Pipelines) ist 24×7×4 zwingend wegen direkter Service-Auswirkung. Bei DGX in Test/Dev-Umgebungen oder als Backup-Compute kann 5×9 NBD wirtschaftlich sein. DGX GB200 NVL72 als Liquid-Cooled-Rack-Scale-System: 24×7×4 zwingend wegen Cooling-Loop-Komplexität — Cooling-Failure hat hohe Auswirkungen.
Wann ist der natürliche Einstiegspunkt für TPM bei DGX?
Werksgarantie-Auslauf. NVIDIA-Werksgarantie für DGX läuft typisch 1-3 Jahre, je nach Vertrag. Konkret: DGX A100-Bestände aus 2020-2022 sind seit 2023+ aus der Werksgarantie und der natürliche TPM-Einstiegspunkt. DGX H100 aus 2022-2023 wird ab 2025-2026 aus der Werksgarantie laufen. DGX H200/GH200/GB200 sind aktuell — TPM ist hier 1-3 Jahre voraus zu planen. Wir empfehlen: Bestandsaufnahme 6 Monate vor Werksgarantie-Auslauf, TPM-Vertrag ab Tag 1 nach Garantie-Ende — keine Lücke, keine NVIDIA-Standard-Support-Verlängerung zum vollen Preis als Brücke.
Können wir DGX-Wartung mit Mellanox-Networking im selben Vertrag haben?
Ja. Multi-Class-NVIDIA-Verträge sind für AI-Cluster-Builds besonders relevant — DGX-AI-Compute braucht Mellanox-Networking-Backend (Spectrum Ethernet oder Quantum InfiniBand) plus ConnectX-Adapter und ggf. BlueField DPUs. Wir bieten alle vier NVIDIA-Klassen (DGX, Mellanox-Adapter, Mellanox-Switching, plus DGX Legacy) in einem Vertrag, ein Ansprechpartner, ein SLA-Report-Set. Plus alle anderen Hersteller (Supermicro AI-Server, Dell PowerEdge GPU-Knoten, HPE Apollo) im gleichen Konstrukt.
Wie schnell bekommen wir ein Angebot?
48 Stunden nach Eingang Ihrer Bestandsliste mit Modell, GPU-Konfiguration, Werksgarantie-Status und Seriennummer.
Service-Performance

Echte Ist-Werte Q1 2026 — direkt aus unserem ITIL-Ticketing.

99,2 %
Tickets innerhalb vereinbarter Response-Time gelöst
2,4 h
Ø Erst-Reaktion bei 4h-SLA-Tier
88 %
First-Time-Fix beim Ersttermin
97 %
Ersatzteil binnen 4 h vor Ort, DACH-Depots
Mehr von NVIDIA

Andere NVIDIA-Modelle und Service