NVIDIA DGX Wartung — vendor-unabhängiger Service für DGX A100 bis GB200
Wir warten aktuelle NVIDIA DGX AI-Plattformen herstellerunabhängig — DGX A100 (320GB/640GB), DGX H100, DGX H200, DGX GH200 (Grace Hopper), DGX GB200 NVL72 (Grace Blackwell). Mit Original-Komponenten aus eigenem Lager und zertifizierten Refurbishing-Quellen, SLA bis 24×7×4. NVIDIA-Werksgarantie und Standard-Support sind die teuersten OEM-Wartungs-Modelle im Datacenter — typisch 15 bis 25 Prozent des Hardware-Werts pro Jahr. TPM senkt das auf 30 bis 60 Prozent, mit deutschsprachigem Onsite-Engineer und garantierter 4-Stunden-Reaktionszeit. Bei einem DGX H100 mit ~250.000 EUR Hardware-Wert sind das 5-stellige Ersparnisse pro Jahr pro Box.
Welche DGX-Modelle wir warten
DGX-Plattformen sind NVIDIAs Reference-Design-AI-Server für Training und Inference — komplette System-Boxen mit 8 GPUs (DGX A100/H100/H200), Grace-Hopper-Superchips (GH200) oder Grace-Blackwell mit 72 GPUs in einer Rack-Konfiguration (GB200 NVL72). Hardware ist proprietär (NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery), Wartung erfordert spezialisierte Engineer-Erfahrung. Vier aktuelle Generationen koexistieren in DACH-AI-Datacentern.
Warum TPM-Wartung für NVIDIA DGX
DGX-Wartung ist der absolute Höchstwert-Hebel im gesamten TPM-Markt. NVIDIA-Werksgarantie für DGX läuft typisch 1-3 Jahre, danach wird Standard- oder Premium-Support fällig — und der ist proportional zum Hardware-Wert: typisch 15-25 Prozent pro Jahr. Bei einem DGX H100 (~250.000 EUR Hardware-Wert) sind das 38-60.000 EUR Wartung pro Jahr. Bei einer DGX GB200 NVL72 (~3 Mio EUR Hardware-Wert) entsprechend 450-750.000 EUR pro Jahr. TPM senkt das auf 30-50 Prozent — bei einem 8-Box-DGX-Cluster summieren sich Ersparnisse schnell auf 6- bis 7-stellige Beträge pro Jahr.
Wir warten DGX-Plattformen mit Original-Komponenten aus eigenem Lager und zertifizierten Refurbishing-Quellen — DGX-Hardware ist proprietär (NVLink-Topologie, NVSwitch-Backplane, NVIDIA-spezifische Power-Delivery, ab GB200 auch Liquid-Cooling-Loop), die Komponenten-Verfügbarkeit ist struktureller schwächer als bei Standard-Servern. Wir bauen den Component-Pool für aktuelle DGX-Generationen kontinuierlich aus, mit Schwerpunkt auf GPU-Board-Replacement, NVSwitch-Module und Power-Supplies. Unsere Engineer sind speziell für DGX-Architektur ausgebildet — DGX-Wartung ist nicht mit Standard-x86-Server-Service vergleichbar. CUDA, AI Enterprise, Base Command bleiben unter TPM lizenzfrei aktiv (Software-Subscriptions laufen unabhängig von Hardware-Wartung bei NVIDIA).
Generations-Timeline & TPM-Abdeckung
Pro Hardware-Generation: Hersteller-Phase (Slate) und TechCare-Coverage-Window (Teal) bis ~5 Jahre nach OEM-EOSL.
- DGX A100 320GB2020–2028TPM bis2033+Unterstützt
- DGX A100 640GB2020–2028TPM bis2033+Unterstützt
- DGX H1002022–2030TPM bis2035+Unterstützt
- DGX H2002024–2031TPM bis2036+Unterstützt
- DGX GH2002024–2031TPM bis2036+Unterstützt
- DGX GB200 NVL722024–2032TPM bis2037+Unterstützt
Generations-Status der DGX-Linie
DGX-Generationen sind alle aktuell — keine EOSL absehbar vor 2030+. Werksgarantie läuft typisch 1-3 Jahre, danach NVIDIA-Support oder TPM. Älteste hier abgedeckte Generation (DGX A100, 2020) ist seit 2023+ aus der Werksgarantie.
| Modellfamilie | Markteinführung | OEM-Support endet | TPM-Status |
|---|---|---|---|
| DGX A100 320GB | 2020 | ca. 2028+ | Unterstützt |
| DGX A100 640GB | 2020 | ca. 2028+ | Unterstützt |
| DGX H100 | 2022 | ca. 2030+ | Unterstützt |
| DGX H200 | 2024 | ca. 2031+ | Unterstützt |
| DGX GH200 | 2024 | ca. 2031+ | Unterstützt |
| DGX GB200 NVL72 | 2024–2025 | ca. 2032+ | Unterstützt |
Stand: 2026. EOSL-Daten basieren auf offiziellen Hersteller-Roadmaps und können sich ändern. Verbindliche Auskunft im Einzelfall auf Anfrage.
Was wir konkret leisten
Original-Komponenten
Eigenes Lager und zertifizierte Refurbishing-Quellen für DGX und Mellanox.
DGX-Spezialist-Engineer
Deutschsprachige Techniker mit NVLink/NVSwitch-Training, 4-Stunden-Reaktionszeit garantiert.
Flexible SLA pro System
Parts Only, 5×9 NBD oder 24×7×4 — frei kombinierbar je nach Standort und Kritikalität.
Multi-Vendor-Vertrag
Ein Vertrag für DGX, Mellanox und alle anderen Hersteller. Konsolidierung AI-Cluster-Stack.
Risiko-Assessment
Komponenten-Pool-Status pro Modell vor Vertragsabschluss — ehrlicher Disclosure.
CUDA & AI-Software bleiben
CUDA, AI Enterprise, Base Command Manager unabhängig von Hardware-Wartung.