+49 6430 9227117
NVIDIA DGX LEGACY · TPM FÜR DGX-1 / DGX-2

NVIDIA DGX-1 / DGX-2 Wartung — Bridge-Service für ältere DGX-Generationen

Wir warten ältere NVIDIA DGX-Plattformen (DGX-1 mit Pascal P100 oder Volta V100, DGX-2 mit 16x V100 und NVSwitch) als Bridge-Service bis zur Refresh-Strategie. Mit Refurbishing-Pools für die wichtigsten Komponenten (V100-GPU-Boards, Power Supplies, NVSwitch-Module) und SLA bis 24×7×4. Wichtige Ehrlichkeit: DGX-Hardware ist proprietär (NVLink, NVSwitch, NVIDIA-Power-Delivery), Komponenten-Verfügbarkeit für DGX-1/-2 ist heute strukturell schwach. Bei sehr alten Beständen ist Refresh zu DGX A100/H100 oft die wirtschaftlichere Option als TPM-Bridge — wir machen das im Risiko-Assessment vor Vertragsabschluss transparent.

Welche DGX Legacy-Modelle wir warten

DGX-1 war NVIDIAs erste Generation kompletter AI-Trainings-Server (Markteintritt April 2016 mit Pascal P100, Refresh 2017-2019 mit Volta V100). DGX-2 erweiterte das Konzept (Markteintritt 2018) mit 16 V100-GPUs und der ersten Generation des NVSwitch-Interconnects. Beide Linien sind technisch noch nutzbar für AI-Inference und kleinere Training-Workloads, aber für moderne LLM-Training oder MoE-Modelle nicht mehr leistungsstark genug.

DGX-1 · Pascal-Generation (älter)
DGX-1 mit 8x Tesla P100 (2016-2017)
DGX-1 · Volta-Generation
DGX-1 mit 8x Tesla V100 16GB / V100 32GB (2017-2019)
DGX-2 · 16x V100 mit NVSwitch
DGX-2 (16x V100 32GB, 2 PFLOPS, NVSwitch Gen 1)
Komponenten (Refurbishing-Pool)
P100/V100 GPU-Boards · NVSwitch Gen 1 · Power Supplies · Mainboards

Warum (oder warum nicht) TPM für DGX-1 / DGX-2

DGX-1/-2-Wartung ist nicht trivial. Im Unterschied zu Standard-Server-EOSL (Supermicro X9, F5 s-Serie, etc.) ist DGX-Hardware proprietär — NVLink, NVSwitch, P100/V100-GPU-Boards mit NVIDIA-spezifischer Firmware. Refurbishing-Pools für DGX-1/-2 sind strukturell dünner als bei Standard-Servern, und einige kritische Komponenten (NVSwitch Gen 1, frühe V100-Boards) sind am freien Markt knapp verfügbar. NVIDIA bietet Standard-Support für DGX-1/-2 nur noch eingeschränkt oder gar nicht mehr — wer hier bleibt, hat oft keine OEM-Service-Option. TPM ist eine Bridge-Service-Lösung mit klaren Risiko-Disclosures.

Wir empfehlen DGX-1/-2-TPM in zwei Szenarien: (1) AI-Inference-Workloads, die nicht zwingend State-of-the-Art-Hardware brauchen — DGX-1/-2 sind technisch noch nutzbar für viele Inference-Use-Cases, TPM verlängert die produktive Lebensdauer wirtschaftlich. (2) Bridge-Service zwischen DGX-1/-2-EOSL und einer geplanten Refresh-Phase auf DGX H100/H200 oder GB200 — TPM überbrückt typisch 6-18 Monate bis die Refresh-Hardware verfügbar und installiert ist. Bei sehr kritischen produktiven AI-Trainings-Workloads auf DGX-1/-2 empfehlen wir Refresh statt TPM-Bridge — moderne DGX-Generationen sind 10-50x leistungsstärker und energieeffizienter. Wir sind ehrlich darüber im Risiko-Assessment.

30–70 %
Ersparnis ggü. NVIDIA-Konditionen (wo verfügbar)
Bridge-Service
6-18 Monate bis Refresh auf H100/H200/GB200
Ehrlicher Disclosure
Refurbishing-Pool-Status pro Modell vor Vertrag
Inference-tauglich
DGX-1/-2 für viele Inference-Use-Cases ausreichend

Generations-Timeline & TPM-Abdeckung

Pro Hardware-Generation: Hersteller-Phase (Slate) und TechCare-Coverage-Window (Teal) bis ~5 Jahre nach OEM-EOSL.

EOSL-Status der DGX Legacy-Generationen

DGX-1 und DGX-2 sind komplett EOSL erreicht. NVIDIA-Werksgarantie ist für alle Konfigurationen ausgelaufen, Standard-Support nur noch eingeschränkt verfügbar.

Modellfamilie Markteinführung OEM-Support endet TPM-Status
DGX-1 (Pascal, 8x P100) 2016 2022–2023 Empfohlen
DGX-1 (Volta, 8x V100 16GB) 2017 2023–2024 Empfohlen
DGX-1 (Volta, 8x V100 32GB) 2018 2024 Empfohlen
DGX-2 (16x V100, NVSwitch Gen 1) 2018 2024–2025 Empfohlen

Stand: 2026. EOSL-Daten basieren auf offiziellen Hersteller-Roadmaps und können sich ändern. Verbindliche Auskunft im Einzelfall auf Anfrage.

Was wir konkret leisten

Original-Komponenten

Eigenes Lager und zertifizierte Refurbishing-Quellen für DGX und Mellanox.

DGX-Spezialist-Engineer

Deutschsprachige Techniker mit NVLink/NVSwitch-Training, 4-Stunden-Reaktionszeit garantiert.

Flexible SLA pro System

Parts Only, 5×9 NBD oder 24×7×4 — frei kombinierbar je nach Standort und Kritikalität.

Multi-Vendor-Vertrag

Ein Vertrag für DGX, Mellanox und alle anderen Hersteller. Konsolidierung AI-Cluster-Stack.

Risiko-Assessment

Komponenten-Pool-Status pro Modell vor Vertragsabschluss — ehrlicher Disclosure.

CUDA & AI-Software bleiben

CUDA, AI Enterprise, Base Command Manager unabhängig von Hardware-Wartung.

Häufige Fragen zur DGX Legacy-Wartung

Welche DGX Legacy-Modelle warten Sie?
DGX-1 und DGX-2 in allen Konfigurationen: DGX-1 mit 8x Tesla P100 (Pascal-Generation, 2016-2017), DGX-1 mit 8x Tesla V100 16GB oder 32GB (Volta-Generation, 2017-2019), DGX-2 mit 16x V100 32GB und der ersten NVSwitch-Generation (2018-2020). Inklusive Refurbishing-Pool-Coverage für GPU-Boards (P100, V100 16/32GB), NVSwitch Gen 1, Power Supplies und Mainboards. Pool-Tiefe variiert pro Komponente — wir machen den Status vor Vertragsabschluss transparent.
Was kostet TPM für DGX-1 / DGX-2?
30 bis 70 Prozent Ersparnis (wo NVIDIA-Konditionen überhaupt noch verfügbar sind). Eine DGX-1 V100 32GB mit 24×7×4 (wenn NVIDIA noch Premium-Support anbietet) typisch 18.000-28.000 Euro pro Jahr, bei TechCare 7.000-12.000 Euro. DGX-2 (16x V100) ähnlich höher absolut: 30.000-45.000 Euro NVIDIA, 12.000-18.000 Euro TechCare. Bei vielen DGX-1/-2-Beständen bietet NVIDIA gar keinen Support mehr an — TPM ist dann die einzige Service-Option für TPM-Tarife.
Wie ist die Komponenten-Verfügbarkeit für DGX-1/-2 wirklich?
Wir sind ehrlich: strukturell schwach, aber adressiert mit zertifizierten Refurbishing-Quellen. P100-GPU-Boards (DGX-1 Pascal) sind heute am Markt selten — wir haben Pool-Coverage, aber bei Multi-Board-Ausfällen sind Lieferzeiten möglich. V100 16GB/32GB-Boards (DGX-1 Volta, DGX-2) sind noch verfügbar in zertifizierten Refurbishing-Quellen. NVSwitch Gen 1 (nur DGX-2) ist die kritischste Komponente — bei NVSwitch-Ausfall kann die DGX-2 nicht mehr in voller Topologie betrieben werden, Reduktion auf ohne-NVSwitch-Konfig ist möglich aber Performance-Verlust signifikant. Power Supplies und Mainboards sind unkritisch verfügbar. Wir erstellen vor Vertragsabschluss eine Risiko-Bewertung pro DGX-Modell und Komponente.
Wann sollten wir auf moderne DGX (H100/H200/GB200) refreshen statt TPM?
Drei klare Refresh-Indikatoren: (1) Aktive AI-Trainings-Workloads (LLMs, Computer-Vision, Multi-Modal) auf DGX-1/-2 — moderne DGX-Generationen sind 10-50x leistungsstärker, ROI auf Refresh-Investment ist typisch unter 12 Monaten Performance-Gewinn. (2) Energieeffizienz: DGX-1/-2 haben deutlich höhere Power-Per-Performance als H100/H200 — bei steigenden Strompreisen rechnet sich Refresh schneller. (3) AI-Software-Stack-Anforderungen: neuere PyTorch/CUDA-Versionen, neuere Triton-Inference-Features, Transformer Engine sind nur auf H100+ verfügbar. TPM ist die richtige Wahl bei: Inference-Workloads ohne State-of-the-Art-Anforderungen, Test/Dev-Umgebungen, Brücken-Service bis Refresh-Hardware verfügbar ist (oft 6-18 Monate Lieferzeit für H100/H200/GB200).
Funktionieren CUDA und AI-Software auf DGX-1/-2 weiter?
Ja, mit Einschränkungen. CUDA-Toolkit, GPU-Treiber für P100/V100 und Standard-AI-Frameworks (PyTorch, TensorFlow) laufen lizenzfrei weiter. CUDA-Versionen werden von NVIDIA auch für ältere Compute-Capability (P100=6.0, V100=7.0) noch eine Weile supportet, aber die neuesten CUDA-Releases (12.x mit Hopper-Optimierungen) bringen auf P100/V100 keinen Vorteil. Transformer Engine, FP8-Operationen und einige neuere Triton-Inference-Features sind hardware-seitig auf H100+ limitiert — auf DGX-1/-2 nicht verfügbar. Für Standard-AI-Inference und kleinere Training-Workloads ist die Software-Stack-Coverage ausreichend.
Welche SLA-Stufen empfehlen Sie für DGX Legacy?
Stark abhängig von der Workload-Kritikalität: DGX-1/-2 in produktiven AI-Inference-Workloads (Customer-Facing-Pipelines): 24×7×4 mit deutschsprachigem Onsite-Engineer ist Standard. Bei DGX-1/-2 als Backup-Compute oder in Test/Dev-Umgebungen: 5×9 NBD typisch ausreichend. Bei DGX-1/-2 in der Refresh-Bridge-Phase (parallel zu neu-bestelltem H100/H200): Parts Only oder 5×9 NBD genügt — die Refresh-Hardware übernimmt sukzessive die produktive Last. Bei sehr alten DGX-1 Pascal-Beständen, die als reine Lab-Server laufen: Parts Only mit 14-Tagen-Lieferzeit als wirtschaftlichste Option.
Können wir DGX Legacy und aktuelle DGX im selben Vertrag haben?
Ja. Multi-Class-NVIDIA-Verträge sind genau für diese gemischten Bestände gedacht — DGX A100/H100/H200/GH200/GB200 (aktuelle Generationen) plus DGX-1/-2 (Legacy) plus Mellanox Adapter und Switching — alles in einem Vertrag, ein Ansprechpartner, ein SLA-Report-Set. Bei DGX-Refresh-Projekten ist das ideal: TPM für die Legacy-Bridge-Phase plus TPM für die neue DGX-Hardware ab Werksgarantie-Auslauf, alles konsistent verwaltet.
Wie schnell bekommen wir ein Risiko-Assessment und Angebot?
Risiko-Assessment innerhalb von 5 Werktagen nach Eingang Ihrer Bestandsliste mit Modell, GPU-Konfiguration und Seriennummer. Angebot inklusive Komponenten-Pool-Status pro Modell. Bei kritischen Workloads bieten wir On-Site-Spare-Komponenten als zusätzliche Service-Option (im Vertrag verhandelbar).
Service-Performance

Echte Ist-Werte Q1 2026 — direkt aus unserem ITIL-Ticketing.

99,2 %
Tickets innerhalb vereinbarter Response-Time gelöst
2,4 h
Ø Erst-Reaktion bei 4h-SLA-Tier
88 %
First-Time-Fix beim Ersttermin
97 %
Ersatzteil binnen 4 h vor Ort, DACH-Depots
Mehr von NVIDIA

Andere NVIDIA-Modelle und Service