Question 1

Welche GPU SuperServer-Modelle warten Sie?

Accepted Answer

Komplette GPU-Familie: 4U PCIe-GPU-Server (SYS-4029GP-TRT, SYS-4124GS, SYS-740GP-TNRT, A+ AS-4124GS-TNR mit 4-10 PCIe-GPUs) und 8U HGX-Plattformen (SYS-821GE-TNHR, SYS-421GE-TNRT, AS-8125GS-TNHR mit 8 GPUs in NVLink/NVSwitch). Inklusive aller CPUs, RAM, NVMe-SSDs, GPU-Module, NVLink/NVSwitch-Backplanes, Power Supplies (4-6kW) und InfiniBand-NICs.

Question 2

Was kostet TPM für GPU SuperServer im Vergleich zu Supermicro-Support?

Accepted Answer

30 bis 60 Prozent Ersparnis. Eine 4U PCIe-GPU-Plattform (SYS-4029GP-TRT mit 8 GPUs) mit 24×7×4 kostet bei Supermicro 4.500-7.000 Euro pro Jahr, bei TechCare 1.900-3.000 Euro. 8U HGX-Plattform (SYS-821GE-TNHR mit 8 H100) 8.000-13.000 Euro Supermicro, 3.500-5.500 Euro TechCare. Bei AI-Clustern mit 8-32 HGX-Plattformen summieren sich Wartungs-Ersparnisse auf 5- bis 6-stellige Beträge pro Jahr.

Question 3

Decken Sie auch NVIDIA-GPU-Module ab oder nur die Server-Plattform?

Accepted Answer

Beides möglich, getrennt zu betrachten. Server-Hardware (CPU, RAM, SSDs, Mainboard, Backplane, Power Supplies) ist in jedem TPM-Vertrag standardmäßig enthalten. NVIDIA-GPU-Module (A100/H100/H200/B100/B200) sind technisch separat — können entweder als Multi-Vendor-Erweiterung im selben TechCare-Vertrag abgedeckt werden, oder in NVIDIA-spezifischen Garantie/Support-Verträgen separat laufen. NVIDIA bietet eigene Enterprise-Support-Verträge für GPU-Module, die bei mission-critical AI-Workloads sinnvoll sein können. TPM-Coverage für GPU-Module läuft über zertifizierte NVIDIA-Refurbishing-Pools.

Question 4

Funktioniert NVIDIA Mission Control / Base Command / NeMo weiter ohne Supermicro-Vertrag?

Accepted Answer

Ja. NVIDIA-Software-Stack (Mission Control, Base Command Platform, NeMo Framework, Magnum IO) läuft komplett unabhängig von der Server-Hardware-Wartung — diese Software-Subscriptions sind NVIDIA-spezifisch und nicht an Supermicro-Verträge gekoppelt. CUDA, NVIDIA Driver, Container Toolkit (NVCT), NCCL und alle GPU-Software-Layer bleiben funktional aktiv unter TPM. NVIDIA AI Enterprise-Subscription (falls vorhanden) bleibt unabhängig — sollte bei aktiver Nutzung parallel beibehalten werden.

Question 5

Welche SLA-Stufen empfehlen Sie für AI-Cluster?

Accepted Answer

AI-Cluster in produktiven Training- oder Inference-Workloads: 24×7×4 mit deutschsprachigem Onsite-Engineer ist Standard — Multi-Node-Training-Jobs werden bei Single-Node-Outage abgebrochen, was kostspielige Re-Compute-Zyklen verursacht. Bei großen HGX-Clustern mit 16+ Plattformen empfehlen wir zusätzlich Spare-GPU-Module on-site (vertraglich verhandelbar) — GPU-Defekt mit 4h-Onsite-Reaktion ist trotzdem oft länger als ein Training-Run-Restart kostet. Bei Test/Dev-AI-Clustern: 5×9 NBD ausreichend.

Question 6

Bekommen wir InfiniBand-HCAs und 400G-Ethernet für AI-Cluster?

Accepted Answer

Ja. AI-Cluster-Connectivity ist Kerngeschäft: Mellanox/NVIDIA InfiniBand-HCAs (ConnectX-6/7 in HDR/NDR mit 200G/400G), 400G-Ethernet-NICs, Mellanox/NVIDIA InfiniBand-Switches (QM8700/QM9700) und passende Kabel. Multi-Vendor-Vertrag deckt Supermicro-Server, Mellanox/NVIDIA-HCAs und InfiniBand-Switches in einem Konstrukt — ideale Konsolidierung für AI-Cluster-Wartung.

Question 7

Sind GPU SuperServer schon TPM-fähig, wenn die Werksgarantie noch läuft?

Accepted Answer

Werksgarantie läuft typisch 1-3 Jahre nach Inbetriebnahme — während dieser Zeit ist Supermicro-Hardware-Service durch die Garantie abgedeckt. Sobald die Werksgarantie ausläuft, ist der Einstiegspunkt für TPM. Viele DACH-AI-Cluster aus den 2022/2023er-Builds verlieren ihre Werksgarantie ab 2025/2026 — TPM ist dann der wirtschaftlich sinnvolle Move. Wir nehmen Bestandsaufnahmen ab Garantie-Ende-Jahr 1, sodass der Wechsel nahtlos läuft.

Question 8

Können wir GPU, Twin und Standard-Rack im selben Vertrag haben?

Accepted Answer

Ja. Multi-Class-Verträge sind unsere Stärke — GPU SuperServer (4U/8U HGX), Twin/BigTwin/FatTwin Multi-Node, Standard-Rack (1U/2U/4U), SuperStorage und ältere X9/X10/X11 — alles in einem Vertrag. Plus Mellanox/NVIDIA InfiniBand-Hardware, NetApp/Pure-Storage für AI-Datasets, Cisco/Arista-Networking — gesamter AI-Cluster-Stack in einem Konstrukt.

Modellfamilie	Markteinführung	OEM-Support endet	TPM-Status
X11 4U GPU (V100/A100)	2018–2020	2026–2028	Unterstützt
X12 4U/8U GPU (A100/H100)	2021–2022	2029–2030	Unterstützt
X13 8U HGX (H100/H200)	2023+	ca. 2031+	Unterstützt
X14 8U HGX (B100/B200)	2024+	ca. 2032+	Unterstützt

Supermicro GPU SuperServer Wartung — vendor-unabhängiger Service für 4U/8U HGX

Welche GPU SuperServer-Modelle wir warten

Warum TPM-Wartung für GPU SuperServer

Generations-Timeline & TPM-Abdeckung

EOSL-Status der GPU SuperServer-Generationen

Was wir konkret leisten

Original-Ersatzteile

Onsite-Engineer

Flexible SLA pro System

Multi-Vendor-Vertrag

EOSL-Tracking & Reporting

Standard-Komponenten

TechCare vs. Supermicro GPU SuperServer (4U / 8U HGX)

Häufige Fragen zur GPU SuperServer Wartung

Echte Ist-Werte Q1 2026 — direkt aus unserem ITIL-Ticketing.

Supermicro GPU SuperServer (4U / 8U HGX) sparen ohne Risiko

Andere Supermicro-Modelle und Service