Provisionieren Sie dedizierte H100-, H200-, B200- und B300-Cluster aus DSGVO-konformen Rechenzentren im EU-Raum. Kein CapEx, keine Mindestlaufzeit, keine Egress-Gebühren. Sie zahlen ausschließlich genutzte Compute-Zeit.
Jede Instanz wird als dediziertes Bare-Metal- oder isoliertes Container-Workload bereitgestellt — vollständige GPU-Leistung ohne Time-Slicing. Preise pro GPU und Stunde, sekundengenau abgerechnet, ohne Egress-Kosten.
Alle Preise zzgl. USt. · Mengenrabatte ab 32 GPUs · Reservierte Kapazität (1–36 Monate) bis zu 60 % günstiger.
Standard-Node-Konfigurationen wie sie ausgeliefert werden. Custom-Verhältnisse für CPU, RAM und Storage sind auf Anfrage konfigurierbar.
| GPU | Architektur | VRAM | Mem-Bandbreite | vCPU (Node) | System-RAM | NVMe | Interconnect | TDP |
|---|---|---|---|---|---|---|---|---|
| H100 SXM5 | Hopper | 80 GB HBM3 | 3,35 TB/s | 192 (8×) | 2.048 GB | 14,4 TB | IB 3.2 Tbps | 700 W |
| H200 SXM5 | Hopper | 141 GB HBM3e | 4,8 TB/s | 192 (8×) | 2.048 GB | 14,4 TB | IB 3.2 Tbps | 700 W |
| B200 SXM | Blackwell | 192 GB HBM3e | 8,0 TB/s | 224 (8×) | 2.560 GB | 30,7 TB | IB 3.2 Tbps | 1.000 W |
| B300 SXM | Blackwell Ultra | 288 GB HBM3e | 8,0 TB/s | 256 (8×) | 3.072 GB | 30,7 TB | IB 3.2 Tbps | 1.300 W |
Werte beziehen sich auf einen 8-GPU-HGX-Node. CPU: Dual Intel Xeon Platinum / AMD EPYC 9004. Einzel-GPU-Instanzen verfügbar für H100 & H200.
Wählen Sie GPU-Typ, Anzahl und Laufzeit. Die Schätzung ist transparent aufgeschlüsselt — keine versteckten Egress-, Storage- oder Support-Gebühren.
Vom Notebook-Experiment bis zum Multi-Node-Trainingslauf — dieselbe API, dieselbe Abrechnung, dieselbe Konsole.
Vorinstallierte Images mit CUDA, PyTorch, TensorFlow und JAX. Cluster sind in unter 60 Sekunden SSH-bereit — per CLI, API oder Web-Konsole.
InfiniBand NDR mit 3,2 Tbps und NVLink-Switch verbinden bis zu 64 GPUs zu einem kohärenten Trainingscluster mit nahezu linearer Skalierung.
Sie zahlen pro Sekunde tatsächlicher Laufzeit. Stoppen Sie eine Instanz, stoppt die Rechnung — keine Mindestlaufzeit, keine Vorab-Reservierung nötig.
NVMe-Scratch direkt am Node plus netzwerkgebundene Volumes, die Cluster überdauern. Datasets bleiben erhalten, Egress ist kostenfrei.
Dedizierte Bare-Metal- oder hardware-isolierte Container. Kein GPU-Sharing, kein Noisy-Neighbor. Private Networking und VPC-Peering standardmäßig.
Native Anbindung an Kubernetes, Slurm und Ray. Bringen Sie bestehende Workflows mit — oder nutzen Sie verwaltete Trainings-Templates.
GPU-Typ, Anzahl und Region wählen — per Konsole oder CLI. Kapazität wird sofort reserviert.
Cluster ist in unter 60 Sekunden bereit. SSH, Jupyter oder direkt per API andocken.
Workload starten, abrechnen lassen pro Sekunde. Stop beendet die Kosten sofort.
NPX Cloud wird von der Nelpx GmbH aus Deutschland betrieben. Ihre Daten und Modelle verlassen den EU-Rechtsraum nicht — kein Transfer unter US-Gesetzgebung, kein Schrems-II-Risiko.
Starten Sie mit On-Demand-Compute oder fordern Sie ein maßgeschneidertes Angebot für reservierte Kapazität an. Unser Team antwortet werktags innerhalb von vier Stunden.