Early Access: NPX Cloud ist derzeit nur auf Einladung verfügbar. Zugang anfragen →
From Germany For Europe — Initiative From Germany For Europe Zertifiziert — Hosting & Betrieb in Deutschland
NVIDIA Hopper & Blackwell · Gehostet in Deutschland

GPU-Compute für Enterprise AI — sekundengenau abgerechnet.

Provisionieren Sie dedizierte H100-, H200-, B200- und B300-Cluster aus DSGVO-konformen Rechenzentren im EU-Raum. Kein CapEx, keine Mindestlaufzeit, keine Egress-Gebühren. Sie zahlen ausschließlich genutzte Compute-Zeit.

Per-Sekunde-Abrechnung 3.2 Tbps InfiniBand ISO 27001 · DSGVO
npx@cloud:~ — provision
npx launch --gpu h200 --count 8 --region eu-central
→ allocating HGX H200 node · NVLink fabric ...
✓ 8× H200 · 1128 GB HBM3e · 192 vCPU · 2 TB RAM
✓ InfiniBand 3.2 Tbps · NVMe 14.4 TB
→ image: pytorch-2.6-cuda12.6 · booting ...
✓ cluster ready in 41s
npx ssh node-0
41sBoot-Zeit
1.128 GBHBM gesamt
€26,32/ Std · Node
NVIDIA HGX PartnerPyTorch · TensorFlow · JAXKubernetes · Slurm · RayInfiniBand NDREU Data ResidencySOC 2 Type II
On-Demand GPU-Flotte

Vier Generationen NVIDIA-Beschleuniger. Eine Abrechnung.

Jede Instanz wird als dediziertes Bare-Metal- oder isoliertes Container-Workload bereitgestellt — vollständige GPU-Leistung ohne Time-Slicing. Preise pro GPU und Stunde, sekundengenau abgerechnet, ohne Egress-Kosten.

Hopper · SXM5
NVIDIA H100
Bewährter Standard für großskaliges Training & Inferenz.
  • VRAM 80 GB HBM3
  • Bandbreite 3,35 TB/s
  • vCPU / RAM 26 / 250 GB
  • NVLink 900 GB/s
2,49 / GPU · Std
ab — On-Demand, sekundengenau
Konfigurieren
Beliebteste Hopper · SXM5
NVIDIA H200
141 GB HBM3e — ideal für Long-Context-LLM-Inferenz.
  • VRAM 141 GB HBM3e
  • Bandbreite 4,8 TB/s
  • vCPU / RAM 24 / 256 GB
  • NVLink 900 GB/s
3,29 / GPU · Std
ab — On-Demand, sekundengenau
Konfigurieren
Blackwell · SXM
NVIDIA B200
192 GB & FP4 — neue Generation für Frontier-Modelle.
  • VRAM 192 GB HBM3e
  • Bandbreite 8,0 TB/s
  • vCPU / RAM 28 / 320 GB
  • NVLink 1,8 TB/s
5,49 / GPU · Std
ab — On-Demand, sekundengenau
Konfigurieren
Blackwell Ultra
NVIDIA B300
288 GB HBM3e — maximale Kapazität für Billionen-Parameter.
  • VRAM 288 GB HBM3e
  • Bandbreite 8,0 TB/s
  • vCPU / RAM 32 / 384 GB
  • NVLink 1,8 TB/s
7,49 / GPU · Std
ab — Reservierung empfohlen
Anfragen

Alle Preise zzgl. USt. · Mengenrabatte ab 32 GPUs · Reservierte Kapazität (1–36 Monate) bis zu 60 % günstiger.

Vollständige Spezifikation

Hardware-Datenblatt pro Node

Standard-Node-Konfigurationen wie sie ausgeliefert werden. Custom-Verhältnisse für CPU, RAM und Storage sind auf Anfrage konfigurierbar.

GPUArchitekturVRAMMem-BandbreitevCPU (Node)System-RAMNVMeInterconnectTDP
H100 SXM5Hopper80 GB HBM33,35 TB/s192 (8×)2.048 GB14,4 TBIB 3.2 Tbps700 W
H200 SXM5Hopper141 GB HBM3e4,8 TB/s192 (8×)2.048 GB14,4 TBIB 3.2 Tbps700 W
B200 SXMBlackwell192 GB HBM3e8,0 TB/s224 (8×)2.560 GB30,7 TBIB 3.2 Tbps1.000 W
B300 SXMBlackwell Ultra288 GB HBM3e8,0 TB/s256 (8×)3.072 GB30,7 TBIB 3.2 Tbps1.300 W

Werte beziehen sich auf einen 8-GPU-HGX-Node. CPU: Dual Intel Xeon Platinum / AMD EPYC 9004. Einzel-GPU-Instanzen verfügbar für H100 & H200.

Pay-per-Use Rechner

Kosten kalkulieren, bevor Sie starten.

Wählen Sie GPU-Typ, Anzahl und Laufzeit. Die Schätzung ist transparent aufgeschlüsselt — keine versteckten Egress-, Storage- oder Support-Gebühren.

Geschätzte Kosten / Monat
12.633
8× H200 · 8 Std/Tag · On-Demand
GPU-Stundensatz €3,29
GPU-Stunden / Monat 1.920
Effektiv / Std €26,32
Egress / Storage inklusive
Angebot anfordern
< 60sCluster-Provisionierung bis SSH-ready
99,95 %SLA-garantierte Verfügbarkeit
3.2 TbpsInfiniBand NDR pro Node
0 €Egress- & Datentransfer-Gebühren
Plattform

Gebaut für ML-Teams, die liefern müssen.

Vom Notebook-Experiment bis zum Multi-Node-Trainingslauf — dieselbe API, dieselbe Abrechnung, dieselbe Konsole.

Start in Sekunden

Vorinstallierte Images mit CUDA, PyTorch, TensorFlow und JAX. Cluster sind in unter 60 Sekunden SSH-bereit — per CLI, API oder Web-Konsole.

Multi-Node-Fabric

InfiniBand NDR mit 3,2 Tbps und NVLink-Switch verbinden bis zu 64 GPUs zu einem kohärenten Trainingscluster mit nahezu linearer Skalierung.

Sekundengenaue Abrechnung

Sie zahlen pro Sekunde tatsächlicher Laufzeit. Stoppen Sie eine Instanz, stoppt die Rechnung — keine Mindestlaufzeit, keine Vorab-Reservierung nötig.

Persistenter Storage

NVMe-Scratch direkt am Node plus netzwerkgebundene Volumes, die Cluster überdauern. Datasets bleiben erhalten, Egress ist kostenfrei.

Isolation & Sicherheit

Dedizierte Bare-Metal- oder hardware-isolierte Container. Kein GPU-Sharing, kein Noisy-Neighbor. Private Networking und VPC-Peering standardmäßig.

Orchestrierung integriert

Native Anbindung an Kubernetes, Slurm und Ray. Bringen Sie bestehende Workflows mit — oder nutzen Sie verwaltete Trainings-Templates.

In drei Schritten

Vom Login zum laufenden Trainingslauf

01

Konfigurieren

GPU-Typ, Anzahl und Region wählen — per Konsole oder CLI. Kapazität wird sofort reserviert.

npx launch --gpu h200 --count 8
02

Verbinden

Cluster ist in unter 60 Sekunden bereit. SSH, Jupyter oder direkt per API andocken.

npx ssh node-0 # ready in 41s
03

Trainieren & stoppen

Workload starten, abrechnen lassen pro Sekunde. Stop beendet die Kosten sofort.

npx stop --release # billing off
Souveräne Infrastruktur

EU-Datenresidenz. Deutsche Betreiberhaftung.

NPX Cloud wird von der Nelpx GmbH aus Deutschland betrieben. Ihre Daten und Modelle verlassen den EU-Rechtsraum nicht — kein Transfer unter US-Gesetzgebung, kein Schrems-II-Risiko.

  • Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO
  • Rechenzentren ausschließlich innerhalb der EU
  • Transparente Preise in Euro, deutsche Rechnungsstellung
DSGVO / GDPRVollständig konform, AVV inklusive
ISO 27001Zertifiziertes ISMS der Rechenzentren
SOC 2 Type IIAuditierte Betriebsprozesse
EU Data ResidencyDaten verlassen den EU-Raum nie
Bereit, zu skalieren?

Ihr GPU-Cluster läuft in 60 Sekunden.

Starten Sie mit On-Demand-Compute oder fordern Sie ein maßgeschneidertes Angebot für reservierte Kapazität an. Unser Team antwortet werktags innerhalb von vier Stunden.