From Germany For Europe Zertifiziert — Hosting & Betrieb in Deutschland

NVIDIA Hopper & Blackwell · Gehostet in Deutschland

GPU-Compute für Enterprise AI — sekundengenau abgerechnet.

Provisionieren Sie dedizierte H100-, H200-, B200- und B300-Cluster aus DSGVO-konformen Rechenzentren im EU-Raum. Kein CapEx, keine Mindestlaufzeit, keine Egress-Gebühren. Sie zahlen ausschließlich genutzte Compute-Zeit.

Preis berechnen GPU-Flotte ansehen

Per-Sekunde-Abrechnung 3.2 Tbps InfiniBand ISO 27001 · DSGVO

npx@cloud:~ — provision

npx launch --gpu h200 --count 8 --region eu-central

→ allocating HGX H200 node · NVLink fabric ...

✓ 8× H200 · 1128 GB HBM3e · 192 vCPU · 2 TB RAM

✓ InfiniBand 3.2 Tbps · NVMe 14.4 TB

→ image: pytorch-2.6-cuda12.6 · booting ...

✓ cluster ready in 41s

npx ssh node-0

41sBoot-Zeit

1.128 GBHBM gesamt

€26,32/ Std · Node

On-Demand GPU-Flotte

Vier Generationen NVIDIA-Beschleuniger. Eine Abrechnung.

Jede Instanz wird als dediziertes Bare-Metal- oder isoliertes Container-Workload bereitgestellt — vollständige GPU-Leistung ohne Time-Slicing. Preise pro GPU und Stunde, sekundengenau abgerechnet, ohne Egress-Kosten.

Hopper · SXM5

NVIDIA H100

Bewährter Standard für großskaliges Training & Inferenz.

VRAM 80 GB HBM3
Bandbreite 3,35 TB/s
vCPU / RAM 26 / 250 GB
NVLink 900 GB/s

€2,49 / GPU · Std

ab — On-Demand, sekundengenau

Konfigurieren

Beliebteste Hopper · SXM5

NVIDIA H200

141 GB HBM3e — ideal für Long-Context-LLM-Inferenz.

VRAM 141 GB HBM3e
Bandbreite 4,8 TB/s
vCPU / RAM 24 / 256 GB
NVLink 900 GB/s

€3,29 / GPU · Std

ab — On-Demand, sekundengenau

Konfigurieren

Blackwell · SXM

NVIDIA B200

192 GB & FP4 — neue Generation für Frontier-Modelle.

VRAM 192 GB HBM3e
Bandbreite 8,0 TB/s
vCPU / RAM 28 / 320 GB
NVLink 1,8 TB/s

€5,49 / GPU · Std

ab — On-Demand, sekundengenau

Konfigurieren

Blackwell Ultra

NVIDIA B300

288 GB HBM3e — maximale Kapazität für Billionen-Parameter.

VRAM 288 GB HBM3e
Bandbreite 8,0 TB/s
vCPU / RAM 32 / 384 GB
NVLink 1,8 TB/s

€7,49 / GPU · Std

ab — Reservierung empfohlen

Anfragen

Alle Preise zzgl. USt. · Mengenrabatte ab 32 GPUs · Reservierte Kapazität (1–36 Monate) bis zu 60 % günstiger.

Vollständige Spezifikation

Hardware-Datenblatt pro Node

Standard-Node-Konfigurationen wie sie ausgeliefert werden. Custom-Verhältnisse für CPU, RAM und Storage sind auf Anfrage konfigurierbar.

GPU	Architektur	VRAM	Mem-Bandbreite	vCPU (Node)	System-RAM	NVMe	Interconnect	TDP
H100 SXM5	Hopper	80 GB HBM3	3,35 TB/s	192 (8×)	2.048 GB	14,4 TB	IB 3.2 Tbps	700 W
H200 SXM5	Hopper	141 GB HBM3e	4,8 TB/s	192 (8×)	2.048 GB	14,4 TB	IB 3.2 Tbps	700 W
B200 SXM	Blackwell	192 GB HBM3e	8,0 TB/s	224 (8×)	2.560 GB	30,7 TB	IB 3.2 Tbps	1.000 W
B300 SXM	Blackwell Ultra	288 GB HBM3e	8,0 TB/s	256 (8×)	3.072 GB	30,7 TB	IB 3.2 Tbps	1.300 W

Werte beziehen sich auf einen 8-GPU-HGX-Node. CPU: Dual Intel Xeon Platinum / AMD EPYC 9004. Einzel-GPU-Instanzen verfügbar für H100 & H200.

Pay-per-Use Rechner

Kosten kalkulieren, bevor Sie starten.

Wählen Sie GPU-Typ, Anzahl und Laufzeit. Die Schätzung ist transparent aufgeschlüsselt — keine versteckten Egress-, Storage- oder Support-Gebühren.

GPU-Modell

Anzahl GPUs 8×

Laufzeit pro Tag 8 Std

Abrechnungsmodell

Geschätzte Kosten / Monat

€12.633

8× H200 · 8 Std/Tag · On-Demand

GPU-Stundensatz €3,29

GPU-Stunden / Monat 1.920

Effektiv / Std €26,32

Egress / Storage inklusive

Angebot anfordern

< 60sCluster-Provisionierung bis SSH-ready

99,95 %SLA-garantierte Verfügbarkeit

3.2 TbpsInfiniBand NDR pro Node

0 €Egress- & Datentransfer-Gebühren

Plattform

Gebaut für ML-Teams, die liefern müssen.

Vom Notebook-Experiment bis zum Multi-Node-Trainingslauf — dieselbe API, dieselbe Abrechnung, dieselbe Konsole.

Start in Sekunden

Vorinstallierte Images mit CUDA, PyTorch, TensorFlow und JAX. Cluster sind in unter 60 Sekunden SSH-bereit — per CLI, API oder Web-Konsole.

Multi-Node-Fabric

InfiniBand NDR mit 3,2 Tbps und NVLink-Switch verbinden bis zu 64 GPUs zu einem kohärenten Trainingscluster mit nahezu linearer Skalierung.

Sekundengenaue Abrechnung

Sie zahlen pro Sekunde tatsächlicher Laufzeit. Stoppen Sie eine Instanz, stoppt die Rechnung — keine Mindestlaufzeit, keine Vorab-Reservierung nötig.

Persistenter Storage

NVMe-Scratch direkt am Node plus netzwerkgebundene Volumes, die Cluster überdauern. Datasets bleiben erhalten, Egress ist kostenfrei.

Isolation & Sicherheit

Dedizierte Bare-Metal- oder hardware-isolierte Container. Kein GPU-Sharing, kein Noisy-Neighbor. Private Networking und VPC-Peering standardmäßig.

Orchestrierung integriert

Native Anbindung an Kubernetes, Slurm und Ray. Bringen Sie bestehende Workflows mit — oder nutzen Sie verwaltete Trainings-Templates.

In drei Schritten

Vom Login zum laufenden Trainingslauf

Konfigurieren

GPU-Typ, Anzahl und Region wählen — per Konsole oder CLI. Kapazität wird sofort reserviert.

npx launch --gpu h200 --count 8

Verbinden

Cluster ist in unter 60 Sekunden bereit. SSH, Jupyter oder direkt per API andocken.

npx ssh node-0 # ready in 41s

Trainieren & stoppen

Workload starten, abrechnen lassen pro Sekunde. Stop beendet die Kosten sofort.

npx stop --release # billing off

Souveräne Infrastruktur

EU-Datenresidenz. Deutsche Betreiberhaftung.

NPX Cloud wird von der Nelpx GmbH aus Deutschland betrieben. Ihre Daten und Modelle verlassen den EU-Rechtsraum nicht — kein Transfer unter US-Gesetzgebung, kein Schrems-II-Risiko.

Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO
Rechenzentren ausschließlich innerhalb der EU
Transparente Preise in Euro, deutsche Rechnungsstellung

DSGVO / GDPRVollständig konform, AVV inklusive

ISO 27001Zertifiziertes ISMS der Rechenzentren

SOC 2 Type IIAuditierte Betriebsprozesse

EU Data ResidencyDaten verlassen den EU-Raum nie

Bereit, zu skalieren?

Ihr GPU-Cluster läuft in 60 Sekunden.

Starten Sie mit On-Demand-Compute oder fordern Sie ein maßgeschneidertes Angebot für reservierte Kapazität an. Unser Team antwortet werktags innerhalb von vier Stunden.

Console öffnen Mit Sales sprechen

GPU-Compute für Enterprise AI — sekundengenau abgerechnet.

Vier Generationen NVIDIA-Beschleuniger. Eine Abrechnung.

Hardware-Datenblatt pro Node

Kosten kalkulieren, bevor Sie starten.

Gebaut für ML-Teams, die liefern müssen.

Start in Sekunden

Multi-Node-Fabric

Sekundengenaue Abrechnung

Persistenter Storage

Isolation & Sicherheit

Orchestrierung integriert

Vom Login zum laufenden Trainingslauf

Konfigurieren

Verbinden

Trainieren & stoppen

EU-Datenresidenz. Deutsche Betreiberhaftung.

Ihr GPU-Cluster läuft in 60 Sekunden.

Impressum

Diensteanbieter

Vertreten durch

Kontakt

Registereintrag

Umsatzsteuer

EU-Streitschlichtung

Haftung für Inhalte

Haftung für Links

Urheberrecht

Aktuell nur auf Einladung