Hardware-Kosten für KI-Anwendungen: Eigenbetrieb vs. Cloud

Preisvergleich KI-Hardware - selbst hosten vs. Cloud

Wer eigene KI-Anwendungen betreiben möchte, steht schnell vor der Frage: Lohnt sich die Anschaffung eigener Hardware oder ist ein Cloud-GPU-Server die bessere Wahl? Beide Varianten haben ihre Vor- und Nachteile.

In diesem Beitrag gebe ich einen Überblick über die Hardware-Kosten, die mit den ersten Schritten zu eigenen KI-Anwendungen verbunden sind.

HINWEIS – Netto-Preise ohne MwSt.!!:
Alle hier recherchierten Preise verstehen sich als Nettopreise, zzgl. gesetzlicher Mehrwertsteuer. Da sich dieser Vergleich ausschließlich an Geschäftskunden richtet, ist die MwSt. nicht berücksichtigt. Die Preise basieren auf aktuellen Angaben auf den Homepages der Anbieter (Stand: 17.10.2025) und sind daher nur eine Momentaufnahme. Alle Angaben ohne Gewähr! Für konkrete Angebote fragen Sie bitte beim jeweiligen Anbieter nach.

Variante A: KI im eigenen Büro oder Serverraum

Sie wollen vertrauliche Firmendaten oder sensible Kundendaten verarbeiten und müssen daher die volle Kontrolle behalten? Dann müssen Sie auf KI nicht verzichten. Sie müssen „nur“ dafür sorgen, dass die Daten den eigenen Hoheitsbereich nicht verlassen!

Einstieg mit 32 GB Grafikspeicher

Dazu können KI-Systeme z.B. im eigenen Serverraum oder sogar im eigenen Büro betrieben werden. Der Einstieg in eigene KI-Anwendungen ist mit handelsüblichen PCs mit High-End Consumer Grafikkarten mit 32 GB Grafikspeicher (VRAM) möglich. Damit können quantisierte Versionen von Sprachmodellen (LLMs) mit bis zu 32 Milliarden Parametern (32B) genutzt werden. Sogar ans Fine-Tuning mit eigenen Daten kann man sich damit wagen (LoRA bis zu 13B, QLoRA bis zu 30B).

Alternate: PC mit RTX 5090 ab 4.600 €

Einen PC mit NVIDIA RTX 5090 bekommt man bei Alternate ab etwa 4.600 € (Netto!!). Für Server-Hardware muss man etwa 9.200 € kalkulieren (ASUS-Board + NVIDIA RTX PRO 4500 Blackwell Grafikkarte). Hier zwei Beispiel-Angebote (Stand: 14.10.2025):

AnbieterProdukt-DetailsKosten (Netto)
AlternateNVIDIA RTX 5090 (32 GB VRAM), Intel® Core™ i9-14900K (24 Cores), 96 GB DDR5 RAM, 2x 4TB SSD
4.598,65 €
primeLine SolutionsPNY NVIDIA RTX PRO 4500 Blackwell (32 GB VRAM), AMD EPYC Genoa 9124 Prozessor (16 Cores), 96 GB DDR5 RAM, 2x 3,84 TB NVMe SSD7.667,40 €

Abhängig von der gewünschten Konfiguration können sich andere Preise ergeben.

Fine-Tuning großer Modelle braucht VIEL Grafikspeicher

Um größere Modelle mit eigenen Daten zu trainieren, ist deutlich mehr Grafikspeicher notwendig. Hier kommen z.B. Systeme mit mehreren NVIDIA Blackwell-Karten oder NVIDIA H200 zum Einsatz. Ein System mit 96 GB VRAM kostet über 12.000 €. Mit 2 H200-Karten kommt man auf 282 GB VRAM, und das Gesamtsystem kostet über 65.000 €. Hier zwei Beispiel-Systeme von primeLine Solutions:

AnbieterProdukt-DetailsKosten (Netto)
primeLine SolutionsPNY NVIDIA RTX PRO 6000 Blackwell Max-Q Grafikkarte (96 GB VRAM), AMD EPYC Genoa 9124 Prozessor (16 Cores), 2x 3.84 TB NVMe SSD12.619,20 €
primeLine Solutions2x NVIDIA H200 (zusammen 282 GB VRAM), NVIDIA NVLink, AMD EPYC Genoa 9124 Prozessor (16 Cores), RAID-Controller, 2x 3.84 TB NVMe SSD, 2x 7.68 TB SSD66.627,70 €

Die teuersten Komponenten dieser Systeme sind die Grafikkarten. Eine RTX 6000 (96 GB VRAM) schlägt mit 7.095,60 € zu Buche. Zwei H200 Karten (282 GB VRAM) kosten zusammen 53.084,80 €.

Variante B: Cloud-GPU-Server

Nicht alle Daten sind so vertraulich oder sensibel, dass sie ausschließlich intern verarbeitet werden dürfen. In solchen Fällen könnten Hosting-Provider eine Alternative darstellen, sofern man ihnen die Einhaltung der zugesicherten Datenschutz- und Compliance-Anforderungen zutraut.

Im Folgenden habe ich einige Angebote herausgesucht (ohne Anspruch auf Vollständigkeit), um einen groben Überblick über die Kostenstrukturen zu geben.

Angebote zwischen 20 und 48 GB VRAM

Die folgenden Angebote zeigen Systeme mit Grafikspeicher zwischen 20 und 48 GB und liegen damit in ähnlicher Größenordnung wie die oben gezeigten Systeme mit 32 GB .

AnbieterProdukt-DetailsKosten (Netto)
Keyweb„KI-Machine M“
Nvidia Tesla L4 (24 GB VRAM),
AMD EPYC™ 9254 48 x max 4.15 GHz,
512 GB DDR5, 2×1.92 TB NVMe SSD
416,13 € / Monat bei 24 Monaten Laufzeit + eimalig 495,80 € Einrichtungsgebühr
IONOSNvidia A10 GPU (24 GB VRAM), AMD EPYC™ 7313P, 128 GB DDR4 RAM, 960 GB NVMe SSD (2 x 960 GB), Hardware RAID 1495,80 € / Monat
0,68857 €/Stunde
Hetzner„GEX44“
Nvidia RTX™ 4000 SFF Ada Generation (20 GB VRAM), Intel® Core™ i5-13500, 64 GB DDR4 RAM, 2 x 1.92 TB NVMe SSD
184,00 € / Monat
+ einmalig 79,00 € für Setup

oder 0,2948 € / Stunde
Hetzner„GEX130“
NVIDIA RTX™ 6000 Ada (48 GB VRAM),
Intel® Xeon® Gold 5412U, 128 GB DDR5 RAM, 2 x 1.92 TB NVMe SSD
813.00 € / Monat
oder
1.3029 € / Stunde
centronNvidia Quadro RTX 6000 (24 GB VRAM)170.83 € / Monat, 0.24 € / Stunde
centronNvidia A100 (40 GB VRAM)750.00 € / Monat,
1.04 € / Stunde

Systeme ab 80 GB VRAM

Viele der Cloud-GPU-Anbieter bewerben auch Systeme mit 80 GB VRAM und mehr, mit denen auch das Training und Fine-Tuning großer Modelle möglich ist. Häufig erfährt man die Preise jedoch nur auf Anfrage.

AnbieterProdukt-DetailsKosten (Netto)
Keyweb„KI-Machine Custom“
bis zu 8 x Nvidia RTX Pro 6000
Blackwell je 96 GB VRAM (zusammen bis zu 768 GB VRAM)
auf Anfrage
IONOSNVIDIA® H100/H2003352,94 € / Monat
centronNvidia A100 (80GB VRAM)1390,00 € / Monat
1,93 € / Stunde

Kostenvergleich: Cloud vs. selbst gehostet

Aufgrund der Vielzahl an Konfigurationen und Varianten gestaltet sich ein fairer Vergleich schwierig. Es muss daher im Einzelfall anhand der konkreten Anforderungen eines Projekts geprüft werden, welches Angebot besser abschneidet. Daher will ich hier nur ein Beispiel exemplarisch durchrechnen.

Wir nehmen hier an, dass die festen Anschaffungskosten über einen Zeitraum von 24 Monaten abgeschrieben werden, um sie mit den Monatspreisen der Cloud-Anbieter zu vergleichen.

Monatliche Kosten für NVIDIA RTX 5090-System

Auf 24 Monate gerechnet ergeben die 4.598,65 € Anschaffungskosten eine monatliche Summe von 191,61 €. Dazu kommen die Stromkosten, die wir exemplarisch mit 50 € / Monat ansetzen. Pauschal rechnen wir noch 20 € / Monat für den Platz im Büro oder im Serverraum und 50 € Wartungskosten dazu. Mit diesen Annahmen kommen wir auf 311,61 € / Monat. Mit ähnlichen Annahmen kommen wir

System / AnbieterVRAMKosten (Netto) / Monat
RTX 5090 + Consumer-Hardware / Alternate, selbst gehostet32 GB311,61 €
RTX PRO 4500 Blackwell + Server-Hardware /
primeLine
, selbst gehostet
32 GB439,47 €
Quadro RTX 6000 / centron24 GB170.83 €
Nvidia Tesla L4 / Keyweb24 GB416,13 €
Nvidia A100 / centron40 GB750.00 €

Die Kosten liegen in ähnlichen Größenordnungen, wobei die selbst gehosteten, etwas günstiger erscheinen.

Fazit

Wer besonders sensible und vertrauliche Daten verarbeiten möchte, hostet die Systeme selbst und behält somit die volle Hoheit über die Daten. Für weniger sensible Daten oder auch für kürzere Projekte oder Experimente haben die Cloud-GPU-Angebote den Vorteil, dass man sie auch monatsweise oder gar stundenweise buchen kann, und somit Kosten spart.

Egal ob selbst gehostet oder in der Cloud – die Hardware-Kosten für eigene KI-Anwendungen sind überschaubar und somit auch für kleine und mittelständische Unternehmen kein Hindernis beim Einstieg in die KI-Nutzung.


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert