Wer eigene KI-Anwendungen betreiben möchte, steht schnell vor der Frage: Lohnt sich die Anschaffung eigener Hardware oder ist ein Cloud-GPU-Server die bessere Wahl? Beide Varianten haben ihre Vor- und Nachteile.
In diesem Beitrag gebe ich einen Überblick über die Hardware-Kosten, die mit den ersten Schritten zu eigenen KI-Anwendungen verbunden sind.
HINWEIS – Netto-Preise ohne MwSt.!!:
Alle hier recherchierten Preise verstehen sich als Nettopreise, zzgl. gesetzlicher Mehrwertsteuer. Da sich dieser Vergleich ausschließlich an Geschäftskunden richtet, ist die MwSt. nicht berücksichtigt. Die Preise basieren auf aktuellen Angaben auf den Homepages der Anbieter (Stand: 17.10.2025) und sind daher nur eine Momentaufnahme. Alle Angaben ohne Gewähr! Für konkrete Angebote fragen Sie bitte beim jeweiligen Anbieter nach.
Variante A: KI im eigenen Büro oder Serverraum
Sie wollen vertrauliche Firmendaten oder sensible Kundendaten verarbeiten und müssen daher die volle Kontrolle behalten? Dann müssen Sie auf KI nicht verzichten. Sie müssen „nur“ dafür sorgen, dass die Daten den eigenen Hoheitsbereich nicht verlassen!
Einstieg mit 32 GB Grafikspeicher
Dazu können KI-Systeme z.B. im eigenen Serverraum oder sogar im eigenen Büro betrieben werden. Der Einstieg in eigene KI-Anwendungen ist mit handelsüblichen PCs mit High-End Consumer Grafikkarten mit 32 GB Grafikspeicher (VRAM) möglich. Damit können quantisierte Versionen von Sprachmodellen (LLMs) mit bis zu 32 Milliarden Parametern (32B) genutzt werden. Sogar ans Fine-Tuning mit eigenen Daten kann man sich damit wagen (LoRA bis zu 13B, QLoRA bis zu 30B).
Alternate: PC mit RTX 5090 ab 4.600 €
Einen PC mit NVIDIA RTX 5090 bekommt man bei Alternate ab etwa 4.600 € (Netto!!). Für Server-Hardware muss man etwa 9.200 € kalkulieren (ASUS-Board + NVIDIA RTX PRO 4500 Blackwell Grafikkarte). Hier zwei Beispiel-Angebote (Stand: 14.10.2025):
| Anbieter | Produkt-Details | Kosten (Netto) |
|---|---|---|
| Alternate | NVIDIA RTX 5090 (32 GB VRAM), Intel® Core™ i9-14900K (24 Cores), 96 GB DDR5 RAM, 2x 4TB SSD | 4.598,65 € |
| primeLine Solutions | PNY NVIDIA RTX PRO 4500 Blackwell (32 GB VRAM), AMD EPYC Genoa 9124 Prozessor (16 Cores), 96 GB DDR5 RAM, 2x 3,84 TB NVMe SSD | 7.667,40 € |
Abhängig von der gewünschten Konfiguration können sich andere Preise ergeben.
Fine-Tuning großer Modelle braucht VIEL Grafikspeicher
Um größere Modelle mit eigenen Daten zu trainieren, ist deutlich mehr Grafikspeicher notwendig. Hier kommen z.B. Systeme mit mehreren NVIDIA Blackwell-Karten oder NVIDIA H200 zum Einsatz. Ein System mit 96 GB VRAM kostet über 12.000 €. Mit 2 H200-Karten kommt man auf 282 GB VRAM, und das Gesamtsystem kostet über 65.000 €. Hier zwei Beispiel-Systeme von primeLine Solutions:
| Anbieter | Produkt-Details | Kosten (Netto) |
|---|---|---|
| primeLine Solutions | PNY NVIDIA RTX PRO 6000 Blackwell Max-Q Grafikkarte (96 GB VRAM), AMD EPYC Genoa 9124 Prozessor (16 Cores), 2x 3.84 TB NVMe SSD | 12.619,20 € |
| primeLine Solutions | 2x NVIDIA H200 (zusammen 282 GB VRAM), NVIDIA NVLink, AMD EPYC Genoa 9124 Prozessor (16 Cores), RAID-Controller, 2x 3.84 TB NVMe SSD, 2x 7.68 TB SSD | 66.627,70 € |
Die teuersten Komponenten dieser Systeme sind die Grafikkarten. Eine RTX 6000 (96 GB VRAM) schlägt mit 7.095,60 € zu Buche. Zwei H200 Karten (282 GB VRAM) kosten zusammen 53.084,80 €.
Variante B: Cloud-GPU-Server
Nicht alle Daten sind so vertraulich oder sensibel, dass sie ausschließlich intern verarbeitet werden dürfen. In solchen Fällen könnten Hosting-Provider eine Alternative darstellen, sofern man ihnen die Einhaltung der zugesicherten Datenschutz- und Compliance-Anforderungen zutraut.
Im Folgenden habe ich einige Angebote herausgesucht (ohne Anspruch auf Vollständigkeit), um einen groben Überblick über die Kostenstrukturen zu geben.
Angebote zwischen 20 und 48 GB VRAM
Die folgenden Angebote zeigen Systeme mit Grafikspeicher zwischen 20 und 48 GB und liegen damit in ähnlicher Größenordnung wie die oben gezeigten Systeme mit 32 GB .
| Anbieter | Produkt-Details | Kosten (Netto) |
|---|---|---|
| Keyweb | „KI-Machine M“ Nvidia Tesla L4 (24 GB VRAM), AMD EPYC™ 9254 48 x max 4.15 GHz, 512 GB DDR5, 2×1.92 TB NVMe SSD | 416,13 € / Monat bei 24 Monaten Laufzeit + eimalig 495,80 € Einrichtungsgebühr |
| IONOS | Nvidia A10 GPU (24 GB VRAM), AMD EPYC™ 7313P, 128 GB DDR4 RAM, 960 GB NVMe SSD (2 x 960 GB), Hardware RAID 1 | 495,80 € / Monat 0,68857 €/Stunde |
| Hetzner | „GEX44“ Nvidia RTX™ 4000 SFF Ada Generation (20 GB VRAM), Intel® Core™ i5-13500, 64 GB DDR4 RAM, 2 x 1.92 TB NVMe SSD | 184,00 € / Monat + einmalig 79,00 € für Setup oder 0,2948 € / Stunde |
| Hetzner | „GEX130“ NVIDIA RTX™ 6000 Ada (48 GB VRAM), Intel® Xeon® Gold 5412U, 128 GB DDR5 RAM, 2 x 1.92 TB NVMe SSD | 813.00 € / Monat oder 1.3029 € / Stunde |
| centron | Nvidia Quadro RTX 6000 (24 GB VRAM) | 170.83 € / Monat, 0.24 € / Stunde |
| centron | Nvidia A100 (40 GB VRAM) | 750.00 € / Monat, 1.04 € / Stunde |
Systeme ab 80 GB VRAM
Viele der Cloud-GPU-Anbieter bewerben auch Systeme mit 80 GB VRAM und mehr, mit denen auch das Training und Fine-Tuning großer Modelle möglich ist. Häufig erfährt man die Preise jedoch nur auf Anfrage.
| Anbieter | Produkt-Details | Kosten (Netto) |
|---|---|---|
| Keyweb | „KI-Machine Custom“ bis zu 8 x Nvidia RTX Pro 6000 Blackwell je 96 GB VRAM (zusammen bis zu 768 GB VRAM) | auf Anfrage |
| IONOS | NVIDIA® H100/H200 | 3352,94 € / Monat |
| centron | Nvidia A100 (80GB VRAM) | 1390,00 € / Monat 1,93 € / Stunde |
Kostenvergleich: Cloud vs. selbst gehostet
Aufgrund der Vielzahl an Konfigurationen und Varianten gestaltet sich ein fairer Vergleich schwierig. Es muss daher im Einzelfall anhand der konkreten Anforderungen eines Projekts geprüft werden, welches Angebot besser abschneidet. Daher will ich hier nur ein Beispiel exemplarisch durchrechnen.
Wir nehmen hier an, dass die festen Anschaffungskosten über einen Zeitraum von 24 Monaten abgeschrieben werden, um sie mit den Monatspreisen der Cloud-Anbieter zu vergleichen.
Monatliche Kosten für NVIDIA RTX 5090-System
Auf 24 Monate gerechnet ergeben die 4.598,65 € Anschaffungskosten eine monatliche Summe von 191,61 €. Dazu kommen die Stromkosten, die wir exemplarisch mit 50 € / Monat ansetzen. Pauschal rechnen wir noch 20 € / Monat für den Platz im Büro oder im Serverraum und 50 € Wartungskosten dazu. Mit diesen Annahmen kommen wir auf 311,61 € / Monat. Mit ähnlichen Annahmen kommen wir
| System / Anbieter | VRAM | Kosten (Netto) / Monat |
|---|---|---|
| RTX 5090 + Consumer-Hardware / Alternate, selbst gehostet | 32 GB | 311,61 € |
| RTX PRO 4500 Blackwell + Server-Hardware / primeLine, selbst gehostet | 32 GB | 439,47 € |
| Quadro RTX 6000 / centron | 24 GB | 170.83 € |
| Nvidia Tesla L4 / Keyweb | 24 GB | 416,13 € |
| Nvidia A100 / centron | 40 GB | 750.00 € |
Die Kosten liegen in ähnlichen Größenordnungen, wobei die selbst gehosteten, etwas günstiger erscheinen.
Fazit
Wer besonders sensible und vertrauliche Daten verarbeiten möchte, hostet die Systeme selbst und behält somit die volle Hoheit über die Daten. Für weniger sensible Daten oder auch für kürzere Projekte oder Experimente haben die Cloud-GPU-Angebote den Vorteil, dass man sie auch monatsweise oder gar stundenweise buchen kann, und somit Kosten spart.
Egal ob selbst gehostet oder in der Cloud – die Hardware-Kosten für eigene KI-Anwendungen sind überschaubar und somit auch für kleine und mittelständische Unternehmen kein Hindernis beim Einstieg in die KI-Nutzung.

