Ein Mittelständler mit 500 Mitarbeitern führt Microsoft Copilot ein. Die Rechnung im ersten Jahr, nur Lizenzen: 168.000 EUR. Dazu Schulungen, Implementierung, Support. Im fünften Jahr stehen über 650.000 EUR in den Büchern. Wer dieselbe Übung ehrlich für Cloud und On-Premise rechnet, bekommt jedes Mal dasselbe Bild.
Diese Rechnung macht gerade jeder IT-Leiter auf — und sie geht selten zugunsten der Cloud aus. Die tiefere Wahrheit: Die meisten Unternehmen kennen ihre KI-Kosten nicht. Die Rechnung ist ein Teil. Implementierung, Schulung, Compliance und schleichender Vendor Lock-in liefern den Rest.
Was Sie tatsächlich zahlen
Die Listenpreise sehen überschaubar aus. Die Gesamtkosten nicht.
Microsoft Copilot
- Lizenz: 30 USD/Nutzer/Monat (~28 EUR). (Microsoft 365 Copilot.)
- Voraussetzung: Microsoft 365 E3 oder E5 Lizenz (zusätzlich 36–57 EUR/Nutzer/Monat).
- 500 Nutzer, 5 Jahre: 840.000 EUR (Copilot + E5-Basis).
- Reiner Copilot-Anteil: abzüglich bestehender M365-Kosten → realistisch 504.000–672.000 EUR reine Copilot-Kosten.
Was übersehen wird: Copilot wird pro Nutzer berechnet, nicht pro Nutzung. Gartner (2024) findet, dass nur 30–40 % der lizenzierten Nutzer Copilot regelmäßig verwenden. Sie zahlen 500 Lizenzen, rund 300 Mitarbeiter rühren das Tool kaum an.
ChatGPT Enterprise
- Lizenz: ~60 USD/Nutzer/Monat (mit Mindestabnahme).
- 500 Nutzer, 5 Jahre: ~1.800.000 USD (≈ 1.650.000 EUR).
- Einschränkung: kein direkter Zugriff auf interne Systeme. Daten manuell oder per API zuführen.
Google Gemini for Workspace
- Lizenz: 30 USD/Nutzer/Monat (Business) oder 36 USD (Enterprise).
- 500 Nutzer, 5 Jahre: 900.000–1.080.000 USD (≈ 825.000–990.000 EUR).
- Voraussetzung: Google Workspace. Microsoft-Shops zahlen Migrationskosten obendrauf.
API-basierte Nutzung (OpenAI, Anthropic, Google)
- Kosten: pro Token / pro Request. Variabel, schwer planbar.
- Beispiel: GPT-4o bei 2,50 USD / 1M Input-Tokens, 10 USD / 1M Output (Stand 2025).
- Problem: Intensive Workloads explodieren schnell. 500 Dokumente pro Tag landen bei 5.000–15.000 EUR/Monat, bevor jemand hinschaut.
Die versteckten Kosten
Lizenzen sind die Spitze:
| Kostenfaktor | Typischer Anteil | Oft vergessen? |
|---|---|---|
| Lizenzen | 60–70 % | Nein |
| Implementierung & Integration | 15–25 % | Ja |
| Schulungen | 5–10 % | Ja |
| Laufender Support | 5–10 % / Jahr | Ja |
| Compliance (AVV, DSFA, Audits) | Variabel | Ja |
| Vendor Lock-in (Migrationskosten) | Unbekannt, bis Sie es versuchen | Ja |
Dazu: ein Kostenpunkt, den kein Anbieter beziffert. Datenhoheit. Wenn Verträge, Kundenkommunikation und interne Dokumente in einer US-Cloud verarbeitet werden, haben Sie keine vollständige Kontrolle mehr. Kein klassischer Posten — aber ein Risiko, das sich in DSGVO-Bußgeldern materialisieren kann.
Ein weiteres Risiko, das selten in TCO-Rechnungen auftaucht: Cloud-Spend überschreitet regelmäßig das Budget. Laut Flexera State of the Cloud Report 2024 liegen die tatsächlichen Cloud-Ausgaben im Schnitt 32 % über Budget (Flexera, 2024).
Was On-Premise-KI kostet
Höher am Anfang, keine Per-User-Gebühren. Das ändert die Kurve.
Schlüsselfertige On-Premise-Appliance
- Hardware + Software + Setup: ab ~52.000 EUR
- Laufende Kosten: Wartung und Strom ~3.000–5.000 EUR/Jahr
- 5-Jahres-TCO: ~67.000–77.000 EUR
- Nutzer: unbegrenzt. Keine Per-User-Lizenz. Keine Token-Limits.
Selbst gehostete Open-Source-KI (Llama, Mistral)
- Hardware: GPU-Server ab ~15.000–40.000 EUR (NVIDIA A100/H100)
- Setup: internes IT-Team oder Integrator — 20.000–80.000 EUR
- Wartung: eigenes Team — laufende Personalkosten
- 5-Jahres-TCO: 100.000–300.000 EUR, stark abhängig von Komplexität und Eigenleistung
Die volle TCO-Rechnung: 500 Nutzer, 5 Jahre
| Lösung | 5-Jahres-TCO | Pro Nutzer / Monat | DSGVO-Risiko | Wartungsaufwand |
|---|---|---|---|---|
| Microsoft Copilot | 504K–672K EUR | 17–22 EUR | Mittel (Drittlandtransfer) | Niedrig (SaaS) |
| ChatGPT Enterprise | ~1.650K EUR | ~55 EUR | Hoch (US-Cloud) | Niedrig |
| Google Gemini Enterprise | 825K–990K EUR | 28–33 EUR | Hoch (US-Cloud) | Niedrig |
| On-Premise (schlüsselfertige Appliance) | 67K–77K EUR | 2–3 EUR | Kein Risiko | Mittel |
| Open Source selbst gehostet | 100K–300K EUR | 3–10 EUR | Kein Risiko | Hoch |
Gleiche Lücke, jedes Mal: On-Premise ist im Maßstab 7–20× günstiger als Cloud-KI — und entfernt parallel das Datenschutzproblem.
Warum die Lücke so groß ist
Das Per-User-Modell der Cloud skaliert linear: 2× Nutzer, 2× Kosten. On-Premise skaliert die Hardware-Anforderung, nicht die Rechnung — und ein leistungsfähiger GPU-Server für 500 Nutzer kostet einen Bruchteil der kumulierten Lizenzgebühren.
Dazu: ein strukturelles Problem der Cloud-Preise. Sie sind für den US-Markt kalkuliert, wo die Datenschutzanforderungen niedriger liegen. Europäische Unternehmen zahlen den gleichen Listenpreis plus die Kosten der DSGVO-Compliance — AVVs, DSFAs, Drittlandtransfer-Absicherung, Betriebsratsvereinbarungen. Diese „versteckte Compliance-Steuer” steht in keinem Cloud-TCO-Rechner. Sie steht im Kalender Ihres Teams.
Der Haken bei On-Premise: Anfangsinvestition und lokale Infrastruktur. Was überrascht: kein ML-Team, kein Rechenzentrum, ein Serverschrank reicht. Schlüsselfertige Lösungen wie contboxx Vault liefern die Hardware mit.
TCO für Ihren Fall rechnen Wie viel zahlen Sie aktuell für KI — und was könnten Sie sparen? Fünfzehn Minuten, dann steht die Rechnung. Kostenlose Demo buchen
Der Faktor, den niemand beziffert: Opportunitätskosten
Was kostet es, wenn Ihre KI nur E-Mails und Teams-Chats sieht — aber nicht die Verträge in SAP, die Dokumentation in Confluence oder die Dateien auf dem Netzlaufwerk? Copilot kennt nur Microsoft 365. Für den Rest bleibt manuelle Suche.
Schlüsselfertige On-Premise-Plattformen mit breiter Reichweite (rund 40 Quellen) erschließen das gesamte Unternehmenswissen. Dieser Produktivitätsgewinn steht nicht in der TCO-Tabelle. Er ist der eigentliche Grund, warum Unternehmen wechseln.
Wann Cloud-KI trotzdem sinnvoll ist
Fairerweise:
Cloud ist sinnvoll, wenn:
- Sie weniger als 50 Nutzer haben (Per-User-Kosten bleiben klein)
- Ihre Daten nicht sensibel sind (keine personenbezogenen Daten, kein IP)
- Sie in Tagen starten müssen und kein Rechenzentrum haben
- Sie bereits tief im Ökosystem des Anbieters stecken
On-Premise ist sinnvoll, wenn:
- Sie mehr als 200 Nutzer haben (Skaleneffekt der Fixkosten)
- Sie sensible Daten verarbeiten (Verträge, HR, Kundenkommunikation)
- Compliance nicht verhandelbar ist
- Sie sich nicht an einen Anbieter binden wollen
- Sie über mehr als ein Ökosystem suchen müssen (SharePoint + SAP + Confluence + Netzlaufwerke)
Häufig gestellte Fragen
Was kostet KI pro Mitarbeiter im Monat?
Cloud-KI: 17–55 EUR pro Nutzer/Monat (Copilot ~28 EUR, ChatGPT Enterprise ~55 EUR). On-Premise: ~2–3 EUR pro Nutzer/Monat bei 500 Nutzern über 5 Jahre. Cloud skaliert linear mit der Nutzerzahl. On-Premise bleibt weitgehend fix — daher die Schere.
Ist On-Premise-KI wirklich günstiger als Cloud-KI?
Ab rund 200 Nutzern ja — deutlich. Die Fixkosten (ab 52.000 EUR) verteilen sich auf alle Nutzer ohne Per-Kopf-Lizenz. Bei 500 Nutzern über 5 Jahre ist On-Premise um Faktor 7–20 günstiger. Unter 50 Nutzern kann Cloud gewinnen, weil die Anfangsinvestition entfällt.
Welche versteckten Kosten hat Cloud-KI?
Implementierung (15–25 % der Gesamtkosten), Schulungen (5–10 %), laufender Support (5–10 %/Jahr), Compliance-Aufwand, Vendor Lock-in. Dazu Shelfware: laut Gartner nutzen nur 30–40 % der Copilot-Lizenznehmer das Tool regelmäßig. Tatsächliche Cloud-Ausgaben liegen laut Flexera 32 % über Budget. Steht auf keiner Preisseite.
Fazit
Die KI-Kostenfrage ist keine technische. Sie ist strategisch. Cloud gewinnt an Tag eins und verliert im dritten Jahr. On-Premise verlangt die Anfangsinvestition und zahlt 80–95 % über den Lifecycle zurück — bei voller Datenkontrolle obendrauf.
Die richtige Frage ist nicht „Können wir uns On-Premise leisten?” Sondern: „Können wir uns Cloud langfristig leisten?”
Wer Schatten-KI im Unternehmen durch eine kontrollierte Lösung ersetzen will, fängt mit der Kostenrechnung an, nicht mit der Feature-Liste.
TCO ab 2 EUR pro Nutzer pro Monat contboxx Vault: On-Premise, keine Per-User-Lizenzen, keine Token-Limits.