Die zentrale Frage jeder KI-Initiative
Unternehmen, die KI einführen wollen, stehen vor einer fundamentalen Entscheidung: Setzen wir auf Open-Source-Modelle mit voller Kontrolle oder auf proprietäre Cloud-Lösungen mit schnellem Einstieg?
Diese Frage ist keine rein technische. Sie betrifft Datenschutz, Kosten, Abhängigkeiten und strategische Flexibilität. Als Controller mit KI-Expertise ist meine Aufgabe, diese Entscheidung wirtschaftlich zu bewerten – nicht aus technologischer Begeisterung, sondern aus Unternehmens-Perspektive.
Die folgende Analyse zeigt anhand eines realen Controlling-Use-Cases, wie eine strukturierte Make-or-Buy-Entscheidung aussehen kann – und warum die Antwort selten "entweder/oder", sondern meist "sowohl als auch" lautet.
Praxisszenario: Automatisierte Monatsberichtserstellung
Ausgangssituation
RegioExpress GmbH – ein mittelständisches Schienenverkehrsunternehmen mit 850 Mitarbeitern. Das Controlling-Team (8 Mitarbeiter) erstellt monatlich umfangreiche Berichte zu Kennzahlen wie Pünktlichkeit, Fahrgastzahlen, Kosten pro Zugkilometer und Energieverbrauch.
Problem: Jeder Monatsabschluss erfordert 3-4 Tage manuelle Arbeit für Datenkonsolidierung, Abweichungsanalyse und Kommentierung. Die Berichte gehen an Geschäftsführung, Betriebsrat und den öffentlichen Auftraggeber.
Ziel: KI-gestützte Automatisierung der Abweichungskommentierung zur Reduzierung des Zeitaufwands um 60-70%.
Die Kandidaten
Open Source
Llama 3.1 70B (Meta)
Ansatz: Self-Hosting auf eigener Infrastruktur
- Kosten: ~800-1.200 EUR/Monat (Server)
- Setup: 5.000-8.000 EUR initial
- Kontextfenster: 128k Token
- Fine-Tuning möglich
- Vollständige Datenkontrolle
Proprietär
Claude 3.5 Sonnet (Anthropic)
Ansatz: Cloud-basiert via API
- Kosten: ~500-800 EUR/Monat (Lizenzen + API)
- Setup: Keine Initialkosten
- Kontextfenster: 200k Token
- Nur Prompt Engineering
- DSGVO-konform (EU-Server)
Systematischer Vergleich
| Kriterium |
Llama 3.1 (Open Source) |
Claude 3.5 (Proprietär) |
| Flexibilität |
Sehr hoch – Fine-Tuning für spezifische Controlling-Begriffe möglich |
Mittel – Nur Prompt Engineering, aber exzellente Out-of-the-box Performance |
| Kosten (kurzfristig) |
Höher – 5.000-8.000 EUR Setup + 800-1.200 EUR/Monat |
Niedriger – Keine Setup-Kosten, 500-800 EUR/Monat |
| Kosten (langfristig) |
Günstiger bei hohem Volumen – amortisiert sich nach 12-18 Monaten |
Linear steigend – Preiserhöhungen möglich, Skalierung = höhere Kosten |
| Datenschutz |
Sehr hoch – Daten bleiben vollständig im eigenen Netz |
Hoch – DSGVO-konform, aber Daten verlassen Unternehmen |
| Support |
Community – Kein kommerzieller Support, internes Know-how erforderlich |
Professionell – SLA, direkter Support, Enterprise-Optionen |
| Time-to-Market |
3-4 Monate – Setup, Testing, Integration |
4-8 Wochen – Schnelle API-Integration |
| Abhängigkeit |
IT-Team + Cloud-Provider (z.B. AWS) |
Vendor Lock-in bei Anthropic |
Entscheidungsmatrix
Gewichtete Bewertung (Skala 1-5, wobei 5 = optimal) unter Berücksichtigung der Unternehmens-Prioritäten:
| Kriterium |
Gewichtung |
Llama 3.1 |
Gewichtet |
Claude 3.5 |
Gewichtet |
| Datenschutz & Sicherheit |
30% |
5 |
1,50 |
3 |
0,90 |
| Time-to-Market |
20% |
2 |
0,40 |
5 |
1,00 |
| Kosten (3 Jahre TCO) |
20% |
4 |
0,80 |
3 |
0,60 |
| Analysequalität |
15% |
4 |
0,60 |
5 |
0,75 |
| Skalierbarkeit |
10% |
5 |
0,50 |
4 |
0,40 |
| Support & Risikominimierung |
5% |
2 |
0,10 |
5 |
0,25 |
| Gesamtscore |
100% |
- |
3,90 |
- |
3,90 |
Gewichtungs-Begründung
- Datenschutz (30%): Höchste Priorität wegen öffentlichem Auftraggeber und Betriebsrat-Sensibilität
- Time-to-Market (20%): Geschäftsführung erwartet schnelle Effizienzgewinne
- Kosten (20%): Mittelstand mit begrenztem Budget (50.000 EUR für 2026)
- Analysequalität (15%): Beide Lösungen leistungsfähig, aber Claude besser out-of-the-box
- Skalierbarkeit (10%): Zukünftige Use Cases (Forecasting, Wartung) geplant
- Support (5%): IT-Team kompetent, aber keine KI-Spezialisten
Total Cost of Ownership (3 Jahre)
Claude 3.5 Sonnet
- Keine Setup-Kosten
- Laufende Kosten: 800 EUR/Monat × 36 Monate = 28.800 EUR
- Bei Skalierung auf weitere Use Cases: ~70.000 EUR (Kosten steigen linear)
Llama 3.1 70B
- Setup-Kosten: 7.000 EUR (DevOps, Infrastruktur, Testing)
- Laufende Kosten: 1.000 EUR/Monat × 36 Monate = 36.000 EUR
- Gesamt: 43.000 EUR
- Bei Skalierung: ~50.000 EUR (Kosten bleiben weitgehend konstant)
Kritischer Punkt: Die TCO-Rechnung zeigt: Kurzfristig ist Claude günstiger (28.800 vs. 43.000 EUR). Aber bei Skalierung dreht sich das Verhältnis (70.000 vs. 50.000 EUR).
Management-Empfehlung: Hybrid-Strategie
Die Entscheidungsmatrix zeigt einen Gleichstand (3,90:3,90) – was die Komplexität dieser Entscheidung unterstreicht. Meine Empfehlung: Zweistufiger Hybrid-Ansatz.
Phase 1: Claude als Pilot (Monate 1-9)
Warum Claude zuerst?
- Risikominimierung: Mit begrenztem KI-Know-how würde ein direkter Llama-Start das Projekterfolgsrisiko erhöhen
- Proof of Concept: Business Case schnell validieren – wenn KI nicht die erwartete Effizienz bringt, haben wir nur 4.000-6.000 EUR investiert statt 15.000-20.000 EUR
- Lernkurve: Team lernt Prompt Engineering mit nutzerfreundlicher Lösung – Expertise ist später auf Llama übertragbar
- Time-to-Value: Geschäftsführung sieht Erfolge innerhalb von 8 Wochen, nicht erst nach 4 Monaten
Kritische Erfolgsfaktoren:
- Klare KPIs definieren: Zeitersparnis >60%, Kommentarqualität (Audit durch Senior Controller)
- DSGVO-Assessment mit Anthropic, Auftraggeber informieren
- Alle Prompts und Workflows dokumentieren für spätere Migration
- Monatliches Review: Was funktioniert gut, was erfordert Nachjustierung?
Phase 2: Migration zu Llama (ab Monat 6 parallel)
Warum zu Llama wechseln?
- Datensouveränität: Langfristig ist On-Premise unumgänglich für sensible Betriebsdaten und Auftraggeber-Compliance
- Kosteneffizienz bei Skalierung: Bei geplanten weiteren Use Cases (Forecasting, Wartungsoptimierung) steigen Claude-Kosten auf ~70.000 EUR, Llama bleibt bei ~50.000 EUR
- Fine-Tuning-Potenzial: Llama ermöglicht Spezialisierung auf Bahn-Controlling-Terminologie, was Analysequalität weiter steigert
- Strategische Unabhängigkeit: Kein Vendor Lock-in, keine Abhängigkeit von Preisgestaltung Dritter
Vorbereitung parallel zum Pilot:
- DevOps-Schulung für IT-Team (Azure ML, Container-Orchestrierung)
- Infrastruktur-Setup: Private Cloud mit Datenschutz-Zertifizierung
- Erster Fine-Tuning-Datensatz: 50-100 kommentierte Monatsberichte
Phase 3: Übergang (Monat 9-12)
- Parallel-Betrieb: Beide Systeme analysieren identische Daten, Qualitätsvergleich
- Graduelle Migration: Erst unkritische Kennzahlen, dann sensible Bereiche
- Rückfall-Option: Claude-Zugang bleibt 6 Monate als Backup aktiv
Checkliste: Make-or-Buy-Entscheidung bei KI
Vor der Entscheidung klären:
Datenschutz & Compliance
- Welche Daten werden verarbeitet? (Personenbezogen, vertraulich, öffentlich?)
- Gibt es externe Stakeholder mit Compliance-Anforderungen? (Auftraggeber, Betriebsrat)
- Ist DSGVO-konforme Cloud-Lösung ausreichend oder wird On-Premise benötigt?
Kosten & Budget
- Welches Budget steht zur Verfügung? (Initial vs. laufend)
- Wie viele Use Cases sind geplant? (Einzelprojekt oder Plattform-Ansatz?)
- Welcher Zeithorizont? (TCO über 1, 3 oder 5 Jahre betrachten)
Ressourcen & Know-how
- Hat das IT-Team KI-Expertise? (Wenn nein: Proprietär bevorzugen oder externes Know-how einkaufen)
- Wie viel Zeit steht für Setup zur Verfügung? (Zeitdruck spricht für Cloud-Lösung)
- Gibt es Kapazität für kontinuierliche Wartung? (Open Source erfordert laufende Betreuung)
Strategische Überlegungen
- Wie kritisch ist diese KI-Anwendung für das Geschäftsmodell? (Kritisch = mehr Kontrolle gewünscht)
- Ist Fine-Tuning auf Fachterminologie erforderlich? (Ja = Open Source bevorzugen)
- Wie abhängig will man von einem Anbieter sein? (Vendor Lock-in-Risiko bewerten)
Wichtig: Es gibt keine universelle "richtige" Antwort. Die beste Lösung hängt von Unternehmenskontext, Ressourcen und strategischen Zielen ab. Eine Hybrid-Strategie minimiert oft Risiken und kombiniert die Vorteile beider Welten.
Fazit
Die Make-or-Buy-Entscheidung bei KI ist keine rein technologische Frage, sondern eine strategische Managemententscheidung mit erheblichen Auswirkungen auf Kosten, Datenschutz und Flexibilität.
Kernerkenntnisse:
- Keine pauschale Empfehlung möglich: Die optimale Lösung hängt von Datenschutzanforderungen, Budget, internen Ressourcen und Zeithorizont ab
- TCO über ROI: Kurzfristige Kostenbetrachtung kann täuschen – Skalierungseffekte und Vendor-Lock-in-Risiken müssen einbezogen werden
- Hybrid-Strategien minimieren Risiko: Pilot mit proprietärer Lösung + paralleler Aufbau eigener Infrastruktur kombiniert Speed-to-Market mit langfristiger Unabhängigkeit
- Controller als Entscheidungs-Enabler: Strukturierte Entscheidungsmatrizen, TCO-Berechnungen und Risikobewertungen sind essenziell für fundierte Management-Entscheidungen
Als Controller mit KI-Expertise ist meine Aufgabe nicht, für eine bestimmte Technologie zu werben, sondern die wirtschaftlich und strategisch sinnvollste Lösung zu identifizieren – auch wenn diese "sowohl als auch" statt "entweder oder" lautet.