ADAMAS Blog
Local-First-KI vs. Cloud: Die ehrliche Kostenrechnung für ein Unternehmen mit 5–50 Mitarbeitern
In den letzten Jahren lautete die Standardannahme: Ernsthafte KI bedeutet Cloud-KI — ein Abonnement pro Arbeitsplatz für alle, eine API-Rechnung für alles andere und ein Budgetposten, der jedes Quartal still wächst. Diese Annahme war richtig, solange leistungsfähige Modelle nur in Rechenzentren liefen. Das stimmt nicht mehr — und für ein Unternehmen mit 5–50 Mitarbeitern hat sich die Wirtschaftlichkeit deutlicher gedreht, als die meisten Gründer ahnen. Dieser Beitrag ist die Kostenrechnung, ehrlich aufgeschlüsselt — einschließlich der Stellen, an denen die Cloud weiterhin gewinnt.
Was sich geändert hat: leistungsfähige Modelle auf Consumer-Hardware
Was Cloud-KI zur Pflicht machte, war die Größenordnung: Die Modelle, die sich zu nutzen lohnten, brauchten Hardware, die kein kleines Unternehmen kaufen würde. Das ist vorbei. Offene Modelle, die Sie heute auf einer Consumer-Maschine betreiben können — von der Sorte, die auf einem Regal steht und weniger kostet als ein Laptop —, sind wirklich gut in der Arbeit, für die die meisten Unternehmen KI tatsächlich einsetzen: Meetings zusammenfassen, Dokumente entwerfen, Struktur aus unordentlichem Text extrahieren, Fragen zu den eigenen Dateien beantworten. Keine Benchmarks. Die unspektakulären, täglichen 80 %.
Diese letzte Zahl ist nicht rhetorisch gemeint. In einem Local-First-Setup wie ADAMAS — das auf einem Mac Mini M4 läuft, den der Kunde kauft und besitzt — laufen rund 80 % der Arbeitslasten vollständig auf lokaler Hardware. Der verbleibende Anteil ist das wirklich Schwere — und dazu kommen wir noch, denn so zu tun, als gäbe es ihn nicht, ist die Art, wie Anbieter Ihr Vertrauen verlieren.
Der Cloud-Kostenstapel, Posten für Posten
Die Preisgestaltung von Cloud-KI hat eine Form, und die Form ist das Problem. Erstens, Abonnements pro Arbeitsplatz: Jeder Assistent, jeder Copilot und jede "KI-gestützte" Stufe eines Tools, das Sie ohnehin schon bezahlen, wird pro Nutzer pro Monat abgerechnet — die Rechnung skaliert also mit der Mitarbeiterzahl, nicht mit dem Nutzen. Stellen Sie fünf Personen ein, zahlen Sie fünf weitere Abonnements — unabhängig davon, ob diese fünf Personen die Tools intensiv nutzen. Zweitens, API-Abrechnung pro Aufruf: Alles, was Sie automatisieren, wird pro Aufruf berechnet, was bedeutet, dass Ihre Kosten genau dann wachsen, wenn die Nutzung der Sache erfolgreich ist. Drittens, der Verbundeffekt: Beides stapelt sich über Tools hinweg, und kaum jemand prüft die Überschneidungen. Die meisten Gründer, mit denen wir sprechen, können nicht sagen, wie hoch ihre gesamten KI-Ausgaben sind, ohne vier Rechnungen zu öffnen.
Nichts davon ist ein Skandal. Es ist schlicht ein Preismodell, das für die Wirtschaftlichkeit des Anbieters entworfen wurde, nicht für Ihre. Preise pro Arbeitsplatz sind großartig für denjenigen, der die Arbeitsplätze verkauft.
Der lokale Kostenstapel, Posten für Posten
Local-First hat eine andere Form: einmalige Hardware in Ihrem Eigentum, plus Strom, plus ein optionaler, nutzungsbasiert abgerechneter Zusatzbetrag für die seltenen Aufgaben, die Sie bewusst an ein Frontier-Cloud-Modell senden. Die Hardware ist eine Kapitalanschaffung, kein Abonnement — ihr ist egal, wie viele Personen in Ihrem Team sind. Der Strom für eine Maschine wie einen Mac Mini M4 bei dieser Art von Arbeitslast liegt typischerweise bei rund $2–3 im Monat. Das ist kein Tippfehler; kleine Apple-Silicon-Maschinen sind bemerkenswert effizient. Und weil die Hybrid-Route opt-in und nutzungsbasiert ist, zahlen Sie Cloud-Tarife für Ausnahmen, statt Abonnements für alles zu bezahlen. Wie dieses Routing genau funktioniert, sehen Sie in der ADAMAS-Architekturübersicht.
Ein durchgerechnetes Beispiel — typisch, nicht versprochen
Zahlen, mit dem Vorbehalt gleich vorweg: Dies sind typische Werte für die gründergeführten Unternehmen, mit denen wir arbeiten (5–50 Mitarbeiter, $2M–$5M Umsatz), keine Garantie — und Ihre eigenen Rechnungen erzählen vielleicht eine andere Geschichte. Die Cloud-KI-Ausgaben, die ein Local-First-Setup typischerweise ersetzt, liegen bei $200–459 pro Monat — eine Mischung aus KI-Abonnements pro Arbeitsplatz und API-Nutzung. Rund $2,400–5,500 im Jahr, jedes Jahr, wachsend mit dem Team. Die lokale Seite: eine einmalige Hardware-Anschaffung, die dem Kunden vollständig gehört, plus etwa $2–3 im Monat Strom — in der Größenordnung von $30 laufender Kosten pro Jahr — plus der kleine nutzungsbasierte Betrag, den die gelegentliche freigegebene Cloud-Aufgabe hinzufügt. Die wiederkehrenden Ausgaben schrumpfen nicht; sie verschwinden beinahe. Der ehrliche Vergleich lautet: eine einmalige Anschaffung gegen ein dauerhaftes, an die Mitarbeiterzahl gekoppeltes Abonnement — und über jeden Zeitraum von mehr als einem Jahr ist das kein knappes Rennen.
Die Faktoren, die auf keiner Rechnung stehen
Selbst wenn die Kostenrechnung unentschieden ausginge, würden vier Dinge die Entscheidung kippen. IP-Schutz: Bei Cloud-KI durchlaufen Ihre Preislogik, Ihre Kundenlisten und Ihre internen Überlegungen die Server eines anderen — zu Bedingungen, die Sie nicht geschrieben haben und nicht einfrieren können. Auf Ihrer eigenen Hardware tun sie das nicht. DSGVO: Gerade für Unternehmen im DACH-Raum lösen sich bei Daten, die eine Maschine in Ihren Räumen nie verlassen, die Fragen nach Auftragsverarbeitern und grenzüberschreitenden Transfers weitgehend auf — nur ausdrücklich freigegebene Aufgaben verlassen jemals die Box. Vendor-Lock-in: Ein Abonnement-Anbieter kann Preise erhöhen, Modelle austauschen oder Funktionen einstellen, und Ihr einziger Zug ist, es hinzunehmen; Hardware in Ihrem Eigentum verhandelt keine Bedingungen nach. Offline-Betrieb: Ein lokales System arbeitet weiter, wenn Ihr Internet — oder die Statusseite des Anbieters — es nicht tut.
Wo die Cloud weiterhin gewinnt — und was daraus folgt
Ehrlichkeitsklausel: Frontier-Cloud-Modelle sind weiterhin stärker als alles, was Sie lokal betreiben können. Bei seltenen, schweren Aufgaben — langem Schlussfolgern über viele Dokumente hinweg, den härtesten Analysen, Generierung auf Frontier-Niveau — ist der Abstand real, und wer Ihnen etwas anderes erzählt, will Ihnen etwas verkaufen. Die falsche Schlussfolgerung lautet: "Also alles aus der Cloud bezahlen." Die richtige Schlussfolgerung ist ein Hybrid: Die routinemäßigen 80 % lokal betreiben, wo Wirtschaftlichkeit und Datenschutz unschlagbar sind, und die außergewöhnlichen 20 % an ein Frontier-Modell weiterleiten — opt-in, Aufgabe für Aufgabe, nutzungsbasiert abgerechnet. Sie bekommen Frontier-Leistung, wenn es wirklich darauf ankommt, und hören auf, sie für die Dienstagnachmittag-Zusammenfassung zu mieten, die ein lokales Modell problemlos erledigt.
Häufig gestellte Fragen
Ist lokale KI wirklich günstiger als Cloud-KI-Abonnements?
Bei den laufenden Kosten typischerweise ja. Cloud-KI wird pro Arbeitsplatz und pro API-Aufruf abgerechnet, die Rechnung wächst also mit Mitarbeiterzahl und Nutzung. Ein lokales Setup ist eine einmalige Hardware-Anschaffung plus Strom — typischerweise rund $2–3 im Monat für eine Maschine wie einen Mac Mini M4. Ob die Gesamtrechnung für Sie aufgeht, hängt davon ab, was Sie derzeit ausgeben — deshalb zählt das Durchrechnen Ihrer eigenen Zahlen mehr als jeder typische Wert.
Was kostet es, KI lokal zu betreiben?
Drei Dinge: eine einmalige Hardware-Anschaffung (eine kleine Maschine in Ihrem Eigentum, etwa ein Mac Mini M4), Stromkosten von rund $2–3 im Monat bei typischer Nutzung sowie ein optionaler, nutzungsbasiert abgerechneter Zusatzbetrag für die seltenen Aufgaben, die Sie bewusst an ein Frontier-Cloud-Modell weiterleiten. Es gibt keine Gebühren pro Arbeitsplatz — neue Teammitglieder verursachen also keine zusätzlichen Kosten.
Sind lokale KI-Modelle gut genug für echte Geschäftsarbeit?
Für den Großteil der täglichen Arbeit — Zusammenfassen, Entwerfen, Extrahieren, Suchen und Beantworten von Fragen zu Ihren eigenen Dokumenten — sind leistungsfähige offene Modelle auf Consumer-Hardware inzwischen wirklich ausreichend. In einem Setup wie ADAMAS laufen rund 80 % der Arbeitslasten lokal. Der Rest sind schwerere, seltenere Aufgaben, bei denen Frontier-Cloud-Modelle weiterhin im Vorteil sind.
Was ist mit den Aufgaben, die lokale Modelle nicht bewältigen?
Genau dafür gibt es eine Opt-in-Hybrid-Route. Die ehrliche Position lautet: Frontier-Cloud-Modelle sind bei seltenen, schweren Aufgaben weiterhin stärker. Ein gut konzipiertes Local-First-System hält standardmäßig alles lokal und leitet eine konkrete Aufgabe nur dann an die Cloud weiter, wenn Sie das ausdrücklich freigeben — Sie zahlen also nutzungsbasierte Tarife für Ausnahmen statt Abonnements für alles.
Hilft Local-First-KI bei DSGVO und Datenschutz?
Es vereinfacht das Problem erheblich. Wenn die Dokumente und Entscheidungsaufzeichnungen Ihres Unternehmens auf Hardware verarbeitet werden, die Ihnen gehört und in Ihren Räumen steht, gibt es für diese Daten standardmäßig keinen Drittanbieter als Auftragsverarbeiter, keine Frage des grenzüberschreitenden Datentransfers und keine Anbieter-AGB-Änderungen, die Sie überwachen müssten. Daten verlassen die Maschine nur für Aufgaben, die Sie ausdrücklich freigeben.
Glauben Sie typischen Zahlen nicht einfach — rechnen Sie Ihre eigenen durch, mit dem kostenlosen Local-First AI Kostenrechner; das dauert etwa zwei Minuten. Die ausführlichere Fassung dieses Arguments, einschließlich der Frage, wie das Hybrid-Routing in der Praxis funktioniert, finden Sie im kostenlosen Leitfaden Local-First AI for Founders. Mehr darüber, wie ADAMAS funktioniert, erfahren Sie auf der Startseite.
Weiterlesen: Wenn das Firmenwissen nur in einem Kopf steckt