Warum gibt es eigentlich lokale KIs?

Wie Meta möglicherweise einen Wettbewerb beschleunigt hat, der künstliche Intelligenz zur Massenware macht

Seit einiger Zeit experimentiere ich mit lokalen KIs. Das sind Sprachmodelle, die nicht irgendwo in einem Rechenzentrum laufen, sondern direkt auf dem eigenen Rechner. Man lädt ein Modell herunter, startet beispielsweise LM Studio und kann anschließend beliebig viele Fragen stellen. Es fallen keine nutzungsabhängigen Gebühren an, es gibt keine künstlich gesetzten Tageslimits, und private Texte, Dokumente oder Quellcodes müssen den eigenen Rechner nicht verlassen.

Natürlich sind lokale Modelle nicht in jeder Hinsicht so gut wie die leistungsfähigsten Cloud-KIs. Aber sie entwickeln sich erstaunlich schnell. Für viele alltägliche Aufgaben reichen sie bereits aus: Texte überarbeiten, Übersetzungen anfertigen, Programme schreiben, technische Fragen beantworten oder private Dokumente durchsuchen. Gerade für Menschen, die viel mit Computern arbeiten, sind sie damit nicht mehr bloß eine technische Spielerei, sondern ein ernstzunehmendes Werkzeug.

Wirtschaftlich ist diese Entwicklung erstaunlich.

Denn solche Modelle werden nicht nur von kleinen Open-Source-Projekten veröffentlicht. Meta bietet die Llama-Familie an, Google Gemma, Microsoft seine Phi-Modelle, Alibaba Qwen, Mistral verschiedene kleinere Modelle und DeepSeek unter anderem frei herunterladbare Varianten seiner Reasoning-Modelle. Nicht alle diese Modelle sind im engeren Sinne Open Source. Einige besitzen lediglich offen zugängliche Modellgewichte und unterliegen eigenen Lizenzbedingungen. Gemeinsam ist ihnen jedoch, dass man sie herunterladen und selbst betreiben kann.

Damit entsteht eine merkwürdige Situation: Unternehmen investieren erhebliche Summen in die Entwicklung von KI-Modellen und stellen sie anschließend so zur Verfügung, dass ein Teil ihrer potenziellen Kunden keine kostenpflichtige Cloud-KI mehr benötigt.

Warum tun sie das?

Die einfachen Anfragen wären eigentlich ein interessantes Geschäft

Es wird häufig gesagt, lokale Modelle seien lediglich eine Ergänzung zu den großen Cloud-KIs. Das ist wahrscheinlich richtig. Aber es klingt harmloser, als es ist.

Die meisten Menschen verwenden künstliche Intelligenz nicht überwiegend für mathematische Forschungsprobleme, komplexe Softwarearchitekturen oder wissenschaftliche Spezialfragen. Sie lassen Texte korrigieren, E-Mails formulieren, Dokumente zusammenfassen, Programme erklären oder alltägliche Fragen beantworten.

Jede einzelne dieser Anfragen ist wenig wert. In der Summe hätten sie jedoch einen großen Markt bilden können.

Wenn künftig auf jedem leistungsfähigen Notebook und später möglicherweise auf jedem Smartphone eine ausreichend gute lokale KI läuft, verschwinden viele dieser Anfragen aus der Cloud. Den Anbietern bleiben weiterhin anspruchsvolle Aufgaben, aktuelle Informationen, professionelle Dienste und besonders leistungsfähige Modelle. Aber die breite Masse einfacher Anfragen lässt sich dann möglicherweise immer schwerer verkaufen.

Lokale KI spart den Anbietern zwar Rechenkosten. Eine Anfrage, die auf meinem eigenen Rechner verarbeitet wird, belastet kein fremdes Rechenzentrum. Gleichzeitig entfällt aber auch ein möglicher Umsatz. Die wirtschaftliche Wirkung besteht deshalb nicht nur in einer effizienteren Verteilung von Rechenleistung. Lokale Modelle können einen Teil des Marktes für Cloud-KIs tatsächlich entwerten.

Gerade deshalb ist die Rolle von Meta interessant.

Meta verdient sein Geld an einer anderen Stelle

Meta veröffentlichte mit Llama früh leistungsfähige Modelle, deren Gewichte heruntergeladen und selbst betrieben werden konnten. Mark Zuckerberg begründete diesen Kurs 2024 in einem längeren Text ungewöhnlich offen.

Der Verkauf von Zugängen zu KI-Modellen sei nicht Metas Geschäftsmodell.

Dieser Satz ist wichtig, weil er einen grundlegenden Unterschied zwischen Meta und einigen anderen KI-Anbietern beschreibt. Meta verdient sein Geld vor allem mit Werbung und sozialen Netzwerken. Das Unternehmen benötigt leistungsfähige KI für Empfehlungen, Moderation, Werbung, Assistenten und zukünftige Anwendungen. Es ist für Meta jedoch nicht zwingend erforderlich, an jeder einzelnen KI-Anfrage zu verdienen.

Für ein Unternehmen, dessen wesentliches Produkt gerade der kostenpflichtige Zugriff auf ein besonders leistungsfähiges Sprachmodell ist, sieht die Sache anders aus. Wenn gute Modelle frei verfügbar werden und auf dem eigenen Rechner laufen, sinkt der wirtschaftliche Wert einfacher Modellzugänge.

Meta konnte sich daher eher als manche Konkurrenten leisten, den Preis für grundlegende KI-Leistung nach unten zu drücken.

Zuckerberg beschrieb noch einen zweiten Beweggrund. Meta wolle bei einer zukünftig zentralen Technologie nicht erneut von einem geschlossenen System eines anderen Unternehmens abhängig werden. Er verwies dabei ausdrücklich auf die Erfahrungen mit Apple: Plattformbetreiber können Regeln festlegen, Schnittstellen kontrollieren und bestimmen, was andere Unternehmen auf ihren Geräten dürfen.

Eine vergleichbare Abhängigkeit wäre für Meta auch bei künstlicher Intelligenz problematisch. Wenn ein einzelner Anbieter die maßgebliche KI-Plattform kontrolliert, kann er Preise, Zugänge und Bedingungen festlegen. Andere Unternehmen müssten sich danach richten.

Für Meta lag es deshalb nahe, ein frei verfügbares Ökosystem rund um Llama zu fördern. Je leichter sich leistungsfähige Modelle selbst betreiben und anpassen lassen, desto schwieriger wird es für einen einzelnen Anbieter, an der Modellschicht eine dauerhaft lukrative Mautstation zu errichten.

Das ist keine Sabotage. Meta beschädigt kein fremdes Produkt und tut nichts Verwerfliches. Es handelt sich vielmehr um eine klassische Plattformstrategie: Ein Unternehmen versucht, eine Technologie, von der das eigene Geschäft zukünftig abhängen könnte, möglichst breit verfügbar und austauschbar zu machen.

Hat Meta damit eine Lawine ausgelöst?

Meta hat lokale KI nicht erfunden. Frei verfügbare Modelle, kleinere Sprachmodelle und selbst betriebene Machine-Learning-Systeme gab es bereits vorher. Auch andere Unternehmen verfolgen eigene Interessen.

Google kann mit Gemma sein Entwicklerökosystem stärken und lokale KI auf Smartphones, Browsern und Workstations bringen. Microsoft profitiert davon, wenn leistungsfähige KI direkt auf Windows-PCs und Edge-Geräten läuft. Alibaba und andere chinesische Anbieter haben ein naheliegendes Interesse daran, nicht von westlichen Plattformen abhängig zu sein. Kleinere Unternehmen wie Mistral benötigen frei verfügbare Modelle auch, um überhaupt eine größere Entwicklergemeinschaft zu erreichen. Hardwarehersteller wiederum profitieren davon, wenn Nutzer leistungsfähigere Grafikkarten und neue Rechner kaufen.

Es wäre deshalb zu einfach, die gesamte Entwicklung auf Meta zurückzuführen.

Trotzdem könnte Llama einen entscheidenden Unterschied gemacht haben. Meta war groß genug, um leistungsfähige Modelle zu veröffentlichen und innerhalb kurzer Zeit ein umfangreiches Ökosystem entstehen zu lassen. Andere Hersteller konnten diese Entwicklung nicht ignorieren.

Denn ein einmal veröffentlichtes Modell lässt sich nicht wieder einsammeln. Entwickler laden es herunter, quantisieren es, verkleinern es, passen es an bestimmte Aufgaben an und integrieren es in Programme. Rund um die Modelle entstehen Benutzeroberflächen, lokale Server, Datenbankanbindungen und Werkzeuge für autonome Agenten.

Mit jedem guten herunterladbaren Modell wächst nicht nur die Auswahl. Es wird auch schwieriger, gewöhnliche KI-Leistung dauerhaft teuer zu verkaufen.

Meta hat diesen Prozess vermutlich nicht allein verursacht. Aber das Unternehmen hatte einen besonderen wirtschaftlichen Anreiz, ihn zu beschleunigen.

Die Cloud wird nicht verschwinden

Trotzdem wäre es falsch, daraus das Ende der Cloud-KI abzuleiten.

Lokale Modelle kennen ohne zusätzliche Anbindung keine aktuellen Nachrichten, Preise oder Verfügbarkeiten. Sie sind bei besonders schwierigen Aufgaben häufig schwächer als die besten Cloud-Modelle. Sie besitzen begrenzten Arbeitsspeicher und Grafikspeicher. Und nicht jeder Nutzer möchte sich mit Modellformaten, Quantisierung und Kontextgrößen beschäftigen.

Wahrscheinlich entwickelt sich deshalb eine Arbeitsteilung.

Die lokale KI erledigt alltägliche Aufgaben schnell, privat und ohne laufende Gebühren. Für besonders anspruchsvolle Probleme greift sie gezielt auf große Modelle in der Cloud zurück. Für aktuelle Informationen verwendet sie Suchmaschinen, Datenbanken und andere externe Dienste.

Das wäre technisch sinnvoll und für Nutzer komfortabel. Für einige KI-Anbieter ist diese Entwicklung dennoch unangenehm, weil ihnen ausgerechnet die große Masse einfacher Anfragen teilweise verloren gehen könnte.

Vielleicht erinnert die Entwicklung ein wenig an den Übergang vom Großrechner zum Personal Computer. Früher liefen Programme zentral, während der Nutzer an einem Terminal saß. Später wanderte ein erheblicher Teil der Rechenleistung auf den eigenen Schreibtisch. Die Rechenzentren verschwanden dadurch nicht. Sie wurden sogar wichtiger. Aber ihre Rolle veränderte sich.

Mit künstlicher Intelligenz könnte gerade etwas Ähnliches geschehen. Anfangs war sie fast vollständig ein Cloud-Dienst. Nun zieht ein wachsender Teil der Intelligenz auf den eigenen Rechner um.

Vielleicht erscheint es uns irgendwann ebenso merkwürdig, für jede kleine Textkorrektur einen entfernten Server zu fragen, wie heute die Vorstellung, für jede Tabellenkalkulation einen Großrechner anzurufen.

Meta hat diese Entwicklung nicht allein ausgelöst. Aber Meta könnte wesentlich dazu beigetragen haben, dass sich eine technische Möglichkeit zu einem kaum noch aufzuhaltenden Wettbewerb entwickelt hat.

Das wäre keine unbeabsichtigte Nebenwirkung, sondern eine nachvollziehbare wirtschaftliche Strategie: Wer nicht hauptsächlich mit dem Verkauf von KI-Modellzugängen Geld verdient, kann ein starkes Interesse daran haben, genau diese Modellzugänge möglichst billig, frei verfügbar und austauschbar zu machen.

Quellen und weiterführende Links

[1] Meta: „Open Source AI Is the Path Forward“
Mark Zuckerberg erläutert, weshalb Meta auf frei verfügbare Llama-Modelle setzt. Besonders relevant sind seine Aussagen zum Geschäftsmodell und zur Vermeidung einer Abhängigkeit von geschlossenen Plattformen.
https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

[2] Meta: „Meta and Microsoft Introduce the Next Generation of Llama“
Meta beschreibt die Veröffentlichung von Llama 2 samt Modellgewichten für Forschung und kommerzielle Nutzung.
https://ai.meta.com/blog/llama-2/

[3] Open Source Initiative: „Meta’s LLaMa license is still not Open Source“
Die Open Source Initiative erläutert, weshalb sie Llama trotz herunterladbarer Modellgewichte nicht als Open Source im engeren Sinne betrachtet.
https://opensource.org/blog/metas-llama-license-is-still-not-open-source

[4] Google DeepMind: Gemma 4
Google beschreibt Gemma 4 als Familie offener Modelle für Reasoning, Coding-Assistenten und agentische Workflows. Die Modelle sind ausdrücklich für Consumer-GPUs und lokale Workstations optimiert.
https://deepmind.google/models/gemma/gemma-4/

[5] Microsoft Azure: Phi-Modelle
Microsoft positioniert Phi als kompakte Modellfamilie für Edge-Anwendungen und Umgebungen mit begrenzten Rechenressourcen.
https://azure.microsoft.com/en-us/blog/empowering-innovation-the-next-generation-of-the-phi-family/

[6] Qwen-Team: „Qwen3: Think Deeper, Act Faster“
Das Qwen-Team beschreibt ausdrücklich die lokale Nutzung seiner Modelle unter anderem mit Ollama, LM Studio und llama.cpp.
https://qwenlm.github.io/blog/qwen3/

[7] Mistral AI: „Mistral Small 3.1“
Mistral beschreibt ein herunterladbares Modell, das lokal auf einer einzelnen RTX 4090 oder einem Mac mit 32 Gigabyte RAM laufen kann.
https://mistral.ai/news/mistral-small-3-1/

[8] DeepSeek: „DeepSeek-R1 Release“
DeepSeek veröffentlichte neben dem großen Reasoning-Modell auch mehrere kleinere destillierte Varianten unter MIT-Lizenz.
https://api-docs.deepseek.com/news/news250120

steinlaus

steinlaus

Warum gibt es eigentlich lokale KIs?

Wie Meta möglicherweise einen Wettbewerb beschleunigt hat, der künstliche Intelligenz zur Massenware macht

Die einfachen Anfragen wären eigentlich ein interessantes Geschäft

Meta verdient sein Geld an einer anderen Stelle

Hat Meta damit eine Lawine ausgelöst?

Die Cloud wird nicht verschwinden

Quellen und weiterführende Links

Tinkerpete

Related Posts

Wie kreativ kann eine KI sein?

OpenClaw im Selbstversuch (mit Raspberry Pi)

Schreibe einen Kommentar Antwort abbrechen

You Missed

SKU-Recycling mit Preisschild

Gemini-Limits neu gedacht

Mitnahme nur im Kopf: Der riskante Grenzverkehr zwischen Apple und OpenAI

Ideen sind frei, Stücklisten nicht

Laser für Werkstatt und Hobby: Sicherheit, Leistung und Praxis im Härtetest

Goldrand und Grate: Ein Klassiker meldet sich zurück