Kurz gesagt: Ein Reuters-Bericht zeigt, dass Musks Chatbot Grok in US-Behörden kaum genutzt wird und gegenüber Modellen von OpenAI, Google und Anthropic deutlich zurückfällt. Gleichzeitig stützt SpaceX in seinen IPO-Plänen große Teile der Wachstumsstory auf Grok und Enterprise-AI. Zwischen dünner Adoption, Qualitätsfragen, heiklen „spicy“-Modi, Distillation von OpenAI-Modellen und einigen Ausnahmen wie einem Pentagon-Vertrag entsteht ein Spannungsfeld zwischen Versprechen und Praxis.
Zara: Die Zahlen sind schon ernüchternd: In über 400 dokumentierten Regierungsfällen taucht Grok oder xAI gerade dreimal auf, und dann nur für banale Aufgaben wie Textentwürfe oder Social-Media-Management – stets neben stärkeren Wettbewerbern. In der separaten Projektliste ist das Bild ähnlich mager. Selbst wenn die Daten unvollständig sind und bestimmte Bereiche fehlen, ist der Trend klar: Grok liegt qualitativ und in der Adoption hinten, Leaderboards bestätigen das. Für einen Enterprise-Push ist das ein schwaches Signal, zumal „spicy“-Modi rechtliche und reputative Risiken bergen.
Kael: Ich sehe die Datenlage differenzierter. Die Listen sind lückenhaft, Geheimdienste und Pentagon zählen kaum – ausgerechnet dort hat xAI einen 200-Millionen-Vertrag und nun die Freigabe für klassifizierte Netze erhalten. Das spricht für Sicherheits- und Integrationsfortschritte. Außerdem sind behördliche Beschaffungszyklen langsam; neue Modelle brauchen Zeit. Grok iteriert schnell, und Distillation ist branchenüblich – entscheidend ist, wie rasch xAI die Lücke in realen Workloads schließt.
Zara: Trotzdem: Auch in der kleineren Projektliste erscheint Grok nur dreimal, während Microsoft/OpenAI dutzendfach vertreten sind. Wenn Grok auf OpenAI-Modellen „lernt“ und trotzdem nicht vorbeizieht, ist das ein Qualitätsindiz. Für den Arbeitsplatz taugt ein Modell mit dokumentiert toxischen Ausgaben wenig, und SpaceX selbst warnt in der IPO-Unterlage vor erhöhten Haftungs- und Reputationsrisiken. Das sind rote Flaggen für Enterprise-Kunden.
Kael: Man sollte Consumer-„Spice“ und Enterprise-Governance trennen. Firmen-Deployments lassen sich strikt konfigurieren, auditieren und einkapseln – auch andere Anbieter hatten anfänglich Ausrutscher. Wenn Grok verlässlichere Latenz, bessere Kostenprofile oder spezielle Domänenkompetenz liefert, kann es trotz Benchmarks punkten, gerade in sensiblen Umgebungen mit Air-Gap-Anforderungen.
Zara: Was mich stört, ist der Mismatch zwischen Anspruch und Wirklichkeit. SpaceX schreibt seiner AI – vor allem Grok – einen gigantischen TAM von 28,5 Billionen Dollar zu. Wenn die Nutzung heute kaum sichtbar ist, trägt das die Erzählung nicht. Berichte, Banken zum Grok-Kauf zu drängen, um beim IPO mitzumachen, wirken wie kurzfristige Kosmetik statt Produkt-Markt-Fit.
Kael: Die Story zielt auf Synergien: Starlink als Verteilnetz, SpaceX-Telemetrie, Erdbeobachtung – Daten, Edge-Inferenz und Anwendungen aus einer Hand. Wenn Grok hier operative Effizienz hebt, braucht es nicht sofort Massenadoption in jeder Behörde. IPO-Dokumente malen naturgemäß groß; die Frage ist, ob xAI diese integrierte Pipeline in konkrete Referenzen übersetzt.
Zara: Selbst bei Synergien zählt am Ende Leistungsnachweis. Behörden nennen lieber Gemini oder Claude; Grok schafft es selten in die Top-10 der Benchmarks. Ohne klaren Vorsprung – Qualität, Sicherheit, Preis, Integrationen – bleibt Grok zweite Wahl. Und zweite Wahl gewinnt selten Standardisierungen.
Kael: Benchmarks sind Snapshots. In Ausschreibungen entscheiden oft TCO, Datenresidenz, Anpassbarkeit und Compliance. Manche Häuser meiden einzelne Anbieter aus Policy-Gründen – Raum für Alternativen. Wenn Grok Nischen mit maßgeschneiderten Workflows besetzt, kann daraus Traktion entstehen. Der Markt ist noch beweglich.
Zara: Die Sicherheits- und Moderationsbilanz von Grok und der Plattform X ist ein zusätzliches Hemmnis. Unternehmen und Regulatoren reagieren empfindlich auf toxische Ausgaben und Deepfake-Skandale; das erhöht Due-Diligence-Hürden und verlängert Sales-Zyklen. Wer Enterprise will, muss hier makellos liefern.
Kael: Einverstanden, Enterprise verlangt harte Guardrails, Audits und SLAs. Die Zulassung auf klassifizierten Netzen zeigt, dass xAI Governance-Schichten liefern kann. Wenn das Team Sicherheit priorisiert und messbare Upgrades bringt, kann sich der Ruf drehen – besonders dort, wo Integrations- und Souveränitätsanforderungen hoch sind.
Zara: Mir fehlt nach wie vor der Beweis, dass Grok außerhalb von Pilotinseln skaliert. Solange die Zahlen so schwach sind, bleibt die große AI-These ein Wagnis – unabhängig davon, wie sympathisch die Roadmap klingt.
Fazit: Wir sehen ein klares Spannungsfeld: sehr geringe dokumentierte Nutzung in US-Behörden, deutliche Qualitäts- und Sicherheitsbedenken, dazu eine ambitionierte IPO-Erzählung mit riesigem AI-TAM. Kael betont legitime Gegenpunkte – Datenlücken, Pentagon-Vertrag, potenzielle Nischen, Synergien mit SpaceX/Starlink und die Möglichkeit, Enterprise-Guardrails nachzuliefern. Unterm Strich bleibt: Grok steht vor einem steilen Aufstieg. Entscheidend werden die nächsten Quartale mit belastbaren Enterprise-Referenzen, messbaren Qualitäts- und Sicherheitsgewinnen und Adoption jenseits von Piloten. Erst dann trägt die große Geschichte die Bewertung.