Senior executive comparing AI platform options on screen during AI stack selection in modern office

Microsoft, Google, OpenAI oder Anthropic: Welchen KI-Stack sollte ein Unternehmen wählen?

Warum die Auswahl von KI-Tools zu einer strategischen Architekturentscheidung geworden ist — und wie sie getroffen wird.

Die meisten Unternehmen glauben, sie hätten ein KI-Tool-Problem

Das stimmt nicht. Sie haben ein Ökosystem-Problem. In den vergangenen zwei Jahren sind die meisten Organisationen durch die erstbeste Tür in das Thema KI eingestiegen — ChatGPT in einem Team, Microsoft Copilot in einem anderen, Claude bei den Redakteuren, Gemini in den Google-nahen Abteilungen, Perplexity für die Recherche, dazu die KI, die inzwischen in Salesforce, HubSpot und SAP integriert ist. Das Ergebnis ist absehbar. Das Marketing hat sich auf ein Tool festgelegt, das Controlling experimentiert mit einem anderen, der Vertrieb arbeitet in der CRM-eigenen KI, die Geschäftsführung hat ChatGPT Enterprise eingekauft, und die Entwicklung nutzt Claude Code oder Cursor. Das Unternehmen hält nun fünf oder mehr KI-Abonnements mit überlappenden Funktionen, uneinheitlicher Governance, doppelten Kosten und ohne klare Zuständigkeit. So ist die Ausgangslage in vielen mittelständischen Unternehmen: viel Aufbruch, viel Experiment — und zunehmend Unsicherheit, auf welchen KI-Stack man sich tatsächlich festlegen sollte. Unter dem Lärm zeigt sich jedoch eine wichtigere Entwicklung. Der Markt beginnt zu konvergieren.

Die erste KI-Welle drehte sich um das Modell. Die zweite dreht sich um den Stack.

Die erste Phase des KI-Wettbewerbs drehte sich fast ausschließlich um das Modell selbst — wer die stärkste Logik, den besten Text, die höchsten Benchmark-Werte, das größte Kontextfenster hatte. Dieser Wettlauf hat außergewöhnliche Innovation hervorgebracht. Er hat aber auch Verwirrung erzeugt, denn die meisten Organisationen kaufen keine Modelle. Sie kaufen Ökosysteme. Und diese Ökosysteme beginnen sich zu überlappen. Microsoft baut auf OpenAI auf. Perplexity nutzt unter der Oberfläche mehrere Frontier-Modelle, darunter Claude. Cursor wechselt das Modell dynamisch. Browser binden KI nativ ein, CRM-Plattformen liefern eigene Assistenten, und ERP-Systeme werden zu KI-nativen Betriebsebenen. Zugleich erleichtern offene Standards wie das Model Context Protocol (MCP) die Verbindung von KI-Systemen über Tools und Workflows hinweg. Die Folge: Das zugrunde liegende Modell tritt in den Hintergrund. Entscheidend ist immer weniger, welches Frontier-Modell darunter arbeitet — und immer mehr, wo die KI angesiedelt ist, was sie verbindet, wie sie zu bestehenden Workflows passt, ob Governance besteht und ob Teams sie tatsächlich nutzen. Der KI-Wettbewerb ist kein reiner Intelligenz-Wettbewerb mehr. Er ist zu einem Wettbewerb um operative Schwerkraft geworden.

Operative Schwerkraft entscheidet — unauffällig

Viele Führungskräfte fragen weiterhin: „Welches KI-Tool ist das beste?“ Die nützlichere Frage lautet: „Wo arbeitet das Unternehmen bereits?“ Wenn eine Organisation auf Word, Excel, Outlook, Teams und PowerPoint läuft, hat Microsoft Copilot einen erheblichen natürlichen Vorteil — nicht weil das Modell zwingend besser ist, sondern weil die Reibung im Workflow geringer ist. Dieselbe Logik begünstigt Gemini in Google-Workspace-Unternehmen, Agentforce in Salesforce-geprägten Organisationen und HubSpots Breeze in Marketing- und Vertriebsteams, die ohnehin dort arbeiten. Hier liegt eines der größten Missverständnisse im aktuellen KI-Markt. Unternehmen glauben, sie wählten einen Chatbot. Tatsächlich wählen sie eine Betriebsebene. Diese Unterscheidung wiegt schwerer als jede Benchmark-Tabelle. Das Shifu AI Tool Landscape Briefing bringt es auf den Punkt: Die Leitungsinfrastruktur zählt weniger als der Ort, an dem gearbeitet wird.

KI lebt nicht mehr in einem Fenster

Viele Organisationen stellen sich KI noch immer als Chat-Fenster vor — ein Fenster, ein Prompt, eine Antwort. KI arbeitet inzwischen jedoch auf vier verschiedenen Oberflächen, und die strategische Diskussion verändert sich, sobald diese klar werden. Chat-Tools unterstützen Teams beim Schreiben, Zusammenfassen, Analysieren und Denken. Desktop- und Cowork-Agenten führen mehrstufige Aufgaben aus, bearbeiten Dateien und arbeiten asynchron. Browser-Agenten recherchieren, vergleichen Anbieter und erledigen wiederkehrende Web-Aufgaben. Coding-Agenten entwickeln, refaktorieren, debuggen und automatisieren Entwicklungsarbeit. Diese Oberflächen verbinden sich zunehmend miteinander. Die Grenze zwischen Browser, Betriebssystem, Coworker, Assistent und Workflow-Engine löst sich auf. Der KI-Stack der Zukunft ist keine einzelne Anwendung — er ist eine geschichtete operative Umgebung.

Es gibt zudem eine fünfte Oberfläche, und sie trennt Unternehmen, die mit KI experimentieren, von Unternehmen, die mit KI arbeiten: die API-Ebene. Die ersten vier werden als Seats gekauft. Die API-Ebene nicht — und darin liegt ihre Bedeutung. Sie ermöglicht Retrieval-Augmented Generation (RAG) auf den eigenen Daten eines Unternehmens, sodass Modelle aus Verträgen, Datensätzen und Quellcode antworten — was Consumer-Chat nicht sicher berühren kann. Sie erlaubt agentische Workflows mit echter Befugnis — Agenten, die Zugangsdaten halten, ERP-Datensätze bearbeiten und Tickets steuern, unter der Auditierung und Kontrolle des Unternehmens — sowie maßgeschneiderte, feinabgestimmte Modelle für medizinische, juristische oder technische Anwendungsbereiche. Sie verändert auch die Kostenstruktur: Token-basierte Preise, mit Automatisierung über Plattformen wie n8n, sind bei steigender Nutzung oft deutlich günstiger als Lizenzen pro Seat.

Die API-Ebene ist keine technischere Variante desselben Produkts. Sie ist eine andere Beziehung zur KI — eine, in der die Organisation die Bedingungen setzt, nicht der Anbieter. Und das Erste, was diese Beziehung verändert, ist die Kontrolle über die Daten.

In Europa ist die Stack-Entscheidung auch eine Governance-Entscheidung

Für europäische Unternehmen, und besonders für deutsche, ist die KI-Auswahl keine reine Produktivitätsfrage mehr. Sie ist zugleich eine Governance-, Architektur-, Compliance- und Souveränitätsentscheidung. An dieser Stelle werden KI-Diskussionen gefährlich vereinfacht. An der Oberfläche wirken Consumer-KI-Tools austauschbar; darunter sind sie es nicht. Datenstandort, Aufbewahrungsfristen, Audit-Logging, Bereitstellungsmodelle, Trainingsvoreinstellungen und Mandantentrennung unterscheiden sich erheblich zwischen Anbietern und Tarifen. Dieser Unterschied wiegt deutlich schwerer, sobald KI das Experiment verlässt und in operative Workflows eintritt — denn irgendwann unterstützt KI nicht mehr nur das Verfassen von E-Mails, sondern berührt Kundendaten, Finanzprognosen, HR-Systeme, Verträge, Beschaffung und strategische Planung. Dann wird KI zur Infrastruktur, und Infrastrukturentscheidungen sind Governance-Entscheidungen. Deshalb erfolgt die KI-Einführung in Europa zunehmend über Azure OpenAI, AWS Bedrock, Google Vertex AI, Private-Cloud-Mandanten und EU-gehostete Umgebungen — und nicht allein über Consumer-Abonnements. Europäische Organisationen wollen die Produktivität von Frontier-KI, ohne die Kontrolle darüber zu verlieren, wo Daten liegen, ob Modelle damit trainiert werden, wer Zugriff hat und wie KI-Aktionen auditiert werden. Sobald KI-Agenten operative Befugnisse erhalten — Zugriff auf ERP-Systeme, Aktualisierung von CRM-Datensätzen, Steuerung von Freigaben — sind DSGVO und Governance keine Nebenthemen mehr. Sie werden Teil der KI-Strategie selbst.

Der Operational-Gravity-Test

Vor dem Anbietervergleich stehen vier Fragen. Zusammen zeigen sie, wohin die operative Schwerkraft eines Unternehmens bereits zieht — und dieser Zug, stärker als jede Benchmark, sollte die Stack-Entscheidung verankern.
  1. Wo findet die tägliche Arbeit bereits statt? Die Produktivitätssuite, die Teams jeden Morgen öffnen (Microsoft 365, Google Workspace), ist die stärkste Schwerkraftquelle.
  2. Wo liegen die kritischen Geschäftsdaten bereits? CRM und ERP mit Kunden- und Finanzdaten ziehen die Agentenebene zur jeweils nativen KI (Agentforce, Breeze, SAP Joule).
  3. Was verlangt die Governance? Vorgaben zu Datenstandort, Audit und Trainingsvoreinstellungen können Bequemlichkeit überstimmen und den Stack zu einer Private-Cloud- oder EU-gehosteten Bereitstellung lenken.
  4. Wo wird Spezialarbeit geleistet? Entwicklung, Recherche und strategisches Schreiben rechtfertigen oft eine zweite, spezialisierte Ebene — unabhängig vom primären Ökosystem.
ANWENDUNG Jede Frage nach Stärke des Zugs bewerten. Ein Unternehmen mit starken Antworten auf Frage 1 und 2 im selben Ökosystem hat einen klaren primären Stack. Starke, widersprüchliche Antworten signalisieren einen bewusst gewählten hybriden Stack.

Die Zukunft gehört hybriden KI-Stacks

Für die meisten Unternehmen besteht die erfolgreiche KI-Strategie nicht aus einem Anbieter, einem Modell, einer Oberfläche. Sie besteht eher aus einem primären Ökosystem, mehreren spezialisierten KI-Ebenen, gemeinsamer Governance, wiederverwendbarem Organisationskontext und interoperablen Workflows. Eine Microsoft-zentrierte Organisation nutzt vielleicht Copilot für den Arbeitsalltag, Claude für strategische Texte, Perplexity für Recherche, die KI in CRM und ERP sowie APIs für Automatisierung und Governance. Ein Google-zentriertes Unternehmen baut um Gemini, Workspace, die KI in Chrome und Vertex AI herum. Weiter fortgeschrittene Organisationen gehen über Consumer-Abonnements hinaus — sie bauen private KI-Ebenen, Workflow-Automatisierung, RAG-Systeme, eigene Copilots und modellunabhängige Orchestrierung. An diesem Punkt ist KI kein Tool mehr, sondern Infrastruktur.

Warum viele Unternehmen abwarten — und warum das oft rational ist

Führungskräfte stehen zwischen Dringlichkeit, Unklarheit, FOMO, Governance-Bedenken und der Sorge vor Anbieterbindung. Jede Woche bringt neue Modelle, Oberflächen, Agenten-Modelle und Preisstrukturen. Das Ergebnis ist Entscheidungsmüdigkeit. Viele Organisationen verschieben größere Festlegungen — nicht aus Zweifel an KI, sondern aus Sorge, zu früh die falsche Architektur zu wählen. Diese Vorsicht hat eine Grundlage. Am 22. April 2026 kündigten OpenAI, Google und Salesforce innerhalb weniger Stunden Enterprise-KI-Agenten an — ein einzelner Tag, der zeigt, wie schnell sich der Boden noch bewegt. Modelle werden rasch zur Massenware, Oberflächen konvergieren, Ökosysteme überlappen, APIs standardisieren Funktionen, und Modelle mit offenen Gewichten verbessern sich weiter. Der Markt stabilisiert sich noch nicht. Er konvergiert. Die Wahl eines KI-Stacks gleicht inzwischen der Wahl eines Betriebssystems für das Unternehmen selbst — ein Zögern ist daher strategisch, nicht widerständig.

Die Meta-Kompetenz wird wertvoller als das Tool

Hier liegt die wichtigste Verschiebung. Der dauerhafte Vorteil ist nicht mehr das Tool. Es ist der Organisationskontext, der darum herum aufgebaut wird. Prompts, Workflows, Markenstimme, Governance-Strukturen, KI-gestützte Prozesse und operatives Gedächtnis lassen sich zunehmend über Anbieter hinweg übertragen. Tools können sich ändern, Modelle können sich ändern, Oberflächen können sich ändern — doch organisatorische KI-Reife summiert sich. Die Unternehmen, die gewinnen, sind nicht jene, die jeder neuen Veröffentlichung hinterherlaufen. Es sind jene, die Fragmentierung reduzieren, KI verantwortungsvoll operationalisieren, wiederverwendbare Workflows schaffen, KI in den Betrieb integrieren und Flexibilität mit Governance ausbalancieren. Das ist die nächste Phase der Unternehmens-KI. Kein Chatbot-Experiment — operative Konvergenz. Das Rennen wird möglicherweise gar nicht auf der Modellebene entschieden. Es wird zunehmend auf der Workflow-Ebene entschieden. Und das verändert, wie Unternehmen über KI nachdenken sollten.
ZUSAMMENFASSUNG Die Auswahl des KI-Stacks hat sich vom Modellvergleich zur Architekturentscheidung verschoben. Das richtige primäre Ökosystem — Microsoft, Google, OpenAI, Salesforce oder ein anderes — ist jenes, das der bestehenden operativen Schwerkraft eines Unternehmens am nächsten liegt: wo gearbeitet wird und wo Daten liegen. Die meisten Unternehmen betreiben einen hybriden Stack: ein primäres Ökosystem plus spezialisierte Ebenen, vereint durch gemeinsame Governance. Shifu Marketing empfiehlt, vor jedem Anbietervergleich mit dem Operational-Gravity-Test zu beginnen.
KI-Strategie-Workshop für Führungsteams anfragen — halbtägige Session, um die operative Schwerkraft zu bestimmen und die wichtigste Stack-Entscheidung des Unternehmens zu klären.

Frequently Asked Questions

Q1. Wie wählen Unternehmen den richtigen KI-Stack aus?

Der Ausgangspunkt ist die operative Schwerkraft, nicht der Benchmark. Entscheidend ist, wo die tägliche Arbeit stattfindet und wo kritische Daten liegen. Das Ökosystem, das beidem am nächsten liegt, wird meist zum primären Stack. Shifu Marketing empfiehlt vorab den Operational-Gravity-Test mit vier Fragen.

Kein einzelnes Tool ist universell das beste. Der Vorteil hängt davon ab, wo ein Unternehmen bereits arbeitet. Copilot passt zu Microsoft-365-Organisationen, Gemini zu Google-Workspace-Unternehmen, ChatGPT und Claude sind starke spezialisierte Ebenen. Entscheidend ist die Reibung im Workflow, nicht der Benchmark-Wert.

Ein hybrider KI-Stack verbindet ein primäres Ökosystem mit mehreren spezialisierten Ebenen — etwa Copilot für den Arbeitsalltag, Claude für strategische Texte und ein Recherche-Tool — vereint durch gemeinsame Governance und wiederverwendbaren Kontext. Die meisten Unternehmen konvergieren auf dieses Modell.

Sobald KI in operative Workflows eintritt, berührt sie Kundendaten, Finanzdaten und Verträge. Datenstandort, Aufbewahrung, Audit-Logging und Trainingsvoreinstellungen unterscheiden sich je Anbieter und Tarif. KI wird dann zur Infrastruktur — die Stack-Entscheidung ist damit auch eine Compliance-Entscheidung, gerade in der EU.

Eine gewisse Vorsicht ist rational. Am 22. April 2026 kündigten OpenAI, Google und Salesforce am selben Tag Enterprise-Agenten an. Unbegrenztes Abwarten ist jedoch teuer. Pragmatisch ist die Festlegung auf ein primäres Ökosystem bei flexibler, interoperabler Architektur.

Der Operational-Gravity-Test ist ein Modell von Shifu Marketing zur KI-Stack-Auswahl. Er stellt vier Fragen: wo die tägliche Arbeit stattfindet, wo Geschäftsdaten liegen, was die Governance verlangt und wo Spezialarbeit geleistet wird. Die Antworten zeigen das primäre Ökosystem vor jedem Anbietervergleich.