KI-WirtschaftPortora Redaktion

Der KI-Markt ist umkämpfter, als das Bild von zwei Gewinnern zulässt

Das gängige Bild sieht ein, zwei KI-Konzerne und einen Chip-Monopolisten als gesetzte Gewinner. Vier Entwicklungen aus dem Frühsommer 2026 zeigen einen Markt, der in Wahrheit auf mehreren Ebenen umkämpft ist.

Vorläufige DatenAllgemeinAllgemein

Das Wichtigste in Kürze

  • Das Forschungsinstitut Epoch AI misst Ende Mai 2026, dass die besten frei verfügbaren KI-Modelle im Schnitt nur noch rund vier Monate hinter den besten geschlossenen liegen.
  • Die Kosten für KI auf dem Niveau von GPT-3.5 sind laut einer Stanford-Auswertung zwischen November 2022 und Oktober 2024 um mehr als das 280-fache gefallen.
  • Nvidia-Chef Jensen Huang räumte am 21. Mai 2026 ein, den chinesischen Markt für KI-Chips weitgehend an Huawei verloren zu haben. Zeitgleich senkte der chinesische Anbieter DeepSeek den Preis seines Spitzenmodells dauerhaft um 75 Prozent.
  • Die OECD beschreibt offene Modelle ausdrücklich als Mittel, um Markteintrittsbarrieren zu senken, verweist aber zugleich auf hohe Fixkosten und Skaleneffekte, die wenige große Anbieter begünstigen.
  • Dieser Beitrag ordnet vier Kräfte ein, die den Markt öffnen, und drei Gegenkräfte, die die etablierten Anbieter stützen. Er bewertet keine Aktien und sagt nicht, wer gewinnt.

Die Bewegung in vier Zahlen

4 Monate
Rückstand der besten offenen Modelle auf die Spitze
laut Epoch AI, Mai 2026
71 %
der realen Anfragen beantworten lokal lauffähige Modelle inzwischen auf Spitzenniveau
2023 erst 23 Prozent (Stanford)
280-fach
billiger wurde KI-Inferenz auf GPT-3.5-Niveau
November 2022 bis Oktober 2024
rund 30 %
Anteil offener Modelle an der gemessenen Nutzung
Stand Ende 2025 (OpenRouter)

Quelle: Epoch AI (Mai 2026), Stanford (AI Index 2025 und Intelligence per Watt 2025), OpenRouter (Stand Ende 2025)

Vier Meldungen in fünf Wochen, ein Muster

Wer in den vergangenen Wochen die Nachrichten zur künstlichen Intelligenz verfolgt hat, konnte vier Meldungen leicht für Einzelfälle halten. Am 21. Mai 2026 räumte Nvidia-Chef Jensen Huang in einem Interview des US-Senders CNBC ein, den chinesischen Markt für KI-Chips weitgehend an den Konkurrenten Huawei verloren zu haben. Wenige Tage später machte der chinesische Anbieter DeepSeek laut Berichten der Nachrichtenagentur Reuters eine Preissenkung von 75 Prozent auf sein Spitzenmodell dauerhaft. Das Forschungsinstitut Epoch AI veröffentlichte Ende Mai eine Auswertung, nach der frei verfügbare Modelle im Schnitt nur noch rund vier Monate hinter den besten geschlossenen liegen. Und Apple wie Google brachten KI auf das eigene Gerät, bis hinunter ins Smartphone.

Einzeln gelesen sind das vier Tech-Nachrichten. Zusammen ergeben sie ein anderes Bild als das, das viele vom KI-Markt im Kopf haben. Dieses Bild lautet verkürzt: Ein, zwei große Labore in Kalifornien bauen die besten Modelle, ein einziger Hersteller liefert die nötigen Chips, und damit ist die Verteilung im Kern entschieden. Die vier Meldungen passen nicht recht in dieses Bild. Sie deuten auf einen Markt, der an mehreren Stellen gleichzeitig in Bewegung ist.

Dieser Beitrag ordnet ein, was an dem verbreiteten Bild stimmt und was es übersieht. Er bewertet keine einzelnen Unternehmen und gibt keine Anlageempfehlung. Es geht allein um die Struktur eines Marktes, der oft auf zwei Namen verkürzt wird.

Das Bild vom natürlichen Monopol, und warum es nicht dumm ist

Die Annahme, dass am Ende wenige Konzerne den KI-Markt unter sich aufteilen, ist nicht aus der Luft gegriffen. Die OECD hat im November 2025 einen ausführlichen Bericht zum Wettbewerb in der KI-Infrastruktur vorgelegt. Darin beschreibt sie genau die Kräfte, die zu Konzentration führen: sehr hohe Fixkosten über die gesamte Lieferkette hinweg und ausgeprägte Skaleneffekte, besonders beim Rechnen in der Cloud. Wer einmal die nötige Größe erreicht hat, kann seine Kosten auf eine riesige Nutzerbasis verteilen und wird dadurch schwer angreifbar.

Die OECD nennt auch eine konkrete Engstelle. Fortgeschrittenes Rechnen in der Cloud wird im Wesentlichen von drei großen Anbietern bereitgestellt, oft Hyperscaler genannt: Google, Microsoft und Amazon. Dazu kommt die Trainingsphase der größten Modelle, die enorme Mengen an spezialisierten Chips verschlingt. Beides spricht dafür, dass der Aufbau eines Spitzenmodells keine Garagenübung ist. Das verbreitete Bild hat also einen wahren Kern, und es ist sinnvoll, ihn ernst zu nehmen, bevor man ihn relativiert.

Der Fehler steckt nicht in der Beobachtung, dass es große Anbieter gibt. Der Fehler steckt in der stillen Zusatzannahme, dass diese Verteilung stabil ist. Märkte mit hohen Gewinnspannen ziehen Wettbewerber an, und genau das lässt sich gerade beobachten. Die folgenden Abschnitte zeigen vier Kräfte, die an dieser Stabilitätsannahme rütteln.

Die Verfolger sind näher dran, als das Bild zulässt

Die erste Kraft ist das Aufholen der offenen Modelle. Damit sind Modelle gemeint, deren Gewichte frei verfügbar sind und die jeder herunterladen und selbst betreiben kann. Das Forschungsinstitut Epoch AI hat den Abstand zwischen den besten offenen und den besten geschlossenen Modellen über einen kombinierten Fähigkeits-Index gemessen. Für das Fenster bis Ende Mai 2026 liegt dieser Abstand im Schnitt bei rund vier Monaten. Eine frühere Auswertung desselben Instituts nannte rund drei Monate, der Abstand hat sich also leicht geweitet, bleibt aber klein. Wichtig für die Einordnung: Diese Zahl stammt von Epoch AI, nicht, wie oft zu lesen, vom KI-Index der Universität Stanford.

Eine zweite Stanford-Auswertung beziffert, wie weit die kleinen, lokal lauffähigen Modelle inzwischen tragen. Die Arbeit mit dem Titel Intelligence per Watt aus dem November 2025 misst, welcher Anteil realer Nutzeranfragen sich von Modellen mit höchstens 20 Milliarden aktiven Parametern auf dem Niveau eines Spitzenmodells beantworten lässt. Dieser Anteil stieg von 23 Prozent im Jahr 2023 auf 71 Prozent im Jahr 2025. Das ist keine allgemeine Korrektheitsquote, sondern eine Abdeckung gegenüber einem Spitzenmodell. Die Zahl sagt also nicht, dass kleine Modelle in 71 Prozent aller Fälle richtig liegen, sondern dass sie in 71 Prozent der Anfragen mit der Spitze mithalten.

Möglich wird dieses Aufholen durch zwei technische Entwicklungen. Die eine ist die Quantisierung, also das Verkleinern der Modelle, sodass sie auf gewöhnlicher Hardware laufen, ohne stark an Qualität zu verlieren. Die andere sind Architekturen, bei denen pro Anfrage nur ein Teil des Modells arbeitet. Googles offenes Modell Gemma 4 etwa umfasst nach Herstellerangaben 26 Milliarden Parameter, aktiviert pro Verarbeitungsschritt aber nur rund 3,8 Milliarden davon. Das senkt den Rechenaufwand, nicht den Speicherbedarf, und macht starke Modelle auf normaler Hardware nutzbar.

Die zweite Kraft ist der Preisverfall. Der KI-Index der Universität Stanford beziffert, wie stark die Kosten für eine bestimmte Leistung gefallen sind. Für eine Abfrage auf dem Niveau des Modells GPT-3.5 sanken die Kosten zwischen November 2022 und Oktober 2024 um mehr als das 280-fache, von rund 20 US-Dollar auf etwa 0,07 US-Dollar je Million Token. Das ist ein Wert bis Oktober 2024 und kein tagesaktueller Stand, die Richtung ist aber eindeutig. Was teuer und knapp war, wird zur Ware. Und Preissetzungsmacht hält nur, solange niemand dasselbe deutlich billiger anbietet.

Vier Kräfte, die am Konsens rütteln

Vier Entwicklungen, die das Bild vom fertig verteilten KI-Markt infrage stellen, jeweils mit der tragenden Quelle.

KraftWas sich verschiebtBeleg
Offene Modelle holen aufRückstand auf die Spitze nur noch rund vier MonateEpoch AI, Mai 2026
KI wird zur WareInferenz auf GPT-3.5-Niveau über 280-fach billiger (2022 bis 2024)Stanford AI Index 2025
Zweiter Hardware-PfadChina verlagert auf Huawei-Chips, Nvidia-Anteil dort nahe nullCRS-Bericht 2025, Nvidia-Angaben
KI wandert ins GerätModelle mit rund 3 Mrd. Parametern laufen offline auf dem SmartphoneApple, Google (Herstellerangaben)
Die ersten beiden Belege stammen aus Forschungsauswertungen, der dritte aus einem Bericht des US-Forschungsdiensts und Unternehmensangaben, der vierte aus Herstellerangaben. Die Spalte Beleg nennt jeweils die tragende Quelle.

Quelle: Zusammenstellung Portora auf Basis der im Text genannten Quellen

China baut sich einen eigenen Stack

Die dritte Kraft betrifft die Hardware und ist eng mit der Handelspolitik verbunden. Seit Oktober 2022 schränken die USA die Ausfuhr besonders leistungsfähiger KI-Chips nach China ein. Das geht aus einem Bericht des Forschungsdiensts des US-Kongresses hervor. Die ursprüngliche Regel nannte Nvidia und seine Chips nicht namentlich, sondern definierte technische Schwellenwerte, oberhalb derer eine Ausfuhr genehmigungspflichtig wurde. Nvidia reagierte mit gedrosselten China-Varianten seiner Chips. Im April 2025 wurde dann auch die eigens für China abgespeckte Variante mit der Bezeichnung H20 unter Genehmigungsvorbehalt gestellt, was das Unternehmen in einer Pflichtmitteilung an die US-Börsenaufsicht offenlegte.

Die Lage hat sich seither mehrfach gedreht. Im August 2025 erlaubte die US-Regierung den Verkauf der H20 wieder, allerdings gegen eine Beteiligung von 15 Prozent an den Erlösen. Wer die Entwicklung beschreibt, sollte deshalb die einzelnen datierten Etappen nennen und nicht pauschal von einem Verbot sprechen. Der wirtschaftliche Effekt der Beschränkungen ist trotzdem deutlich. Nvidias Anteil am chinesischen Geschäft mit Rechenzentren, der nach Unternehmensangaben einmal rund ein Fünftel ausmachte, ist nach Darstellung von Konzernchef Jensen Huang auf nahe null gefallen. Genau diesen Markt sieht er heute bei Huawei.

Die Folge ist ein zweiter, weitgehend eigenständiger Technologiepfad. Das chinesische Modell DeepSeek läuft nach Angaben aus der Berichterstattung auf Chips von Huawei und nicht auf Nvidia-Technik. Die kräftige Preissenkung des Anbieters fällt in dieselbe Phase. Die US-Notenbank Federal Reserve hat im Oktober 2025 in einer Analyse die Kräfteverhältnisse zwischen den großen Wirtschaftsräumen untersucht. Ihr Fazit: China hat bei Forschung und Verbreitung stark aufgeholt, während die USA bei der grundlegenden Infrastruktur, also bei Rechenkapazität und Investitionsbedingungen, weiter vorne liegen. Auch das spricht gegen ein einfaches Bild mit nur einem Zentrum.

Die KI wandert ins Gerät

Die vierte Kraft verändert, wo KI überhaupt rechnet. Bisher liefen die meisten Anfragen über große Rechenzentren. Inzwischen wandert ein Teil der Arbeit auf das eigene Gerät. Auf vielen Android-Telefonen läuft mit Gemini Nano ein kleines Modell direkt im Gerät, ohne Netzverbindung und ohne dass Daten in die Cloud gehen. Apple setzt für seine Gerätefunktionen nach eigenen Angaben auf ein Modell mit rund drei Milliarden Parametern, das ebenfalls lokal arbeitet. Die oft genannte Größe von drei Milliarden Parametern für Gemini Nano ist dagegen eine verbreitete Angabe, die Google in seiner Entwicklerdokumentation nicht ausdrücklich bestätigt.

Hinter dieser Verschiebung steht auch eine Vielfalt bei der Hardware, die das verbreitete Bild vom einen Chip-Lieferanten weiter aufweicht. Apple nutzt den gemeinsamen Speicher seiner eigenen Chips und ein darauf zugeschnittenes Software-Gerüst, sodass größere Modelle direkt auf dem Mac laufen. Das Unternehmen Groq setzt auf eine eigens für KI entwickelte Chiparchitektur und erreicht damit nach eigenen und unabhängigen Messungen mehrere hundert verarbeitete Token pro Sekunde. Und die verbreitete Software Ollama öffnete sich über die Schnittstelle Vulkan auch für gewöhnliche Grafikkarten von AMD und Intel. Keiner dieser Wege macht Nvidia überflüssig. Aber jeder einzelne zeigt, dass es mehr als einen Weg gibt.

Für die Marktstruktur ist das bedeutsam, weil ein Teil der Wertschöpfung damit gar kein Rechenzentrum mehr braucht. Eine Anfrage, die das Telefon selbst beantwortet, taucht in keiner Cloud-Rechnung auf. Das verschiebt nicht den ganzen Markt, aber es schafft eine eigene Ebene neben den großen Rechenzentren.

Warum das kein Abgesang auf die Großen ist

Aus den vier Kräften folgt nicht, dass die etablierten Anbieter verlieren. Drei Gegenkräfte halten dagegen, und sie gehören zu einer ehrlichen Einordnung dazu. Die erste ist ein altes ökonomisches Muster, oft nach dem Ökonomen William Stanley Jevons benannt: Wird eine Ressource deutlich billiger, sinkt der Verbrauch in der Regel nicht, er steigt. Wenn KI also immer günstiger wird, ist der wahrscheinlichste Effekt nicht weniger nachgefragte Rechenleistung, sondern mehr Anwendungen, mehr Nutzer und in Summe oft mehr Bedarf. Eine sinkende Nachfrage nach Chips lässt sich aus dem Preisverfall jedenfalls nicht ableiten.

Die zweite Gegenkraft sind die Fixkosten, auf die schon die OECD verweist. Das Training der größten Modelle bleibt teuer und kapitalintensiv, und das gilt auch für die offenen Modelle, die ebenfalls auf riesigen Rechenanlagen entstehen. Die dritte Gegenkraft ist der Vorsprung an der Spitze. Bei den schwierigsten Aufgaben, etwa langem, eigenständigem Arbeiten an komplexen Problemen, führen die geschlossenen Spitzenmodelle weiterhin. Dazu kommen Vorteile bei der Verteilung und gewachsene Nutzerbindung. Die großen Anbieter sind nicht zufällig groß.

Wie ernst die Gegenseite das Konzentrationsthema nimmt, zeigt der Blick der Europäischen Zentralbank. In ihrem Bericht zur Finanzstabilität vom 27. Mai 2026 warnt sie vor hohen Bewertungen und gebündelten Risiken, die sich auf wenige hoch bewertete US-Technologiewerte rund um das KI-Thema konzentrieren. Die Notenbank betrachtet diese Bündelung als mögliche Schwachstelle, falls die Stimmung an den Märkten kippt. Auch das ist Teil des Bildes: Der Markt ist umkämpft, und zugleich hängt viel Kapital an der Annahme, dass einige wenige Anbieter gewinnen.

Was den Markt von außen formt

Über den Wettbewerb der Anbieter legt sich ein politischer Rahmen, der die Karten mitmischt. In der Europäischen Union greift seit dem 2. August 2025 ein erster Satz an Pflichten für Anbieter universell einsetzbarer KI-Modelle, festgelegt in der KI-Verordnung der EU. Der größere Teil der Regeln wird ab dem 2. August 2026 anwendbar, dann beginnt auch die aktive Durchsetzung. Für bereits auf dem Markt befindliche Modelle gilt eine Übergangsfrist bis August 2027. Welche Anbieter diese Anforderungen leichter erfüllen, große mit eigener Rechtsabteilung oder kleine und offene, ist eine offene und wirtschaftlich bedeutsame Frage.

Hinzu kommen die schon beschriebenen Ausfuhrkontrollen der USA, die den Hardware-Pfad in China überhaupt erst erzwungen haben, und die Aufsicht der Notenbanken, die KI inzwischen als Thema der Finanzstabilität behandeln. Drei sehr unterschiedliche Kräfte also: Wettbewerbsrecht und Regulierung auf der einen Seite, Handelspolitik auf der anderen, dazu die Geldpolitik als Beobachterin. Keine dieser Kräfte entscheidet den Markt allein, aber zusammen formen sie das Spielfeld, auf dem die Anbieter konkurrieren.

Was sich seriös sagen lässt, und was nicht

Aus all dem folgt keine Prognose, wer den KI-Markt gewinnt. Mehrere zentrale Punkte sind offen und lassen sich aus den vorliegenden Quellen nicht beantworten. Niemand weiß, ob der Abstand der offenen Modelle weiter schrumpft oder wieder wächst, das Feld bewegt sich schnell und die Vier-Monats-Zahl ist eine Momentaufnahme. Ebenso offen ist, ob die billigere Inferenz die Nachfrage nach Chips am Ende dämpft oder über den Mengeneffekt sogar anheizt. Und welcher Anbieter die neuen Regeln am besten verkraftet, wird sich erst zeigen.

Sicher lässt sich vor allem eine Aussage umkehren. Die populäre These lautet, die Verteilung des Marktes stehe im Kern fest. Die belegbaren Befunde sprechen dagegen: ein Verfolgerfeld, das auf wenige Monate herangerückt ist, ein Preisverfall, der Eintrittsbarrieren senkt, ein zweiter Hardware-Pfad aus geopolitischer Not, und KI, die ins Endgerät wandert. Was nach einem fertig verteilten Markt aussieht, ist bei näherem Hinsehen ein Markt in Bewegung. Die einzige wirklich unbewiesene Behauptung in dieser Debatte ist der Satz, die Sache sei entschieden.

Was lässt sich daraus für dich ableiten? Vor allem eine nüchterne Leseweise. Wenn die nächste Schlagzeile einen einzelnen Konzern zum sicheren Gewinner der KI erklärt, lohnt die Rückfrage, welche stille Annahme darin steckt und ob die Daten sie tragen. Dieser Beitrag nennt bewusst keine Aktie und keine Kaufentscheidung. Er liefert den Rahmen, um solche Aussagen selbst einzuordnen, statt sie zu übernehmen.

Quellen

Zur Entstehung dieses Artikels

Dieser Beitrag wurde auf Basis der oben verlinkten Quellen mit KI-Unterstützung erstellt und vor Veröffentlichung redaktionell geprüft. Die Zahlen sind aus den genannten Berichten und Veröffentlichungen entnommen und im Text mit der jeweiligen Quelle verknüpft. Dieser Beitrag liegt außerhalb des sonst engen Themenfelds deutscher und europäischer Wirtschaftspolitik. Für die belastbaren Befunde stützt er sich auf Primärquellen von OECD, Europäischer Zentralbank, US-Notenbank, dem Forschungsdienst des US-Kongresses und der EU-Verordnung, ergänzt um Auswertungen der Universität Stanford und des Instituts Epoch AI. Angaben einzelner Unternehmen sowie Aussagen aus der Berichterstattung sind im Text ausdrücklich als solche gekennzeichnet.

Letzte Aktualisierung: 22. Juni 2026
Versionshistorie: Erste Veröffentlichung am 22. Juni 2026.

Hinweis: Dieser Beitrag ist eine sachliche Einordnung wirtschafts- und sozialpolitischer Entwicklungen und stellt weder eine Anlageberatung noch eine Rechtsberatung dar. Für konkrete Entscheidungen in deiner persönlichen Situation wende dich an eine fachlich zuständige Person.

Portora kennenlernen

Wenn dich Einordnung im Alltag interessiert, findest du in Portora ein Cockpit, das deine eigenen Zahlen genauso ruhig liest.

Hier ordnen wir wirtschaftspolitische Entwicklungen sachlich ein. Dort siehst du, wie das auf deine Situation wirkt.