KI-Modell Preiskrieg eskaliert: DeepSeek senkt um 75%, Token-Zeitalter beginnt
Im Mai 2026 ereignete sich in der KI-Branche etwas strukturell bedeutsameres als jede neue Modellveröffentlichung: DeepSeek kündigte eine dauerhafte Preissenkung von 75% für die V4 Pro API an.
Das ist keine Aktion. Das ist ein Transfer der Preissetzungsmacht.
Drei Signale des Preisverfalls
| Ereignis | Zeit | Bedeutung |
|---|---|---|
| DeepSeek V4 Pro API Preissenkung um 75% | Mai 2026 | Erstes heimisches KI-Modell mit weltweit niedrigstem Preis |
| Drei große Betreiber starten Token-Pakete | Mai 2026 | Rechenleistung erreicht Infrastruktur-Phase mit nutzungsbasierter Abrechnung |
| Tägliche Token-Nutzung in China über 140 Billionen | Mai 2026 | Wachstum um etwa 1000x in zwei Jahren, steile Nachfragekurve |
Diese drei Ereignisse zusammen zeigen eines: Token wandelt sich von “Technologiekosten” zu “Infrastrukturkosten”, ähnlich wie Bandbreite und Speicher in der Cloud-Ära.
Globaler Preisvergleich: Wer hat noch Gewinnspannen?
| Anbieter | Modell | Eingabepreis (/Million Token) | Ausgabepreis (/Million Token) |
|---|---|---|---|
| DeepSeek | V4 Pro | ca. ¥0,5 | ca. ¥2 |
| OpenAI | GPT-5.5 Instant | ca. $0,5 | ca. $1,5 |
| Baidu | Wenxin 5.1 | ca. ¥1,2 | ca. ¥4 |
| Gemini 3.5 | ca. $0,35 | ca. $1,4 |
DeepSeeks Preisstrategie ist klar: Extreme Niedrigpreise gegen Ökosystem-Positionierung eintauschen, Entwickler zuerst in das eigene Aufrufsystem binden, dann über Enterprise-Services und vertikale Szenarien profitieren.
Das ist kein ruinöser Wettbewerb. Das ist ein in der Cloud-Ära bereits validierter Weg.
Was der Betreibereinstieg bedeutet
China Mobile, Unicom und Telecom starten synchron Token-Pakete, ein Signal, das tiefer liegt als Modellpreissenkungen.
- Rechenleistung als Ware: Token werden wie Datenvolumen gebündelt verkauft, Unternehmen können monatliche KI-Kosten kalkulieren
- Netzwerk-Edge: Betreiber können Inferenzknoten in provinzielle Rechenzentren verlagern, Latenz senken
- Compliance-Geschlossener Kreislauf: Daten verlassen das Land nicht, Aufrufe sind nachvollziehbar, erfüllen strenge regulatorische Anforderungen für Finanz- und Regierungsbereich
Wenn Betreiber Token verkaufen, sind große Modelle nicht mehr das exklusive Spiel von Tech-Unternehmen, sondern Teil der nationalen digitalen Infrastruktur.
Praktische Auswirkungen auf Entwickler
Eine Preissenkung um 75% ist kein Zahlenspiel. Sie verändert direkt das technisch-ökonomische Modell von Produkten.
Was früher unmöglich war, ist jetzt machbar:
- Langkontext-RAG (Retrieval-Augmented Generation): Früher zu teuer für 100k-Token-Kontexte, jetzt für den Routineeinsatz geeignet
- Echtzeit-Sprach-zu-Text + Übersetzung: Die Kostenbarriere für Streaming-Aufrufe verschwindet
- Stapelweise Dokumentenverarbeitung: 1000 PDF-Verträge in einem Durchgang verarbeiten, Kosten von Tausenden auf Hundert Yuan senken
Was früher riskant zu testen war, ist jetzt wert zu experimentieren:
- Multi-Modell-Routing: Automatisches Modellwechseln basierend auf Aufgabenkomplexität, Kosten bleiben kontrollierbar
- Hochfrequenz-Feinabstimmung: Kleine Modelle mit realen Aufrufdaten kontinuierlich optimieren, Grenzkosten gehen gegen Null
Risiko: Was kommt nach dem Preiskrieg?
Niedriger Preis bedeutet nicht Gesundheit. Drei potenzielle Probleme im Blick behalten:
-
Dienstqualitätsverdünnung: Geht extremer Niedrigpreis mit erhöhter Antwortlatenz und verringerter Verfügbarkeit einher? DeepSeeks gleichzeitige Lastkapazität wurde noch nicht im großen Maßstab getestet.
-
Innovationsmotivationsverlagerung: Wenn Basisaufrufe nicht profitabel sind, wohin wenden sich Anbieter? Enterprise-Services, Private-Deployment, branchenspezifische Modelle — das ist eigentlich positiv, da Marktsegmentierung entsteht.
-
Auslandspreissetzungsmacht: Heimische Modelle sind im Inland extrem niedrig, aber wie im Ausland preisen? Wenn globale Märkte folgen, werden OpenAI und Anthropic’s Gewinnspannen komprimiert, möglicherweise intensivere Technologie-Wettrüsten auslösen.
Fazit
Der Token-Preisverfall ist kein Endpunkt, sondern ein Ausgangspunkt.
Er bedeutet, dass die Innovationsbarriere für die KI-Anwendungsschicht drastisch gesenkt wird. 2024 musste man bei KI-Anwendungen Modellkosten berücksichtigen; 2026 ist diese Einschränkung praktisch verschwunden. Der nächste Wettbewerbsfokus verschiebt sich auf:
- Produkt-Erfahrungsdesign
- Daten-Fliehkraft-Aufbau
- Branchen-Know-how-Tiefe
Mit anderen Worten: Die Modellschicht konkurriert auf Preis, die Anwendungsschicht auf Wert. Positiv für Entwickler.
Quelle: DeepSeek offizielle Ankündigung, Pressemitteilungen der drei großen Betreiber, Nationale Cyberspace-Verwaltung öffentliche Informationen, Branchendaten-Zusammenstellung.