DeepSeek V4-Pro dauerhaft günstiger: Inländische KI schließt den Full-Stack-Kreislauf
Am 31. Mai endete die 2,5-Rabatt-Aktion für die DeepSeek V4-Pro Modell-API, aber der offizielle Preis wurde auf ein Viertel des ursprünglichen Preises angepasst. Das bedeutet, der 2,5-Rabatt wurde dauerhaft beibehalten. Niedrigere LLM-Kosten werden die KI-Innovation von KMUs weiter aktivieren.
Kerninformationen zur Preisanpassung
| Position | Details |
|---|---|
| Originalpreis | Originalpreis (konkrete Zahl nicht öffentlich bekannt) |
| Rabattpreis | Ein Viertel des Originalpreises |
| Gültig ab | 31. Mai 2026 |
| Vorherige Aktion | 2,5-Rabatt beendet, aber gleichwertiger Rabatt dauerhaft beibehalten |
Das ist keine einfache Preissenkung. DeepSeek hat gleichzeitig die Neugestaltung der gesamten zugrunde liegenden Architektur abgeschlossen.
Full-Stack-Heterogen-Neugestaltung: Motorwechsel in 10.000 Metern Höhe
DeepSeek hat die Full-Stack-Heterogen-Neugestaltung von CUDA abgeschlossen und über 200 Kernberechnungseinheiten im gesamten Stack neu geschrieben. Brancheninsider beschreiben die Schwierigkeit als “Motorwechsel eines Flugzeugs in 10.000 Metern Höhe”.
Schlüsselerfolge:
- Ascend NPU in Verifizierungsmatrix aufgenommen: DeepSeek-V4 listet erstmals Huawei Ascend neben NVIDIA GPUs zur offiziellen Unterstützung auf
- Volle Huawei-Produktlinie unterstützt: Alle Ascend-Supernode-Produkte erhalten offiziellen Support
- Erweiterung des inländischen Rechenleistungs-Ökosystems: Wechsel von “politischer Beschaffung getrieben” zu “Allzweck-KI-Infrastrukturmarkt”
Das markiert den offiziellen Eintritt des Kreislaufs “inländisches LLM + inländische Rechenleistung” in den großflächigen kommerziellen Einsatz.
Edge-AI: ModelBest und ternäres LLM
ModelBest veröffentlichte in Zusammenarbeit mit der Tsinghua-Universität BitCPM-CANN, das erste vollständig auf inländischen Rechenleistungsplattformen (Huawei Ascend) end-to-end trainierte und quelloffene ternäre LLM in China.
Bedeutung des ternären LLM:
- Niedrigerer Stromverbrauch: Geeignet für Edge-Bereitstellung
- Inländische Rechenleistung durchgehend: Vom Training bis zur Inferenz ohne Abhängigkeit von ausländischen Chips
- Quelloffen: Senkt Brancheneinstiegshürden
Auf der NVIDIA-Seite ist Vera, die erste CPU speziell für Agenten, offiziell in Produktion und Auslieferung gegangen, mit 50% mehr Single-Core-Leistung. Der Edge-AI-Wettbewerb beschleunigt sich.
Auswirkungen auf die Branche
- LLM-Kosten sinken weiter: DeepSeeks Preisstrategie zwingt Wettbewerber zum Nachziehen
- Inländischer Rechenleistungsmarkt wechselt von politikgetrieben zu marktgetrieben: Ascend wechselt von “beschafft werden” zu “gewählt werden”
- KI-Innovationshürden für KMUs sinken: API-Kostensenkungen senken direkt die Trial-and-Error-Kosten
- Zwei-Spur-Landschaft bildet sich: High-End-Szenarien nutzen NVIDIA, Ersatz-Szenarien nutzen Ascend, die Auswahl erweitert sich
Schlüsselbewertung
DeepSeeks Preissenkung ist kein Preiskrieg, sondern das Ergebnis veränderter Kostenstrukturen. Nach der Full-Stack-Heterogen-Neugestaltung sinkt die Abhängigkeit von einem einzelnen Anbieter und die Verhandlungsposition verbessert sich.
Das ist ein positives Signal für die gesamte inländische KI-Industriekette. Keine Frage des “Ob es funktioniert”, sondern der “Ob die Kosten wettbewerbsfähig sind”. Letzteres hat jetzt auch eine Antwort.
Quellen: CSDN, 27.05.2026; Offizielle DeepSeek-Mitteilung; Huawei Ascend Launch Event