DeepSeekInländische KIRechenleistungAscendNPULLM

DeepSeek V4-Pro dauerhaft günstiger: Inländische KI schließt den Full-Stack-Kreislauf

Kael Zhang 31. Mai 2026

Am 31. Mai endete die 2,5-Rabatt-Aktion für die DeepSeek V4-Pro Modell-API, aber der offizielle Preis wurde auf ein Viertel des ursprünglichen Preises angepasst. Das bedeutet, der 2,5-Rabatt wurde dauerhaft beibehalten. Niedrigere LLM-Kosten werden die KI-Innovation von KMUs weiter aktivieren.

Kerninformationen zur Preisanpassung

Position	Details
Originalpreis	Originalpreis (konkrete Zahl nicht öffentlich bekannt)
Rabattpreis	Ein Viertel des Originalpreises
Gültig ab	31. Mai 2026
Vorherige Aktion	2,5-Rabatt beendet, aber gleichwertiger Rabatt dauerhaft beibehalten

Das ist keine einfache Preissenkung. DeepSeek hat gleichzeitig die Neugestaltung der gesamten zugrunde liegenden Architektur abgeschlossen.

Full-Stack-Heterogen-Neugestaltung: Motorwechsel in 10.000 Metern Höhe

DeepSeek hat die Full-Stack-Heterogen-Neugestaltung von CUDA abgeschlossen und über 200 Kernberechnungseinheiten im gesamten Stack neu geschrieben. Brancheninsider beschreiben die Schwierigkeit als “Motorwechsel eines Flugzeugs in 10.000 Metern Höhe”.

Schlüsselerfolge:

Ascend NPU in Verifizierungsmatrix aufgenommen: DeepSeek-V4 listet erstmals Huawei Ascend neben NVIDIA GPUs zur offiziellen Unterstützung auf
Volle Huawei-Produktlinie unterstützt: Alle Ascend-Supernode-Produkte erhalten offiziellen Support
Erweiterung des inländischen Rechenleistungs-Ökosystems: Wechsel von “politischer Beschaffung getrieben” zu “Allzweck-KI-Infrastrukturmarkt”

Das markiert den offiziellen Eintritt des Kreislaufs “inländisches LLM + inländische Rechenleistung” in den großflächigen kommerziellen Einsatz.

Edge-AI: ModelBest und ternäres LLM

ModelBest veröffentlichte in Zusammenarbeit mit der Tsinghua-Universität BitCPM-CANN, das erste vollständig auf inländischen Rechenleistungsplattformen (Huawei Ascend) end-to-end trainierte und quelloffene ternäre LLM in China.

Bedeutung des ternären LLM:

Niedrigerer Stromverbrauch: Geeignet für Edge-Bereitstellung
Inländische Rechenleistung durchgehend: Vom Training bis zur Inferenz ohne Abhängigkeit von ausländischen Chips
Quelloffen: Senkt Brancheneinstiegshürden

Auf der NVIDIA-Seite ist Vera, die erste CPU speziell für Agenten, offiziell in Produktion und Auslieferung gegangen, mit 50% mehr Single-Core-Leistung. Der Edge-AI-Wettbewerb beschleunigt sich.

Auswirkungen auf die Branche

LLM-Kosten sinken weiter: DeepSeeks Preisstrategie zwingt Wettbewerber zum Nachziehen
Inländischer Rechenleistungsmarkt wechselt von politikgetrieben zu marktgetrieben: Ascend wechselt von “beschafft werden” zu “gewählt werden”
KI-Innovationshürden für KMUs sinken: API-Kostensenkungen senken direkt die Trial-and-Error-Kosten
Zwei-Spur-Landschaft bildet sich: High-End-Szenarien nutzen NVIDIA, Ersatz-Szenarien nutzen Ascend, die Auswahl erweitert sich

Schlüsselbewertung

DeepSeeks Preissenkung ist kein Preiskrieg, sondern das Ergebnis veränderter Kostenstrukturen. Nach der Full-Stack-Heterogen-Neugestaltung sinkt die Abhängigkeit von einem einzelnen Anbieter und die Verhandlungsposition verbessert sich.

Das ist ein positives Signal für die gesamte inländische KI-Industriekette. Keine Frage des “Ob es funktioniert”, sondern der “Ob die Kosten wettbewerbsfähig sind”. Letzteres hat jetzt auch eine Antwort.

Quellen: CSDN, 27.05.2026; Offizielle DeepSeek-Mitteilung; Huawei Ascend Launch Event