DeepSeekIA domestiquePuissance de calculAscendNPULLM

DeepSeek V4-Pro baisse permanente : l'IA domestique boucle la chaîne complète

Kael Zhang 31 mai 2026

Le 31 mai, la promotion de remise de 2,5 sur l’API du modèle DeepSeek V4-Pro a pris fin, mais le prix officiel a été ajusté à un quart du tarif initial. Cela signifie que la remise de 2,5 a été définitivement conservée. Des coûts LLM plus bas activeront davantage l’innovation IA des PME.

Informations clés sur l’ajustement des prix

Élément	Détails
Prix initial	Tarif initial (chiffre exact non divulgué)
Prix remisé	Un quart du tarif initial
Date d’effet	31 mai 2026
Promotion précédente	Remise 2,5 terminée, mais équivalent conservé définitivement

Ce n’est pas une simple baisse de prix. DeepSeek a simultanément achevé la restructuration complète de l’architecture sous-jacente.

Restructuration hétérogène complète : changer de moteur à 10 000 mètres d’altitude

DeepSeek a achevé la restructuration hétérogène complète depuis CUDA, réécrivant plus de 200 unités de calcul cœur sur l’ensemble de la pile. Les professionnels du secteur comparent la difficulté à “changer le moteur d’un avion à 10 000 mètres d’altitude”.

Réalisations clés :

NPU Ascend intégré dans la matrice de vérification : DeepSeek-V4 est le premier à lister Huawei Ascend aux côtés des GPU NVIDIA pour un support officiel
Support complet de la gamme Huawei : Tous les produits super-nœuds Ascend bénéficient d’un support officiel
Expansion de l’écosystème de puissance de calcul domestique : Passage de “poussé par les achats politiques” à “marché de l’infrastructure IA générale”

Cela marque l’entrée officielle de la boucle “LLM domestique + puissance de calcul domestique” dans le déploiement commercial à grande échelle.

IA Edge : ModelBest et LLM ternaire

ModelBest, en collaboration avec l’Université Tsinghua, a publié BitCPM-CANN, le premier LLM ternaire entièrement open-source de Chine, entraîné end-to-end sur des plateformes de calcul domestiques (Huawei Ascend).

Signification du LLM ternaire :

Consommation énergétique plus faible : Adapté au déploiement edge
Calcul domestique de bout en bout : De l’entraînement à l’inférence sans dépendance aux puces étrangères
Open-source : Réduit les barrières sectorielles

Du côté NVIDIA, Vera, le premier CPU dédié aux agents, est officiellement entré en production et livraison, avec une performance single-core en hausse de 50 %. La concurrence IA edge s’accélère.

Impact sur l’industrie

Les coûts LLM continuent de baisser : La stratégie de prix de DeepSeek force les concurrents à suivre
Le marché du calcul domestique passe de politique à marché : Ascend passe de “être acheté” à “être choisi”
Les barrières à l’innovation IA des PME s’abaissent : La réduction des coûts API réduit directement les coûts d’essai-erreur
Un paysage à deux voies se forme : Scénarios haut de gamme avec NVIDIA, scénarios de remplacement domestique avec Ascend, plus de choix

Évaluation clé

La baisse de prix de DeepSeek n’est pas une guerre des prix ; c’est le résultat de changements de structure des coûts. Après la restructuration hétérogène complète, la dépendance à un seul fournisseur est réduite et le pouvoir de négociation augmente.

C’est un signal positif pour toute la chaîne industrielle de l’IA domestique. Pas une question de “ça marche ou pas”, mais une question de “les coûts sont-ils compétitifs”. Cette dernière a aussi une réponse maintenant.

Sources : CSDN, 2026-05-27 ; Communiqué officiel DeepSeek ; Événement de lancement Huawei Ascend