DeepSeek V4-Pro baisse permanente : l'IA domestique boucle la chaîne complète
Le 31 mai, la promotion de remise de 2,5 sur l’API du modèle DeepSeek V4-Pro a pris fin, mais le prix officiel a été ajusté à un quart du tarif initial. Cela signifie que la remise de 2,5 a été définitivement conservée. Des coûts LLM plus bas activeront davantage l’innovation IA des PME.
Informations clés sur l’ajustement des prix
| Élément | Détails |
|---|---|
| Prix initial | Tarif initial (chiffre exact non divulgué) |
| Prix remisé | Un quart du tarif initial |
| Date d’effet | 31 mai 2026 |
| Promotion précédente | Remise 2,5 terminée, mais équivalent conservé définitivement |
Ce n’est pas une simple baisse de prix. DeepSeek a simultanément achevé la restructuration complète de l’architecture sous-jacente.
Restructuration hétérogène complète : changer de moteur à 10 000 mètres d’altitude
DeepSeek a achevé la restructuration hétérogène complète depuis CUDA, réécrivant plus de 200 unités de calcul cœur sur l’ensemble de la pile. Les professionnels du secteur comparent la difficulté à “changer le moteur d’un avion à 10 000 mètres d’altitude”.
Réalisations clés :
- NPU Ascend intégré dans la matrice de vérification : DeepSeek-V4 est le premier à lister Huawei Ascend aux côtés des GPU NVIDIA pour un support officiel
- Support complet de la gamme Huawei : Tous les produits super-nœuds Ascend bénéficient d’un support officiel
- Expansion de l’écosystème de puissance de calcul domestique : Passage de “poussé par les achats politiques” à “marché de l’infrastructure IA générale”
Cela marque l’entrée officielle de la boucle “LLM domestique + puissance de calcul domestique” dans le déploiement commercial à grande échelle.
IA Edge : ModelBest et LLM ternaire
ModelBest, en collaboration avec l’Université Tsinghua, a publié BitCPM-CANN, le premier LLM ternaire entièrement open-source de Chine, entraîné end-to-end sur des plateformes de calcul domestiques (Huawei Ascend).
Signification du LLM ternaire :
- Consommation énergétique plus faible : Adapté au déploiement edge
- Calcul domestique de bout en bout : De l’entraînement à l’inférence sans dépendance aux puces étrangères
- Open-source : Réduit les barrières sectorielles
Du côté NVIDIA, Vera, le premier CPU dédié aux agents, est officiellement entré en production et livraison, avec une performance single-core en hausse de 50 %. La concurrence IA edge s’accélère.
Impact sur l’industrie
- Les coûts LLM continuent de baisser : La stratégie de prix de DeepSeek force les concurrents à suivre
- Le marché du calcul domestique passe de politique à marché : Ascend passe de “être acheté” à “être choisi”
- Les barrières à l’innovation IA des PME s’abaissent : La réduction des coûts API réduit directement les coûts d’essai-erreur
- Un paysage à deux voies se forme : Scénarios haut de gamme avec NVIDIA, scénarios de remplacement domestique avec Ascend, plus de choix
Évaluation clé
La baisse de prix de DeepSeek n’est pas une guerre des prix ; c’est le résultat de changements de structure des coûts. Après la restructuration hétérogène complète, la dépendance à un seul fournisseur est réduite et le pouvoir de négociation augmente.
C’est un signal positif pour toute la chaîne industrielle de l’IA domestique. Pas une question de “ça marche ou pas”, mais une question de “les coûts sont-ils compétitifs”. Cette dernière a aussi une réponse maintenant.
Sources : CSDN, 2026-05-27 ; Communiqué officiel DeepSeek ; Événement de lancement Huawei Ascend