Le Japon lance un consortium d'IA physique à 1 000 milliards de yens : SoftBank, Sony, Honda, NEC construisent un modèle de fondation souverain
Le 13 avril 2026, le Japon a annoncé son investissement souverain en IA le plus important à ce jour. SoftBank Corp., NEC Corp., Sony Group Corp. et Honda Motor Co. ont conjointement créé le Japan AI Foundation Model Development, une initiative destinée à construire un modèle de fondation domestique d’un billion de paramètres axé sur l’IA physique — les systèmes qui alimentent les robots, les chaînes de fabrication et les véhicules autonomes, plutôt que les chatbots.
L’accord : un joint venture de 1 000 milliards de yens
La nouvelle entité fonctionne comme un consortium du secteur privé avec un cofinancement gouvernemental. SoftBank Corp. (l’unité télécoms domestique) et NEC dirigent l’architecture du modèle et le préentraînement. Sony Group contribue par l’imagerie, la fusion de capteurs et les moteurs de jeux. Honda Motor apporte les données de conduite autonome de sa gamme 0 Series et le programme successeur d’ASIMO. Preferred Networks participe avec des ingénieurs en détachement.
La New Energy and Industrial Technology Development Organization (NEDO) fournira jusqu’à 1 000 milliards de yens (~6,3 milliards USD) sur cinq ans à partir de l’exercice fiscal 2026. Chaque fondateur détient une participation supérieure à 10 %, avec Nippon Steel, Kobe Steel, MUFG Bank, Sumitomo Mitsui Banking et Mizuho Bank comme investisseurs additionnels.
IA physique vs IA générative : le pari stratégique
Le mandat du consortium cible explicitement l’IA physique — des modèles de fondation entraînés sur des données de capteurs multimodaux, des traces de téléopération robotique et des environnements de simulation de niveau CAO. Le premier livrable est un modèle hybride dense-épars d’environ un billion de paramètres, avec des variantes spécifiques à la robotique, la mobilité autonome et l’automatisation industrielle. Le déploiement limité est prévu pour fin 2028, avec une sortie commerciale complète avant l’Osaka Smart City 2030.
Contrairement à l’IA générative qui produit du texte ou des images, ces modèles traduisent la perception en action dans le monde physique.
Architecture technique
Le modèle phare sera un transformateur mixture-of-experts d’environ un billion de paramètres avec une tête vision-langage-action dédiée. Le corpus d’entraînement combine du texte (japonais, anglais, mandarin, coréen), des vidéos de traces de conduite autonome et de téléopération, des représentations de scènes 3D et de la télémétrie industrielle propriétaire. Le budget de calcul est d’environ 8 × 10²⁵ FLOPs — légèrement supérieur à la classe GPT-4.
L’architecture se divise en trois familles de modèles : un modèle de raisonnement de base, un modèle de politique vision-action pour la manipulation, et un modèle du monde pour la conduite autonome. Les trois partagent un tokeniseur et un espace d’embedding communs.
Comparaison mondiale des initiatives d’IA souveraine
| Initiative d’IA souveraine | Pays/Région | Engagement financier | Calendrier | Focus |
|---|---|---|---|---|
| Japan AI Foundation Model Development | Japon | ¥1 000 Mds (~6,3 Mrd USD) | 2026–2030 | IA physique, robotique, autonomie |
| Programme EU AI Factories | Union européenne | €20 Mds (~22 Mrd USD) | 2024–2027 | HPC + LLM frontière |
| UK Sovereign AI Fund | Royaume-Uni | £500 Mio (~640 Mio USD) | 2026–2028 | 7 startups frontière |
| Stargate (US privé) | États-Unis | 500 Mrd USD cible | 2025–2029 | Capacité calcul OpenAI |
| France calcul souverain | France | €2,5 Mrd | 2025–2027 | Mistral + AI Factories |
| Corée du Sud K-AI | Corée du Sud | ₩9 400 Mds (~6,8 Mrd USD) | 2026–2027 | LLM national, puces |
Le consortium japonais est le premier programme d’IA souveraine mondial à fonctionner selon un modèle hybride public-privé axé sur l’IA physique plutôt que sur les modèles de langage purs.
Réaction des investisseurs et de l’industrie
Morgan Stanley MUFG a relevé l’objectif de cours de Sony Group de 8 % le 14 avril, citant une “monétisation structurellement améliorée de la franchise de capteurs d’image de Sony”. Nomura a maintenu sa recommandation sur SoftBank Corp. mais a qualifié le consortium d’option d’achat long terme d’environ 150 yens par action. Citi a contesté, estimant que les fonds réellement nouveaux se situent plutôt entre 600 et 700 milliards de yens.
Cinq prédictions
Prédiction 1 : Un méga-cluster Blackwell cofinancé par NEDO de 16 000 à 24 000 GPU sera installé au Japon avant le Q4 2026.
Prédiction 2 : Un acteur secondaire — probablement Toyota, Mitsubishi Electric ou Rapidus — rejoindra comme cinquième fondateur avant 2027.
Prédiction 3 : Le consortium licenciera ses poids, plutôt que de les open-sourcer, sur le modèle de la licence communautaire Meta Llama avec des exigences de résidence de données au Japon.
Prédiction 4 : NVIDIA répondra avec une version Cosmos spécifique au Japon d’ici la GTC 2027.
Prédiction 5 : Le premier déploiement commercial sera dans la pile de perception de la série 0 de Honda en 2027, et non à l’usine.
Risques principaux
Trois risques primaires : blocage de gouvernance entre quatre grands keiretsu japonais et la supervision gouvernementale ; incapacité à recruter suffisamment de chercheurs sénior en IA ; perturbation géopolitique des chaînes d’approvisionnement en GPU et HBM.
Conclusion
Le Japon joue une partie différente : non pas rattraper ChatGPT, mais construire un fossé de données impossible à reproduire dans le domaine entièrement nouveau de l’IA physique. Le Japon représente environ 38 % de la production mondiale de robots industriels en valeur, compte 414 000 robots industriels en service actif, et Sony domine la moitié du marché des capteurs d’image CMOS. Si le mécanisme de trust de données fonctionne proprement, cela deviendra un modèle pour tous les autres programmes d’IA souveraine. Sinon, la gouvernance des données deviendra le point de blocage.