日本が1兆円のフィジカルAIコンソーシアムを発足:ソフトバンク、ソニー、ホンダ、NECが国産基盤モデルを構築
2026年4月13日、日本はこれまで最大規模の主権AI投資計画を発表した。ソフトバンク株式会社、NEC、ソニーグループ、本田技研工業が共同で日本AI基盤モデル開発を設立。チャットボットではなく、ロボット、工場ライン、自動運転車を動かすフィジカルAIに特化した国産1兆パラメータ基盤モデルの構築を目指す。
提携構造と資金計画
新会社は民間部門コンソーシアムとして政府の共同出資を受けて運営される。ソフトバンク(国内通信事業会社)とNECがモデルアーキテクチャと事前学習を主導。ソニーグループはイメージング、センサーフュージョン、ゲーミングエンジン資産を提供。本田は0シリーズEVの自動運転データとASIMO後継プログラムの操作軌跡を提供。Preferred Networksは出向エンジニアで技術協力。
新能源・産業技術総合開発機構(NEDO)は2026年度から5年間で最大1兆円(約63億ドル)を支援。各創業メンバーが10%超の株式を保有し、日本製鉄、神戸製鋼所、三菱UFJ銀行、三井住友銀行、みずほ銀行も出資する。
フィジカルAI vs 生成AI:戦略的賭け
コンソーシアムの任務は明確にフィジカルAIを対象とする——マルチモーダルセンサーデータ、ロボット遠隔操作トレース、CAD級シミュレーション環境で学習した基盤モデル。最初の成果物は約1兆パラメータのデンス・スパースハイブリッドモデルで、工場自動化、自律移動、ヒューマノイドロボットのドメイン固有バリアントを持つ。限定的な展開は2028年末を目標とし、完全な商業リリースは2030年大阪スマートシティに向けて行われる。
現在主流の生成AIとは対照的に、これらのモデルは認識を物理世界の実際の行動に変換する。
技術アーキテクチャ
主力モデルは約1兆パラメータのMixture-of-Experts Transformerで、専用のVision-Language-Actionヘッドを備える。学習コーパスは日本語・英語・中国語・韓国語のテキスト、自動運転トレースと遠隔操作ログの動画、3Dシーン表現、独自の工業テレメトリを組み合わせる。学習計算予算は約8 × 10²⁵ FLOPs——GPT-4クラスをやや上回る。
アーキテクチャは3つのモデルファミリーに分かれる:ベース推論モデル、操作のためのVision-Action Policyモデル、自動運転ワールドモデル。3つすべてが共通のトークナイザーと埋め込み空間を共有し、ロボット形態間の重み移行を可能にする。
学習インフラはハイブリッドクラスタで運用される:ソフトバンク北海道の既存4,000 GPU H200クラスタ、NEDO共同出資で2027年第2四半期完成を目指す新Blackwell Pod、KDDI印西データセンターキャンパスからのバースト容量。
世界の主権AI投資比較
| 主権AIイニシアチブ | 国/地域 | 資金規模 | 期間 | 重点分野 |
|---|---|---|---|---|
| 日本AI基盤モデル開発 | 日本 | 1兆円(約63億ドル) | 2026–2030 | フィジカルAI、ロボット、自律システム |
| EU AIファクトリー計画 | 欧州連合 | 200億ユーロ(約220億ドル) | 2024–2027 | HPC + 最先端LLM |
| 英国主権AI基金 | 英国 | 5億ポンド(約6.4億ドル) | 2026–2028 | 7社の先端スタートアップ |
| Stargate(米民間) | アメリカ | 5,000億ドル目標 | 2025–2029 | OpenAI計算容量 |
| フランス主権コンピューティング | フランス | 25億ユーロ | 2025–2027 | Mistral + AIファクトリー |
| 韓国K-AI | 韓国 | 9.4兆ウォン(約68億ドル) | 2026–2027 | 国産LLM、半導体 |
日本のコンソーシアムは、民間・公共ハイブリッドモデルで運営され、純粋な言語モデルではなくフィジカルAIに焦点を当てた世界初の主権AIプログラムである。
投資家・業界の反応
モルガン・スタンレーMUFGは4月14日にソニーグループの目標株価を8%引き上げ、「日本のAIスタック内でのソニーイメージセンサーフランチャイズの構造的な収益化改善」を理由とした。野村はソフトバンクの格付けを維持しながら、コンソーシアムを1株あたり約150円の長期コールオプションと位置づけた。シティは異論を唱え、1兆円の見出しには従来のNEDO約束が含まれており、実際の新規資金は6,000~7,000億円に近いと推定した。
5つの予測
予測1: 2026年第4四半期までに、NEDO共同出資の16,000~24,000 GPU Blackwellメガクラスタが日本に設置される。
予測2: 2027年までに、トヨタ、三菱電機、Rapidusのいずれかが第5の創業メンバーとして加わる。
予測3: コンソーシアムは重みをオープンソースではなくライセンス供与する——Meta Llamaコミュニティライセンスをモデルにしつつ、日本データ居住要件を追加する。
予測4: NVIDIAは2027年のGTCまでに日本専用のCosmosビルドを対応させる。
予測5: 最初の商業展開は工場ではなく、2027年のホンダ0シリーズ認識スタック内で行われる——自動車ADASの検証サイクルはグリーンフィールドのヒューマノイド展開より計画しやすい。
主要リスク
3つの主要リスク:4大財閥+政府監督間のガバナンス膠着状態、東京の給与水準では米国との差が大きくシニアAI研究者の採用困難、GPUとHBMサプライチェーンの地政学的混乱。
結論
日本は別のゲームをしている:ChatGPTに追いつくのではなく、全く新しいフィジカルAI分野で複製不可能なデータ堀を築く。日本は世界の工業用ロボット生産額の約38%を占め、41万4千台の稼働中の工業用ロボットを抱え、ソニーはCMOSイメージセンサー市場の半数を支配する。データ信託メカニズムが適切に実行されれば、これは他のすべての主権AIプログラムが研究するテンプレートとなる。失敗すれば、データガバナンスがコンソーシアムが使用するはずのデータを摂取できなくする扼制点となる。