Kael Zhang
AIフィジカルAI日本ソフトバンクソニーホンダNEC主権AIロボット自動運転

日本が1兆円のフィジカルAIコンソーシアムを発足:ソフトバンク、ソニー、ホンダ、NECが国産基盤モデルを構築

Kael Zhang

2026年4月13日、日本はこれまで最大規模の主権AI投資計画を発表した。ソフトバンク株式会社、NEC、ソニーグループ、本田技研工業が共同で日本AI基盤モデル開発を設立。チャットボットではなく、ロボット、工場ライン、自動運転車を動かすフィジカルAIに特化した国産1兆パラメータ基盤モデルの構築を目指す。

提携構造と資金計画

新会社は民間部門コンソーシアムとして政府の共同出資を受けて運営される。ソフトバンク(国内通信事業会社)とNECがモデルアーキテクチャと事前学習を主導。ソニーグループはイメージング、センサーフュージョン、ゲーミングエンジン資産を提供。本田は0シリーズEVの自動運転データとASIMO後継プログラムの操作軌跡を提供。Preferred Networksは出向エンジニアで技術協力。

新能源・産業技術総合開発機構(NEDO)は2026年度から5年間で最大1兆円(約63億ドル)を支援。各創業メンバーが10%超の株式を保有し、日本製鉄、神戸製鋼所、三菱UFJ銀行、三井住友銀行、みずほ銀行も出資する。

フィジカルAI vs 生成AI:戦略的賭け

コンソーシアムの任務は明確にフィジカルAIを対象とする——マルチモーダルセンサーデータ、ロボット遠隔操作トレース、CAD級シミュレーション環境で学習した基盤モデル。最初の成果物は約1兆パラメータのデンス・スパースハイブリッドモデルで、工場自動化、自律移動、ヒューマノイドロボットのドメイン固有バリアントを持つ。限定的な展開は2028年末を目標とし、完全な商業リリースは2030年大阪スマートシティに向けて行われる。

現在主流の生成AIとは対照的に、これらのモデルは認識を物理世界の実際の行動に変換する。

技術アーキテクチャ

主力モデルは約1兆パラメータのMixture-of-Experts Transformerで、専用のVision-Language-Actionヘッドを備える。学習コーパスは日本語・英語・中国語・韓国語のテキスト、自動運転トレースと遠隔操作ログの動画、3Dシーン表現、独自の工業テレメトリを組み合わせる。学習計算予算は約8 × 10²⁵ FLOPs——GPT-4クラスをやや上回る。

アーキテクチャは3つのモデルファミリーに分かれる:ベース推論モデル、操作のためのVision-Action Policyモデル、自動運転ワールドモデル。3つすべてが共通のトークナイザーと埋め込み空間を共有し、ロボット形態間の重み移行を可能にする。

学習インフラはハイブリッドクラスタで運用される:ソフトバンク北海道の既存4,000 GPU H200クラスタ、NEDO共同出資で2027年第2四半期完成を目指す新Blackwell Pod、KDDI印西データセンターキャンパスからのバースト容量。

世界の主権AI投資比較

主権AIイニシアチブ国/地域資金規模期間重点分野
日本AI基盤モデル開発日本1兆円(約63億ドル)2026–2030フィジカルAI、ロボット、自律システム
EU AIファクトリー計画欧州連合200億ユーロ(約220億ドル)2024–2027HPC + 最先端LLM
英国主権AI基金英国5億ポンド(約6.4億ドル)2026–20287社の先端スタートアップ
Stargate(米民間)アメリカ5,000億ドル目標2025–2029OpenAI計算容量
フランス主権コンピューティングフランス25億ユーロ2025–2027Mistral + AIファクトリー
韓国K-AI韓国9.4兆ウォン(約68億ドル)2026–2027国産LLM、半導体

日本のコンソーシアムは、民間・公共ハイブリッドモデルで運営され、純粋な言語モデルではなくフィジカルAIに焦点を当てた世界初の主権AIプログラムである。

投資家・業界の反応

モルガン・スタンレーMUFGは4月14日にソニーグループの目標株価を8%引き上げ、「日本のAIスタック内でのソニーイメージセンサーフランチャイズの構造的な収益化改善」を理由とした。野村はソフトバンクの格付けを維持しながら、コンソーシアムを1株あたり約150円の長期コールオプションと位置づけた。シティは異論を唱え、1兆円の見出しには従来のNEDO約束が含まれており、実際の新規資金は6,000~7,000億円に近いと推定した。

5つの予測

予測1: 2026年第4四半期までに、NEDO共同出資の16,000~24,000 GPU Blackwellメガクラスタが日本に設置される。

予測2: 2027年までに、トヨタ、三菱電機、Rapidusのいずれかが第5の創業メンバーとして加わる。

予測3: コンソーシアムは重みをオープンソースではなくライセンス供与する——Meta Llamaコミュニティライセンスをモデルにしつつ、日本データ居住要件を追加する。

予測4: NVIDIAは2027年のGTCまでに日本専用のCosmosビルドを対応させる。

予測5: 最初の商業展開は工場ではなく、2027年のホンダ0シリーズ認識スタック内で行われる——自動車ADASの検証サイクルはグリーンフィールドのヒューマノイド展開より計画しやすい。

主要リスク

3つの主要リスク:4大財閥+政府監督間のガバナンス膠着状態、東京の給与水準では米国との差が大きくシニアAI研究者の採用困難、GPUとHBMサプライチェーンの地政学的混乱。

結論

日本は別のゲームをしている:ChatGPTに追いつくのではなく、全く新しいフィジカルAI分野で複製不可能なデータ堀を築く。日本は世界の工業用ロボット生産額の約38%を占め、41万4千台の稼働中の工業用ロボットを抱え、ソニーはCMOSイメージセンサー市場の半数を支配する。データ信託メカニズムが適切に実行されれば、これは他のすべての主権AIプログラムが研究するテンプレートとなる。失敗すれば、データガバナンスがコンソーシアムが使用するはずのデータを摂取できなくする扼制点となる。