Alibaba CloudがワールドモデルAI「ShengShu」に約2.9億ドル出資——LLMの限界を超える次世代AI技術へ

概要

Alibaba Cloudは2026年4月10日、北京を拠点とするAIスタートアップ**ShengShu Technology（生数科技）のシリーズBファンディングラウンドをリードし、20億人民元（約2億9000万ドル）の調達を主導した。TAL Education（好未来）やBaidu Venturesも共同投資家として参加している。ShengShuはOpenAIのSoraよりも早くグローバル展開を実施したAIビデオ生成ツール「Vidu」で知られており、今回の資金は汎用ワールドモデル（General World Model）**の開発加速に充てられる。

ワールドモデルとは何か

ワールドモデルとは、テキストを主な学習データとする従来のLLM（大規模言語モデル）とは異なり、映像・音声・触覚などのマルチモーダルデータで訓練され、現実世界の物理環境をシミュレートするAIモデルを指す。ShengShuは「視覚・音声・触覚などのマルチモーダルデータをもとに構築された汎用ワールドモデルは、大規模言語モデルよりも物理世界の仕組みをより自然に表現する」と説明している。ChatGPTのようなテキストチャットボットと異なり、動画や現実シナリオでの訓練によって物理環境の再現を目指す点が最大の特徴だ。

製品・技術の現状

ShengShuの主力製品であるViduは継続的なアップデートを重ねており、2026年1月にリリースされたVidu Q3 ProはArtificial Analysisの評価においてAIビデオ生成モデルのトップ10入りを達成した。テキストと画像の両方から高品質な動画を生成できる。また2025年12月には、映像・音声などのマルチモーダルデータを処理してロボットを制御するモデルMotusをオープンソース化し、ヒューマノイドロボットなど具現化AI（Embodied AI）企業との戦略的パートナーシップも締結している。将来的にはAGI（汎用人工知能）を物理環境へ実装するという長期ビジョンを掲げる。

Alibabaの戦略的背景

Alibabaは今回のShengShu投資にとどまらず、ワールドモデル分野への投資を積極的に拡大している。リアルタイムAIビデオ生成ツールを手がけるPixVerseに6000万ドル、3DワールドモデルAIのTripo AIにBaidu Venturesと共同で5000万ドルを投資するなど、ポートフォリオを構築中だ。AI基盤面でも2026年3月にエージェント向けCPU「XuanTie C950」、4月初旬にはZhenwuチップ1万基を搭載したデータセンターを相次いで発表しており、クラウドビジネスの成長と連動させながらAIエコシステム全体を強化している。中国国内ではByteDance（Seedance 2.0）やKuaishou（Kling）なども類似ツールを展開しており、AIビデオ・ワールドモデル領域の競争は一層激化している。LLMのスケーリングだけでは推論能力やハルシネーション、計算コストといった限界が顕在化する中、業界全体でワールドモデルへの移行が加速している。

概要#

ワールドモデルとは何か#

製品・技術の現状#

Alibabaの戦略的背景#

概要

ワールドモデルとは何か

製品・技術の現状

Alibabaの戦略的背景