スタンフォード発AI企業、3D世界モデル「マーブル」公開

(米国)

サンフランシスコ発

2025年11月25日

米スタンフォード大学の人工知能(AI)研究者フェイフェイ・リー博士が率いるスタートアップ「ワールドラボズ」は11月12日、3D空間を生成する初の商用の世界モデル(注1)「マーブル」を一般公開した。マーブルはテキスト・画像・動画・3Dレイアウトの入力から、編集可能な3D空間を生成し、ガウシアン・スプラッティング(注2)やメッシュ形式(注3)で出力できる。

テクノロジー専門誌「ザ・バージ」誌のインタビューで、リー博士は「世界モデルは従来モデルと比べて、むしろそれ以上に大きくエキサイティングなものだ」と答えた。また同社のベン・ミルデンホール共同創業者は「従来は大規模なチームと複雑なソフトウエアが必要だった3D制作に、革命的な変化をもたらす」と述べた(「ザ・バージ(The Verge)」11月13日付)。

2カ月限定のベータ版を経て正式公開されたマーブルは、無料から月額95ドルの4段階の料金体系を採用。3D構造の下書きにスタイルを反映させる機能、3D空間の一部を拡張する機能、複数の3D空間を統合する機能など、多様な編集機能を備え、マルチモーダル性を大幅に拡張した。

世界モデルとしては、グーグル・ディープマインドが、テキスト1文のプロンプトでインタラクティブな環境をリアルタイムで生成する世界モデル「ジェニー3」を公開している。そのほか、3D空間を直接生成する世界モデルを公開している企業には、ワールドラボズとエヌビディアが現時点で挙げられる。エヌビディアはフィジカルAI(注4)向けの「コスモス」プラットフォームを発表している。テキスト、画像、動画などの入力から多様な3D環境を生成し、物理的挙動も表現できる世界基盤モデルで、ロボティクス・自動運転向けのシミュレーション、合成データの作成などを産業向けに提供する。

ワールドラボズは2024年、アンドリーセン・ホロウィッツらの主導で2億3,000万ドルを調達した。これには、AMDベンチャーズ、インテル・キャピタル、エヌビディアNベンチャーズも出資した。リー博士は、現在の最先端AIは読解、文章作成、リサーチ、データ分析には優れている一方で、物理世界の表現や相互作用には限界があると指摘し、空間的な関係性や意味を包括的に理解する「空間知能(Spatial Intelligence)」が不可欠だと強調する。こうした3D空間生成モデルは、AR/VR(注5)、カメラ、画像処理、ファクトリーオートメーション、ロボティクスやデジタルツインなどへの活用が期待される。

(注1)グーグル・ブレインが2018年に発表した「World Models」という論文に由来。AIが観測データから環境の構造や物理法則、因果関係を学習し、現実世界のシミュレーションを行う。

(注2)3D空間をガウス分布に従う多数の点群として表現する手法。軽量かつ高精細な描画が可能。従来のポリゴン(面)より計算負荷が小さく、リアルタイム表示に適する。

(注3)3D空間を頂点、辺、面の集合として表現する方法。3D CAD、ゲーム、CG制作などで標準的な形式。

(注4)カメラやセンサーなどを活用し、現実世界の情報を収集・処理し、自律的な行動ができるAI技術。

(注5)ARは現実世界の映像にデジタル情報を重ねて表示する拡張現実、VRは完全にデジタルで作られた仮想空間に没入する仮想現実。

(松井美樹)

(米国)

ビジネス短信 9eccd68d481e9cbb