騰訊開源 HY-World 2.0：一句話生成可互動 3D 世界，素材可直接匯入遊戲引擎

相信大家可能對年初造成遊戲股大跌的 Google 「Project Genie」還有點印象，現在能運用在遊戲即時生成的世界模型又多了一個強力的新玩家，昨日中國騰訊混元團隊正式發布並開源 HY-World 2.0：一款多模態 3D 世界模型，能從文字、單張圖像、多視角圖像或影片輸入，直接生成可供遊戲引擎使用的真實 3D 資產（網格 Mesh 與 3D Gaussian Splatting），而非僅輸出一段像素影片。

關鍵突破：從「看電影」到「建遊戲」

HY-World 2.0 的核心主張，是對現有影片世界模型的根本性批判。騰訊在技術文件中明確指出，Google Genie 3、NVIDIA Cosmos 以及自家前代 HY-World 1.5 等模型，本質上都是「生成像素影片」，播放結束後，生成的世界就此消失，且無法編輯。HY-World 2.0 採取截然不同的方法：直接輸出 真實 3D 資產（Mesh 網格與 3DGS），這些資產可永久保存，並能直接匯入 Blender、Unity、Unreal Engine 以及 NVIDIA Isaac Sim 等主流遊戲與仿真引擎。

We’re open-sourcing HY-World 2.0, a multimodal world model that generates, reconstructs, and simulates interactive *3D worlds* from text, images, and videos.

Outputs can be integrated into game engines and embodied simulation pipelines.

Key highlights:
🔹 One-click world… pic.twitter.com/OuKEm9krn4

— Tencent HY (@TencentHunyuan) April 16, 2026

兩種路線的差異，官方以一張對比表清楚呈現：

簡言之：影片世界模型是「看完就消失的電影」，HY-World 2.0 則是「建起來就永遠留著的遊戲世界」。

四階段技術管線

HY-World 2.0 的世界生成流程分為四個階段，環環相扣：

全景生成（HY-Pano 2.0）：從文字或圖像輸入，生成 360° 全景圖作為世界的基礎框架
軌跡規劃（WorldNav）：根據全景圖規劃攝影機移動軌跡，決定世界的探索路徑
世界擴展（WorldStereo 2.0）：依循軌跡將全景圖擴展為具有深度與空間一致性的 3D Gaussian Splatting 世界
世界組合（WorldMirror 2.0 + 3DGS 學習）：將多視角重建結果融合，輸出最終高品質的 3DGS 或 Mesh 格式資產

此外，HY-World 2.0 支援世界重建（World Reconstruction）功能：輸入多張照片或一段普通影片，即可即時重建出數位孿生的 3D 場景：「拍段影片，得到數位分身」。

WorldMirror 2.0：單次前向傳遞，同時輸出五種資訊

整個系統的核心模組是 WorldMirror 2.0，這也是目前唯一已完整開源（代碼 + 模型權重）的子模組，參數量約為 12 億（1.2B）。

WorldMirror 2.0 的特色在於「單次前向傳遞（single forward pass）」即可同時預測：

稠密點雲（Dense Point Cloud）
深度圖（Depth Map）
表面法向量（Surface Normal）
相機參數（Camera Intrinsics / Extrinsics）
3D Gaussian Splatting 屬性

支援 50K 至 500K 像素的彈性解析度推理。在 7-Scenes、NRGBD 與 DTU 等標準重建基準測試上，WorldMirror 2.0 的精度（Accuracy）與完整性（Completeness）均優於第一代 WorldMirror。

效能基準：超越 SEVA、Gen3C

在世界擴展（WorldStereo 2.0）的相機控制評測中，HY-World 2.0 相比競品具備明顯優勢：

旋轉誤差（RotErr）：0.492（vs. SEVA 的 1.690、Gen3C 的 0.944）
位移誤差（TransErr）：0.968（vs. SEVA 的 1.578、Gen3C 的 1.580）
視覺品質（Q-Align）：4.205（vs. SEVA 的 3.232、Gen3C 的 3.353）

在 MipNeRF360 的場景重建 F1 分數上，WorldStereo 2.0 達到 51.27，同樣領先同期競品。

互動式角色探索：在 AI 生成世界裡「走動」

HY-World 2.0 不只是靜態的 3D 資產輸出，還支援互動式角色探索：使用者可以第一人稱視角或第三人稱角色模式，在 AI 生成的街道、建築與景觀中自由行走，並具備物理碰撞支援。

騰訊已在官方網站 3d.hunyuan.tencent.com 開放免費試用（目前因流量過大需排隊等候）。

開源計畫：部分開放，更多仍在路上

截至發布當日，HY-World 2.0 的開源狀態如下：

✅ 已開源：技術報告（Technical Report）
✅ 已開源：WorldMirror 2.0 推理代碼與模型權重（Hugging Face 可下載）
⬜ 即將開源：完整世界生成推理代碼（WorldNav + WorldStereo 2.0 + World Composition）
⬜ 即將開源：全景生成模型 HY-Pano 2.0
⬜ 即將開源：世界擴展模型 WorldStereo 2.0 的完整代碼與權重

換言之，目前完整的「一鍵生成 3D 世界」流程尚未完全開源，但 WorldMirror 2.0（世界重建部分）已可直接使用。完整生成管線預計在後續分批釋出。目前 WorldMirror 2.0 的模型權重已可在 Hugging Face 下載，完整世界生成功能則靜待後續的開源進程。

Tags: HY-World 2.0 Project Genie 世界引擎開源騰訊

騰訊開源 HY-World 2.0：一句話生成可互動 3D 世界，素材可直接匯入遊戲引擎

您也許會喜歡：

網站搜尋

廣告