相信大家可能對年初造成遊戲股大跌的 Google 「Project Genie」還有點印象,現在能運用在遊戲即時生成的世界模型又多了一個強力的新玩家,昨日中國騰訊混元團隊正式發布並開源 HY-World 2.0:一款多模態 3D 世界模型,能從文字、單張圖像、多視角圖像或影片輸入,直接生成可供遊戲引擎使用的真實 3D 資產(網格 Mesh 與 3D Gaussian Splatting),而非僅輸出一段像素影片。
關鍵突破:從「看電影」到「建遊戲」
HY-World 2.0 的核心主張,是對現有影片世界模型的根本性批判。騰訊在技術文件中明確指出,Google Genie 3、NVIDIA Cosmos 以及自家前代 HY-World 1.5 等模型,本質上都是「生成像素影片」,播放結束後,生成的世界就此消失,且無法編輯。HY-World 2.0 採取截然不同的方法:直接輸出 真實 3D 資產(Mesh 網格與 3DGS),這些資產可永久保存,並能直接匯入 Blender、Unity、Unreal Engine 以及 NVIDIA Isaac Sim 等主流遊戲與仿真引擎。
We’re open-sourcing HY-World 2.0, a multimodal world model that generates, reconstructs, and simulates interactive *3D worlds* from text, images, and videos.
Outputs can be integrated into game engines and embodied simulation pipelines.
Key highlights:
🔹 One-click world… pic.twitter.com/OuKEm9krn4— Tencent HY (@TencentHunyuan) April 16, 2026
兩種路線的差異,官方以一張對比表清楚呈現:
簡言之:影片世界模型是「看完就消失的電影」,HY-World 2.0 則是「建起來就永遠留著的遊戲世界」。
四階段技術管線
HY-World 2.0 的世界生成流程分為四個階段,環環相扣:
- 全景生成(HY-Pano 2.0):從文字或圖像輸入,生成 360° 全景圖作為世界的基礎框架
- 軌跡規劃(WorldNav):根據全景圖規劃攝影機移動軌跡,決定世界的探索路徑
- 世界擴展(WorldStereo 2.0):依循軌跡將全景圖擴展為具有深度與空間一致性的 3D Gaussian Splatting 世界
- 世界組合(WorldMirror 2.0 + 3DGS 學習):將多視角重建結果融合,輸出最終高品質的 3DGS 或 Mesh 格式資產
此外,HY-World 2.0 支援世界重建(World Reconstruction)功能:輸入多張照片或一段普通影片,即可即時重建出數位孿生的 3D 場景:「拍段影片,得到數位分身」。
WorldMirror 2.0:單次前向傳遞,同時輸出五種資訊
整個系統的核心模組是 WorldMirror 2.0,這也是目前唯一已完整開源(代碼 + 模型權重)的子模組,參數量約為 12 億(1.2B)。
WorldMirror 2.0 的特色在於「單次前向傳遞(single forward pass)」即可同時預測:
- 稠密點雲(Dense Point Cloud)
- 深度圖(Depth Map)
- 表面法向量(Surface Normal)
- 相機參數(Camera Intrinsics / Extrinsics)
- 3D Gaussian Splatting 屬性
支援 50K 至 500K 像素的彈性解析度推理。在 7-Scenes、NRGBD 與 DTU 等標準重建基準測試上,WorldMirror 2.0 的精度(Accuracy)與完整性(Completeness)均優於第一代 WorldMirror。
效能基準:超越 SEVA、Gen3C
在世界擴展(WorldStereo 2.0)的相機控制評測中,HY-World 2.0 相比競品具備明顯優勢:
- 旋轉誤差(RotErr):0.492(vs. SEVA 的 1.690、Gen3C 的 0.944)
- 位移誤差(TransErr):0.968(vs. SEVA 的 1.578、Gen3C 的 1.580)
- 視覺品質(Q-Align):4.205(vs. SEVA 的 3.232、Gen3C 的 3.353)
在 MipNeRF360 的場景重建 F1 分數上,WorldStereo 2.0 達到 51.27,同樣領先同期競品。
互動式角色探索:在 AI 生成世界裡「走動」
HY-World 2.0 不只是靜態的 3D 資產輸出,還支援互動式角色探索:使用者可以第一人稱視角或第三人稱角色模式,在 AI 生成的街道、建築與景觀中自由行走,並具備物理碰撞支援。
騰訊已在官方網站 3d.hunyuan.tencent.com 開放免費試用(目前因流量過大需排隊等候)。
開源計畫:部分開放,更多仍在路上
截至發布當日,HY-World 2.0 的開源狀態如下:
- ✅ 已開源:技術報告(Technical Report)
- ✅ 已開源:WorldMirror 2.0 推理代碼與模型權重(Hugging Face 可下載)
- ⬜ 即將開源:完整世界生成推理代碼(WorldNav + WorldStereo 2.0 + World Composition)
- ⬜ 即將開源:全景生成模型 HY-Pano 2.0
- ⬜ 即將開源:世界擴展模型 WorldStereo 2.0 的完整代碼與權重
換言之,目前完整的「一鍵生成 3D 世界」流程尚未完全開源,但 WorldMirror 2.0(世界重建部分)已可直接使用。完整生成管線預計在後續分批釋出。目前 WorldMirror 2.0 的模型權重已可在 Hugging Face 下載,完整世界生成功能則靜待後續的開源進程。






