先前 Google 推出 Veo 3 模型後,OpenAI 的 Sora 明顯看不到車尾燈,無論是影片生成品質,還是能同時生成音效,Sora 都比不上。而終於在稍早 OpenAI 要開始反攻了,正式推出新一代 Sora 2 影片生成模型,除了影像生成品質大幅提升外,不意外的也同樣支援音訊生成,同時為了讓用戶更容易使用 Sora 2,還同步推出 Sora by OpenAI 手機版 App。
OpenAI 正式推出新一代 Sora 2 影片生成模型
OpenAI 表示,Sora 2 是一個通用的影片 + 音訊生成系統,能創造出豐富的背景音景、語音與音效,且具備高度真實感,並能做到一些舊模型無法實現的場景,像是:花式溜冰選手帶著貓表演三周跳、在划水板上作後空翻同時正確模擬浮力與剛性、在三周跳時仍讓貓抓穩物體等等,可以參考下方 OpenAI 釋出的短片。
在可控性方面也有大幅提升,Sora 2 能夠遵循跨鏡頭的複雜指令,並準確記憶並持續世界的狀態。無論是寫實風、影視風、甚至動畫風格,它都表現非常出色。
為了展示 Sora 2 生成音效的能力,OpenAI 也分享這段影片,看起來真有一點猛。另外也可以注意到,影片中的 Sam Altman 是由 AI 生成的,這也是 Sora 2 最強大之處:
Sora 2 現在可以將現實世界的元素注入,如:透過觀察一段影片,就能投入到任何 Sora 生成的場景中,並精準還原外觀與聲音。無論是人物、動物、物件都可以。
在 OpenAI 的 Sora 2 直播影片中,就展示了許多小短片,裡面的人物、物件都是由 AI 生成:
比較可惜是,Sora 2 目前是採用邀請制度,意味著沒有全面開放,只有一些早期用戶收到邀請,
而在接下來幾天和幾週內,OpenAI 將會優先考慮 Sora 2 的進階用戶、ChatGPT Pro 訂閱用戶,隨後才會輪到 ChatGPT Plus 和 Team 用戶,因此對於多數人來說,可能還需要再等一陣子才能體驗到。
ChatGPT Pro 將能使用高品質的實驗性 Sora 2 Pro 模型,初期僅在 sora.com 平台提供(未來也會整合進 App)。
Sora 2 推出後,Sora 1 Turbo 也能繼續使用,之前創作的所有內容也會保存在 sora.com 的資料庫中。
OpenAI 推出 Sora by OpenAI 手機版 App
這次新推出的 Sora by OpenAI,不單純只是一個影片生成 App,更像是影片分享的社群 App,有點類似 TikTok,只是這邊都是由 AI 生成的短影片。
OpenAI 表示,在這款 App 中,用戶可以創作、重混他人生成的內容、在可自訂的 Sora 推薦動態中探索新影片,以及透過 cameo(客串)功能,把你或朋友放進場景裡。也就是說,即便朋友不在旁邊,你也能透過 Sora 2 生成一部跟朋友一起表演的影片。
當然,這個 cameo 功能你具有完整的控制權,你可以決定有哪些人能使用,甚至是完全關閉,這樣就沒有人可以生成你的 AI 人物了。使用時也需要經過驗證(影片 + 音訊錄製),來證明你是本人:
為了避免成癮,針對未成年用戶,OpenAI 也有祭出一些保護設定,預設限制每天動態能看的生成影片數量有限,對 cameo 的權限也較為嚴格。在自動化安全機制之外,也擴充人工監督團隊來快速處理可能的霸凌案件。
不過跟 Sora 2 一樣,Sora by OpenAI 初期也是採發放邀請制,可在 App 中登記來獲得帳號開通通知。首階段在美國與加拿大推出,後續才會擴展到更多國家。
想立刻體驗的人我們也寫了教學,大家可以去看(內有邀請碼):
Sora 2 直播影片: