真沒想到 Grok 在這時候突然推出新一代 Imagine v0.9 影片生成模型,而且效果還讓大家都吃驚,幾乎可說各方面都大升級,除了畫面品質變得更好之外,也同樣可以同步生成聲音,就跟 Sora 2、Veo 3 一樣,更值得一提的是,Imaging v0.9 在你上傳圖片後,就會自動轉換成影片,不用給任何提示詞,我實測效果非常棒,畫面超自然。
此外,Imagine v0.9 的尺度也比起其他家寬鬆許多,代表說即使是一些 NSFW 類型內容,也同樣能生成影片。免費使用,也不用掛任何 VPN。
Grok Imagine v0.9 影片生成模型登場!各方面大升級,能同步生成聲音、尺度很寬鬆
稍早馬斯克在 X 社群宣布推出 Grok Imagine v0.9 模型,直接從 v0.1 升級到 v0.9,這真的有誇張到:
Grok Imagine v0.9 使用全新的 Aurora 引擎,這是一個專為即時生成和聲音同步而優化的渲染系統,標榜用戶只需 5 秒鐘,就能生成出標準品質的影片,高解析度輸出也僅 15 秒內完成。
和依賴提示詞或漫長渲染時間的競爭對手不同,Grok Imagine 專注在即時的創作回饋,也因此用戶只需要上傳圖片,Imagine 就會自動轉換成影片,無需輸入任何提示詞,後續如果要修改,再透過 Custom 功能來添加提示詞。
除此之外,馬斯克也提到 Grok Imagine v0.9 是生成式 AI 平台的一次重大更新,已經將圖像創作、影片生成和語音合成整合到單一的統一體驗中,你只需要打開 Grok 網頁版並登入帳號,就能使用到所有功能,包括最新的影片生成。
下圖是 Imagine 的介面,跟其他 AI 生成工具不同的地方在,Grok 的影片和圖片生成是結合在一起,也就是說,你在輸入框中輸入提示詞後,會先生成出多張圖片,找到你喜歡的圖片後,進到內頁再轉換成圖片。按輸入框旁邊的迴紋針,可以上傳你的圖片:
我的提示詞是「1 位時尚的日本女性在東京鐵塔前面拍攝時裝照」,Grok 就會生成出超多圖片讓我瀏覽,一直往下瀏覽就會繼續生成,而且速度超快:
我覺得這張很不錯,進到內頁後,右下角就會找到「製作影片」的按鈕,按下就會開始轉換成影片:
這是 Grok 自動轉換的結果,已經非常不錯,動作看起來很自然,還有配音:
影片生成出來如果你不滿意,可以點重做,或是打開箭頭選單,裡面有四個選項「Custom」、「Spicy」、「Fun」和「Normal」,Custom 你可以自行輸入提示詞,Spicy 則是必須滿 18 歲才能使用,會生成出 NSFW 的影片:
這是我下「脫掉只剩下內衣」的提示詞,Grok 也能生成出來,尺度真的夠大,這提示詞如果是用 Sora 或 Veo 3 肯定不行:
Spicy 的影片生成結果: