今年 4 月份時,OpenAI 公開承認在開放權重語言模型的策略錯誤,並透露會推出新的 AI 開源模型,當時 OpenAI 執行長 Sam Altman 只有說到未來幾個月內。似乎是先前內部暫定 6 月發表,稍早 Sam Altman 在 X 社群平台中提供相關更新,表示自家開源模型將延後推出,預計要等到夏季,並強調這是值得等待的。
OpenAI 開源模型確定要等到夏季才會推出,6 月無望
稍早 Sam Altman 在 X 社群平台表示:「我們將會花多一點時間打磨我們的開源模型,也就是說,預計會在今年夏天稍晚推出,但不會是在 6 月。我們的研究團隊做出了一些意料之外且非常驚人的成果,我們認為非常非常值得等待,但還需要一些時間。」
we are going to take a little more time with our open-weights model, i.e. expect it later this summer but not june.
our research team did something unexpected and quite amazing and we think it will be very very worth the wait, but needs a bit longer.
— Sam Altman (@sama) June 10, 2025
OpenAI 原本計劃在初夏推出全新的開源模型,預計會擁有跟自家 o 系列模型相當的「推理」能力,以及表現上超越其他開源推理模型,像是 DeepSeek 的 R1。此外,OpenAI 也考慮為這款開源 AI 模型加入多種複雜功能,以提高其競爭力。
不過自從 OpenAI 公開這項資訊後,各家也都陸續推出更強的新模型,像是 Mistral 首款 AI 推理模型「Magistral」、Qwen 於 4 月底也發布 Qwen 3 系列混合式 AI 推理模型,包括 Qwen3‑235B‑A22B、Qwen3‑30B‑A3B。DeepSeek 也不例外,於 5 月 28 日推出新的 DeepSeek‑R1‑0528,數學、編碼與邏輯推理能力更強,也降低幻覺出現的機率。
因此這可能是 OpenAI 延後推出的原因之一。
圖片來源:Medium
根據外媒 TechCrunch 先前報導,OpenAI 高層曾討論過讓這款開源模型具備連接公司雲端 AI 模型的能力,藉此處理更複雜的查詢。不過不確定是不是真的會加到最終的版本中。
無論如何,OpenAI 出品的開源模型,相信應該不會讓人失望,況且 Sam Altman 還強調 “意料之外且非常驚人的成果”。隨著 OpenAI 加入戰場,開源模型很可能會迎來一波高速成長,這點可說相當令人期待。
OpenAI 早在 2019 年就推出過 GPT‑2 開源模型,不過之後一直到 2024 年底,該公司都著重在商業模型,因此開源模型沒有任何動靜。隨著中國 DeepSeek 於今年年初的異軍突起且大受歡迎之後,也讓他們公開承認之前的策略錯誤,願意在開源模型下更多功夫。
除了 OpenAI,這次 WWDC 2025 活動中,Apple 也推出 Foundation Models 框架與 3B on-device 模型:
圖片來源:Apple