就在前幾天,日本樂天集團(Rakuten)高調對外發表了號稱「日本國產最大規模的高性能 AI 模型」:Rakuten AI 3.0。這款模型擁有約 7,000 億參數,採用混合專家(MoE)架構,以 Apache 2.0 授權開源釋出,在樂天官方新聞稿中被形容為日本 AI 產業的里程碑。然而,這個「日本國產」的里程碑,僅不到一天時間,就被網友從自家開源庫中的其中一行設定碼抓包根本就是使用中國 DeepSeek V3 換皮。

「日本最強」發表不到一天,底層程式碼全被看光
樂天 AI 3.0 的模型權重,在發表當天同步上傳至開源平台 Hugging Face 的官方頁面。開發者發現,設定檔中白紙黑字寫著:"model_type": "deepseek_v3",以及 "architectures": ["DeepseekV3ForCausalLM"]。隱藏層維度(hidden_size)7168、神經網路層數(num_hidden_layers)61 等所有參數,與 DeepSeek V3 原版設定百分之百吻合。也就是說,樂天號稱的「約 7,000 億參數」,只不過是把 DeepSeek V3 的原始參數 6,710 億,四捨五入後包裝出來的數字。
刪除 MIT 授權、補上 NOTICE 檔:「洗授權」爭議炸鍋
DeepSeek V3 採用 MIT 開源授權,允許免費商用、修改,唯一的要求是保留原作者的版權聲明。然而,樂天在最初上傳 Rakuten AI 3.0 至 Hugging Face 時,直接刪除了 DeepSeek 的 MIT 授權文件,並以自己的 Apache 2.0 授權取而代之,重新包裝成「免費開源」發布。此舉被開源社群批評為「洗授權」(License Laundering)。
樂天打的算盤很清楚:抹掉 DeepSeek 的名字,套上自己的 Apache 2.0 授權,再把自己包裝成「慷慨開源 7,000 億參數大模型」的日本 AI 。輿論發酵後,樂天才緊急在開源庫中補上一個命名為 NOTICE 的檔案,承認 DeepSeek 版權歸屬。此舉被評為「補救遲來、態度不誠懇」。
拿了日本納稅人的錢,卻對 DeepSeek 隻字不提
樂天 AI 3.0 是日本經濟產業省(METI)與新能源產業技術綜合開發機構(NEDO)聯合推動的 GENIAC 計畫(Generative AI Accelerator Challenge)成果,樂天於 2025 年 7 月入選,獲得 GENIAC 提供的部分訓練算力補助。然而,樂天在新聞稿中僅以「充分利用開源社群最優秀的模型」(leveraging the best from the open source community)一語帶過,完全沒有點名 DeepSeek。
日本 AI 研究者うみゆき(umiyuki)在 X 平台上直接吐槽:「上次(指樂天發布 RakutenAI-7B 時)還老老实实交代了『基於 Mistral-7B 開發』,這次怎麼就突然寫得含糊其辭了?」日本網友更愤怒地指出:「拿了日本政府的補助,卻拿中國的 DeepSeek 來微調,這在情感上令人無法接受。」
基準測試贏了,但對手只有 1,200 億參數的模型
樂天官方公布 Rakuten AI 3.0 在多項日語基準測試中「超越 GPT-4o」。然而,細看比較的對象就會發現,樂天拿來比較的兩款模型,分別是 GPT-OSS-Swallow-120B-RL-v0.1(1,200 億參數)與 ABEJA-QwQ32b-Reasoning-Japanese-v1.0(320 億參數)。用一款 6,710 億參數的模型,去對比 1,200 億與 320 億參數的模型,在規模上占盡優勢:但卻完全沒有與同等量級的模型直接過招。
DeepSeek V3:震撼全球的「AI 黑船」
DeepSeek V3 於 2024 年 12 月發布,以僅約 500 至 600 萬美元(約 NT$ 1.95 億至 2.34 億元)的訓練成本,卻在多項基準測試中打平甚至超越頂尖閉源模型,在 AI 圈引發了所謂的「DeepSeek 衝擊」。
2025 年 1 月底,DeepSeek 的 iPhone 應用在美國免費應用排行榜上一舉超越 ChatGPT 登頂第一,隨即引爆美國科技股拋售潮。AI 晶片巨頭輝達(NVIDIA)股價單日暴跌 17%,單日市值蒸發約 6,000 億美元(約 NT$ 19.5 兆,相當於兩個豐田汽車的市值)。
日本政府向各省廳發出內部通告,要求在使用 DeepSeek 等生成式 AI 時必須充分認識風險。個人信息保護委員會特別指出,DeepSeek 獲取的個人資料被保存在中國境內伺服器。豐田汽車、三菱重工業、軟銀等大型日企隨即全面禁止員工在內部使用 DeepSeek。台灣政府亦以國安為由,全面禁止政府機關使用 DeepSeek。
諷刺的是,就在此時,日本最大規模的模型之一,拿的就是這個「碰都不能碰」的 DeepSeek V3,換了個名字,包裝成「日系國產最強 AI」向日本社會交差。
自家官網都不用自家模型?誠信問題蔓延
更讓人尷尬的是目前日本網友也發現樂天 AI 官網背後實際運行的很可能不是自家發布的 Rakuten AI 3.0,而是 Claude 或 GPT 系列模型,因為 DeepSeek V3 本身並不支援圖像輸入(非多模態),而樂天 AI 官網卻有這個功能。自己號稱發布的「最強 AI」,自己的官網都不用。
截至目前,樂天集團尚未對外作出任何公開說明或回應。





