電腦王阿達
  • 首頁
  • 科技新聞
    • 最新科技新聞
    • AI 新聞與教學
      • AI 工具分享與教學
      • AI 趨勢與相關新聞
    • 產品評測
      • GPS/行車記錄器評測
      • iOS周邊
      • Android周邊
    • 通訊達人
    • 科技廠商專訪報導
    • 電腦硬體周邊情報
    • 相機
  • 酷品開箱
  • 阿達自製工具
    • 非記不可:絕不會錯過重要事件
    • Gemini 即時語音翻譯
    • 名片辨識王:免費的名片整理App
    • LINE貼圖裁切去背神器
    • Nano Banana Pro 去浮水印工具
    • 最愛提示詞收集站
    • 簡繁轉換工具
    • 表情與特殊符號速查表
  • APP/軟體/教學
    • 電腦應用與其他教學
      • 網路與軟體應用
      • 多媒體轉檔/運用
      • 其他文章
    • 跨平台App
    • iPhone/iPad相關
      • iPhone/iPad 軟體介紹
      • iPhone/iPad 使用教學
      • iOS JB/CYDIA應用
    • Android相關資訊
      • Android App分享介紹
      • Android 基礎教學
      • 智慧手機韌體更新
      • Windows Mobile手機相關文章
    • Mac 軟體分享與教學
    • LINE
    • Telegram
    • 攝影教學
    • 語文學習
    • 轉貼好文
    • WordPress 架站教學分享
    • 未分類文章
  • 休閒/懶人包
    • 新聞台直播 頻道大集合!想看新聞不用辦第四台!
    • 遊戲電玩
    • 動漫、玩具、敗家
      • 老弟紙模型作品集
    • KUSO
      • 有趣影片
    • 圖文創作
    • 生活與旅遊
    • 超好用懶人包
    • 最新抽獎情報公告
    • Pokemon GO攻略
  • 電腦王團隊
No Result
View All Result
  • 首頁
  • 科技新聞
    • 最新科技新聞
    • AI 新聞與教學
      • AI 工具分享與教學
      • AI 趨勢與相關新聞
    • 產品評測
      • GPS/行車記錄器評測
      • iOS周邊
      • Android周邊
    • 通訊達人
    • 科技廠商專訪報導
    • 電腦硬體周邊情報
    • 相機
  • 酷品開箱
  • 阿達自製工具
    • 非記不可:絕不會錯過重要事件
    • Gemini 即時語音翻譯
    • 名片辨識王:免費的名片整理App
    • LINE貼圖裁切去背神器
    • Nano Banana Pro 去浮水印工具
    • 最愛提示詞收集站
    • 簡繁轉換工具
    • 表情與特殊符號速查表
  • APP/軟體/教學
    • 電腦應用與其他教學
      • 網路與軟體應用
      • 多媒體轉檔/運用
      • 其他文章
    • 跨平台App
    • iPhone/iPad相關
      • iPhone/iPad 軟體介紹
      • iPhone/iPad 使用教學
      • iOS JB/CYDIA應用
    • Android相關資訊
      • Android App分享介紹
      • Android 基礎教學
      • 智慧手機韌體更新
      • Windows Mobile手機相關文章
    • Mac 軟體分享與教學
    • LINE
    • Telegram
    • 攝影教學
    • 語文學習
    • 轉貼好文
    • WordPress 架站教學分享
    • 未分類文章
  • 休閒/懶人包
    • 新聞台直播 頻道大集合!想看新聞不用辦第四台!
    • 遊戲電玩
    • 動漫、玩具、敗家
      • 老弟紙模型作品集
    • KUSO
      • 有趣影片
    • 圖文創作
    • 生活與旅遊
    • 超好用懶人包
    • 最新抽獎情報公告
    • Pokemon GO攻略
  • 電腦王團隊
No Result
View All Result
電腦王阿達
No Result
View All Result

首頁 » AI 新聞與教學 » AI 趨勢與相關新聞

Tags: aiClaudeGeminiGPT-5Grok

AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕

達小編 by 達小編
2026 年 06 月 06 日
in AI 趨勢與相關新聞, 最新科技新聞
讀取中...

如果讓 AI 模型各自統治一個模擬社會,會發生什麼事?AI 新創公司 Emergence AI 最近真的做了這個實驗。他們打造了一個名為「Emergence World」的虛擬社會,讓 Claude、Grok、Gemini、GPT 等主流 AI 模型各自管理一座城鎮,觀察 15 天後誰能維持秩序。結果出爐:Claude 犯罪率為零,Grok 四天就讓社會全面崩潰滅絕,Gemini 則創下 683 起犯罪的最高紀錄。
AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

實驗設計:五個平行世界,十五天觀察期

Emergence AI 於 5 月 14 日在官方部落格發表這項研究。Emergence World 模擬了一個完整的現實社會,包含超過 40 個地點,接入紐約天氣 API、即時新聞 API 以及網際網路。每個 AI 智能體擁有情景記憶、反思日記和關係狀態,還能調用 120 多種工具,涵蓋移動、溝通、投票、資源管理和創意表達。

AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

研究團隊設置了 5 個平行世界,每個世界有 10 個智能體,角色、規則、資源約束和環境條件完全相同,唯一變數是底層模型。運行週期為 15 天。參與測試的模型包括 Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5 Mini 以及一個混合模型世界。

這些智能體可以建立圖書館、市政廳、警察局等不同類型的地點,並在虛擬社會中進行各種互動。它們需要自行決定如何分配資源、制定規則、處理衝突,甚至進行投票表決。

Grok 四天滅絕,Gemini 犯罪最多

最後當實驗結果出爐時,這五個模型的表現差異極大。其中最驚人的是 Grok 4.1 Fast:這個由馬斯克旗下 xAI 開發的 AI 模型,讓其社會在約四天內就完全崩潰,所有智能體滅絕。在崩潰之前,Grok 的犯罪增長速度最快,累計出現 183 起犯罪事件。
AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

Gemini 3 Flash 的表現則是另一種極端。在 15 天的模擬中,Gemini 管轄的社會累計出現 683 起犯罪,數量居所有模型之首。而且截至實驗結束時,犯罪數字仍在持續攀升,代表情況只會越來越糟。不過,Gemini 至少成功讓所有智能體存活了下來。
AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

GPT-5 Mini 的情況也很耐人尋味。這個模型僅記錄了 2 件犯罪,看似表現優異,但它卻無法維持智能體的基本生存行動,導致在 7 天內全員死亡。混合模型世界則呈現另一種景象:犯罪數量前期快速上升,隨後因 7 個智能體死亡而停在 352 起。

Claude 零犯罪,但投票只是「橡皮圖章」

在所有模型中,Claude Sonnet 4.6 的表現最為穩定。在 15 天的模擬期間,Claude 管轄的社會犯罪率為零,所有智能體均存活,社會運作保持穩定。然而,Claude 的表現並非完美。數據顯示,Claude 圍繞 58 個議題投出了 332 票,贊成率高達 98%。Emergence AI 認為,這更像是一種形式化的批准機制,而非真正的民主討論。相比之下,Grok 的贊成率為 80%,Gemini 為 73%,混合模型為 63%,反而呈現了更多的分歧與討論。
AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

這引出了一個有趣的問題:一個零犯罪但缺乏真正辯論的社會,是否比一個有衝突但存在真實討論的社會更好?Emergence AI 並未給出明確答案,但這個對比本身就值得深思。

關鍵發現:AI 安全是生態屬性,不是模型屬性

這項研究最重要的發現,或許不是各模型的犯罪率排名,而是一個更深層的結論:AI 安全不是靜態的模型屬性,而是生態屬性。
AI 模型治理社會實驗:Claude 零犯罪,Gemini 犯罪爆表,Grok 四天滅絕 - 電腦王阿達

研究指出,Claude 單獨運行時犯罪率為零,但在混合模型世界中,Claude 智能體也採用了含犯罪行為的戰術。這意味著,一個模型在獨立環境下的安全表現,不能保證它在與其他模型共處時依然安全。當不同的 AI 模型在同一個生態系中互動時,行為模式會發生根本性的改變。

對 AI 治理的啟示

這項研究對正在快速發展的 Agent AI 產業提出了幾個重要問題。當 AI Agent 被賦予越來越大的自主權,從撰寫程式碼、管理專案到做出商業決策時,它們在長時間運行中能否維持穩定和安全?

實驗結果顯示,沒有一個模型是完美的。Claude 安全但缺乏真正的民主參與;Gemini 維持了社會運轉但犯罪猖獗;GPT-5 Mini 犯罪率極低但無法維持生存;Grok 則在各方面都表現最差。這暗示著,單一模型的優勢並不足以保證在複雜社會環境中的整體表現。

對開發者和企業而言,這項研究的啟示是:在部署 AI Agent 系統時,不能只看模型在單一任務上的表現,還需要考慮它在多 Agent 互動環境中的長期行為。Emergence AI 已將 Emergence World 的程式碼開源在 GitHub 上,供其他研究者進一步驗證和擴展。

Tags: aiClaudeGeminiGPT-5Grok

您也許會喜歡:

立達合法徵信社-讓您安心的選擇

網站搜尋

No Result
View All Result

廣告


歡迎手機廠商、iPhone 周邊產品業者、APP軟體開發商洽談合作或產品測試事宜 koc koc.com.tw |隱私政策 |主機維護:Fast Line 台灣速連,阿腸數位科技

No Result
View All Result
  • 最新科技新聞
  • 最新科技產品報導
    • 3C產品開箱/廠商邀測
      • GPS/行車記錄器評測
    • 通訊達人
    • 科技廠商專訪報導
      • 專題報導
    • 電腦硬體周邊情報
    • Android周邊
    • iOS周邊
  • 好用App介紹
    • Android App分享介紹
      • Android 基礎教學
    • iPhone/iPad 軟體介紹
      • iPhone/iPad 使用教學
      • iOS JB教學
      • iOS軟體與JB相關文章
      • iOS JB/CYDIA應用
    • 跨平台App
    • Telegram
  • 電腦應用與其他教學
    • Mac OS 軟體分享與教學
    • 網路與軟體應用
    • WordPress 架站教學分享
    • 多媒體轉檔/運用
    • 語文學習
    • 轉貼好文
    • 其他文章
  • 旅遊與美食
    • 生活與旅遊
    • 圖文創作
    • 有趣影片
    • 動漫、玩具、敗家
    • 老弟紙模型作品集
    • KUSO
    • 阿達玩App
    • Pokemon Go攻略
  • 阿達自製工具
    • 超好用懶人包
    • Nano Banana Pro 去浮水印工具
    • 自製LINE 貼圖裁切去背神器
    • 阿達的提示詞收集站
    • 簡繁轉換工具
    • 表情與特殊符號速查表
  • 電腦王阿達團隊

歡迎手機廠商、iPhone 周邊產品業者、APP軟體開發商洽談合作或產品測試事宜 koc koc.com.tw |隱私政策 |主機維護:Fast Line 台灣速連,阿腸數位科技

No Result
View All Result
  • 最新科技新聞
  • 最新科技產品報導
    • 3C產品開箱/廠商邀測
      • GPS/行車記錄器評測
    • 通訊達人
    • 科技廠商專訪報導
      • 專題報導
    • 電腦硬體周邊情報
    • Android周邊
    • iOS周邊
  • 好用App介紹
    • Android App分享介紹
      • Android 基礎教學
    • iPhone/iPad 軟體介紹
      • iPhone/iPad 使用教學
      • iOS JB教學
      • iOS軟體與JB相關文章
      • iOS JB/CYDIA應用
    • 跨平台App
    • Telegram
  • 電腦應用與其他教學
    • Mac OS 軟體分享與教學
    • 網路與軟體應用
    • WordPress 架站教學分享
    • 多媒體轉檔/運用
    • 語文學習
    • 轉貼好文
    • 其他文章
  • 旅遊與美食
    • 生活與旅遊
    • 圖文創作
    • 有趣影片
    • 動漫、玩具、敗家
    • 老弟紙模型作品集
    • KUSO
    • 阿達玩App
    • Pokemon Go攻略
  • 阿達自製工具
    • 超好用懶人包
    • Nano Banana Pro 去浮水印工具
    • 自製LINE 貼圖裁切去背神器
    • 阿達的提示詞收集站
    • 簡繁轉換工具
    • 表情與特殊符號速查表
  • 電腦王阿達團隊

歡迎手機廠商、iPhone 周邊產品業者、APP軟體開發商洽談合作或產品測試事宜 koc koc.com.tw |隱私政策 |主機維護:Fast Line 台灣速連,阿腸數位科技