你有沒有遇過這種情況?某個流程(產品上架、客服處理…)想交由 AI 代勞,但對人類來說幾個反覆機械化的操作想讓 AI 自己跑通流程卻異常困難。OpenAI 想解決這個問題。2026 年 6 月 18 日,OpenAI 在 Codex 應用程式中正式推出「Record and Replay」功能,讓使用者直接在 Mac 上「做一次」給 AI 看,Codex 會自動將整個流程打包成可重複使用的 Skill(技能)。這不是傳統的巨集錄製或 RPA 腳本。Record and Replay 背後是 Computer Use 模型在觀察你的操作,理解每個步驟的意圖,然後生成一份結構化的、可編輯的技能文件。用 OpenAI 的話說:「Show Codex a workflow once. Reuse it as a skill.」
什麼是 Record and Replay
OpenAI 官方直接點出此功能的核心價值:
「You can now show Codex how to do something, teach it your preferences, and turn what it learns into a skill you can use again.」(你現在可以示範給 Codex 看要怎麼做某件事、教它你的偏好,並把它學到的內容轉換成一項可以重複使用的技能。)
這句話精準描述了 Record and Replay 的定位:不是要你寫 prompt 教 AI 做事,而是直接「示範」一次,AI 自己學。
實際操作範例:YouTube 影片上傳流程
影片中展示的是一個真實場景:OpenAI 團隊每次發布 YouTube 影片時,都要從發行試算表拉 metadata、找到對應的素材檔、在 YouTube Studio 填寫相同的欄位與設定。這些步驟每次都一樣,但手動操作繁瑣且容易出錯。
操作流程如下:
- 啟動錄製:在 Codex 應用中開啟 Plugins,選擇「Record a skill」
- 開始示範:Codex 請求錄製權限後,使用者正常執行 YouTube 上傳流程
- 拉取 metadata:從發行試算表中取出標題和描述
- 上傳素材:加入縮圖和英文字幕
- 儲存設定:將影片設為非公開並儲存
- 停止錄製:從選單列或覆蓋層停止,或直接告訴 Codex「我做完了」
錄製過程中,Codex 觀察的是操作的「意圖」而非純粹的像素軌跡。它理解你從試算表拉的是「標題」而不是「某個格子的文字」,這讓生成的技能具有泛化能力。
錄製結束後,Codex 分析錄影內容並自動生成一份 Skill。影片中展示 Codex 依照使用者的操作流程學會了:
- metadata 存放在哪裡(發行試算表的位置)
- 上傳素材包的資料夾結構
- 如何加字幕、儲存、驗證每次上傳
這份 Skill 不是黑箱,根據 OpenAI 開發者文件,生成的 Skill 遵循標準的 SKILL.md 格式,包含使用時機、所需輸入、執行步驟和驗證方式。使用者可以直接檢視和編輯。
AI 自動化執行
影片後半段展示「Replay」的實際效果。使用者開啟一個全新的對話串,附上下一部影片的素材包,然後要求 Codex 處理。結果:
- Codex 自動將素材包對應到試算表中的正確列
- 填入 metadata
- 上傳縮圖和英文字幕
- 將影片設為非公開
- 驗證所有設定是否正確儲存
全程不需要使用者手動介入。使用者只需要提供「這一次不同的值」,比如新的影片檔案、新的標題,其餘全部由 Codex 依 Skill 自動完成。
技術架構:Agent Skills 開放標準
Record and Replay 的底層是 OpenAI 採用的 Agent Skills 開放標準(agentskills.io)。一個 Skill 就是一個資料夾,裡面包含:
- SKILL.md:必備,包含名稱、描述和指令
- scripts/:可選,可執行腳本
- references/:可選,參考文件
- assets/:可選,模板和資源
Codex 使用「漸進式披露」(progressive disclosure)管理上下文:一開始只載入每個 Skill 的名稱、描述和檔案路徑(最多佔模型上下文視窗的 2%),只有在決定使用某個 Skill 時才載入完整的 SKILL.md 指令。這確保了即使安裝了大量 Skill,也不會擠爆上下文。
觸發方式有兩種:明確調用(在 prompt 中直接指定 Skill)和隱式調用(Codex 根據任務自動匹配 Skill 的 description)。Record and Replay 產生的 Skill 走的就是隱式調用路線,Codex 會根據你提供的素材自動判斷該用哪個 Skill。
可用範圍與限制
目前 Record and Replay 有幾個限制:
- 僅限 macOS:Windows 和 Linux 暫不支援
- 地區排除:歐洲經濟區(EEA)、英國和瑞士暫時無法使用
- 需要啟用 Computer Use:若組織透過 requirements.toml 管理 Codex,將 computer_use 設為 false 會同時關閉 Record and Replay
- 需要 Codex 應用程式:CLI 和 IDE 擴充套件目前不支援此功能
執行 Skill 時,Codex 可以透過 Computer Use(桌面操作)、Browser Use(瀏覽器操作)、已連接的外掛程式,或三者組合來完成任務。
與其他方案的比較
在自動化工作流程的領域,Record and Replay 並不是唯一的解法,但它的切入角度與眾不同:
- 傳統 RPA(如 UiPath、Automation Anywhere):依賴固定的 UI 元素選擇器,介面一改就壞。Record and Replay 用 AI 理解操作意圖,對 UI 變化的容忍度更高
- 手寫 Prompt / Skill:需要使用者具備撰寫精確指令的能力。Record and Replay 把門檻降到「你會做就行」
- Zapier / Make 等整合平台:擅長 API 之間的串接,但對需要操作桌面應用的流程無能為力。Record and Replay 剛好補上這個缺口
Record and Replay 的核心價值在於「讓不懂程式碼的人也能教 AI 做事」。過去你要自動化一個流程,得先把它拆解成機器看得懂的步驟;現在你只要自己做一遍,Codex 會幫你完成拆解和封裝。
對開發者和企業的意義
Record and Replay 生成的 Skill 可以在團隊間共享。也就是說,一個人錄製的流程可以變成整個部門的自動化資產。不會再有負責的人不在現場就沒人會使用操作特定功能的窘境。這對企業端的影響有幾個面向:
- 知識保留:員工離職時,流程知識不會跟著離開,因為它已經被封裝成 Skill(編按:有點可怕…)
- 一致性:團隊所有人執行同一個流程時,品質和步驟一致
- 擴展性:新進人員不需要重新學習每個內部工具的操作細節
總而言之 Record and Replay 改變了「教 AI 做事」的介面。過去是文字(prompt),現在是行為(demonstration)。這讓 AI Agent 的能力擴展不再受限於使用者的文字表達能力。
Codex 的產品策略
從 Codex 的發展軌跡可以看出 OpenAI 的策略:先建立 Plugin 生態系(2026 年 3 月已支援超過 20 個第三方外掛,包含 Slack、Gmail、Notion、Salesforce),再推出角色專屬的 Plugin 套件(針對銷售、分析等職能),現在再加上 Record and Replay 讓使用者自己產生 Skill。
這是一條從「平台提供工具」到「使用者創造工具」的路徑。OpenAI 不只是在賣 AI 模型,而是在建一個讓 AI 學會人類工作流程的基礎設施。
結語
Record and Replay 目前還在初期階段,限制不少(macOS only、排除歐洲),但它代表的方向很清楚:AI Agent 的能力擴展不該依賴使用者會寫 prompt,而該依賴使用者會做事。當「示範」取代「描述」成為教 AI 的主要方式,自動化的門檻會大幅降低。
對一般使用者來說,這意味著你不需要成為 prompt engineer 也能讓 AI 幫你處理重複性工作。對企業來說,這意味著組織內部的流程知識可以被標準化、封裝、傳承。這才是 AI Agent 真正該做的事:不是替代人類思考,而是替代人類重複。



