先前我們曾介紹過一款 Wispr Flow 的 AI 語音輸入文字工具,可說相當受好評,很多人用過之後都非常喜歡,不過免費版每月有文字額度,沒有很多,非常容易滿,如果想要無限制,就必須付費訂閱,長期下來也是不小的負擔。而這篇就要介紹一款很不錯的替代方案:「Handy」,完全免費且開源,支援 OpenAI 的 Whisper 與 Parakeet 模型,我測試轉換速度超級快,而且說的內容也會自動儲存成錄音檔,這對記錄一些東西來說非常實用,Windows、Mac 都能裝。

Handy 本地 AI 語音輸入文字免費開源工具,速度超快,支援 Whisper、Parakeet 模型(Win/Mac)
Handy 是一款免費、開源、完全離線運作的語音輸入文字工具,主打「隱私優先」與「高度可擴充」。採用 Tauri(Rust + React) 架構開發,可在效能與資源占用之間,取得良好平衡。使用方式跟其他競品一樣,按住快捷鍵來說話,放開後就會自動將語音轉成文字,並貼到你目前正在使用的應用程式中,無論是瀏覽器、文件編輯器或聊天視窗都支援。
所有錄音與辨識都在本機完成,因此你不用擔心語音資料外流的風險,對於注重隱私的用戶來說,這點相當加分。支援多種語音模型,包括 GPU 加速的 Whisper 系列,以及使用 CPU 的 Parakeet 模型,能根據你的硬體效能自由選擇。唯一要注意是,中文部分我測試,現階段似乎不支援自動加入標點符號(即便講話過程的中間有中斷也不會),代表說轉成文字後,你需要手動加入,或是透過其他 AI 輔助工具。
主要特色
- 完全離線運作:不需網路、不上傳語音,隱私安全
- 開源免費(MIT 授權):可自行修改、擴充或二次開發
- 跨平台支援:macOS、Windows、Linux 皆可使用
- 快捷鍵即時輸入:說完就會立即將文字貼到目前使用中的 App
- 多模型選擇:支援 Whisper 與 Parakeet 模型
- GPU / CPU 加速:在 Apple Silicon 或顯卡環境下效能更佳
- 語音活動偵測(VAD):自動過濾靜音,提高轉錄準確度
按上方連結進到 Handy GitHub 的下載頁面後,目前最新版是 0.6.9,選擇適合你電腦的安裝版。像我的是 Apple Silicon Mac,因此我就下載 aarch64.dmg 這個安裝檔:
安裝後打開,會需要賦予某些權限。首先是輔助使用功能,按打開「系統設定」:
把 Handy 右邊的開關打開:
還有允許麥克風:
接著就會打開模型頁面,選擇你要使用的,個人推薦 Whisper Turbo 或 Whisper Large:
選好後就會開始下載模型,左下角有進度條。接著會進到設定選單,你可以調整自己習慣的設置,像是預設啟用轉錄的快捷鍵是 option + space,不習慣就改成其他:
如果你轉錄時,常常語言都判斷錯誤,可以將語言指定成繁體中文,而不是自動偵測:
高級選單還有一些不錯設置,如:開機啟動、黏貼方式、翻譯為英語、自定義詞彙等等:
按住快捷鍵講話,講完放開,不到一秒文字就會輸入。但就如同前面曾提到,似乎不支援自動加入標點符號:
你可以自己手動加入,或是叫 AI 幫忙加。猜測未來版本應該會改善這點:
曾經轉錄過的文字錄音檔,都能在歷史記錄中找到:









