近日,Google 低調在 iOS 平台推出一款全新的語音輸入應用程式「Google AI Edge Eloquent」。這款工具主打「離線優先」的語音辨識能力,定位上明顯瞄準近年快速竄起的 Wispr Flow、SuperWhisper、Willow 等同類型應用,意圖在競爭激烈的語音轉文字市場中搶下一席之地。

可離線使用 AI 語音辨識應用「Google AI Edge Eloquent」悄悄在 iOS 上推出
Eloquent 可免費下載,安裝後,使用者只需額外下載基於 Gemma 的自動語音辨識(ASR)模型,即可在手機本地端直接進行語音輸入。應用程式會在你說話的同時即時顯示轉錄內容,而當你停止說話後,系統會自動清理語句,移除「嗯」、「啊」等語氣詞,並修正語句中常見的自我更正,使輸出的文字更接近自然、完整的書面語。
在轉錄結果下方,Eloquent 提供多種文字風格選項,包括「要點」、「正式」、「簡短」與「完整」等模式,讓使用者能依需求快速調整語氣與篇幅。這對需要整理會議紀錄、撰寫郵件草稿或快速生成摘要的使用者來說相當實用。
值得注意的是,Eloquent 支援完全離線運作。若使用者選擇關閉雲端模式,所有語音處理都會在本地端完成,不會將語音資料上傳至伺服器。若開啟雲端模式,則會啟用 Gemini 模型進行更進階的文字清理與語意調整,提供更高品質的輸出。Google 也允許使用者從 Gmail 帳戶匯入常用關鍵字、專有名詞與聯絡人名稱,並可手動新增自訂詞彙,提升辨識準確度。
Eloquent 也內建完整的轉錄歷史記錄功能,使用者可以瀏覽過往所有會話,並透過搜尋快速找到特定內容。應用程式還會顯示每次會話的字數統計、每分鐘輸入速度(WPM)以及累計字數,對於需要追蹤工作效率或語音輸入習慣的人來說相當方便。
Google 在 App Store 的描述中強調,Eloquent 的目標並非只是逐字轉錄,而是「彌合自然語音與可直接使用的專業文本之間的差距」。官方表示,傳統語音辨識工具往往會忠實記錄口語中的停頓、口吃與語氣詞,而 Eloquent 則透過 AI 模型理解語意、修飾語句,讓輸出的文字更接近使用者真正想表達的內容。
目前 Eloquent 僅在 iOS 平台上架,但 App Store 描述中已明確提到 Android 版本正在準備中。Google 表示,Android 版將支援「無縫整合」,使用者可將 Eloquent 設為預設鍵盤,在任何文字輸入欄位中直接啟用語音轉文字。此外,Android 版也會加入類似 Wispr Flow 的懸浮按鈕功能,讓使用者能在任何畫面快速啟動轉錄。
隨著語音轉文字模型的品質大幅提升,語音輸入工具逐漸成為許多人的日常工作流程之一。從會議記錄、訪談整理,到快速撰寫訊息或筆記,AI 驅動的語音轉錄應用正快速普及。Google 此次推出 Eloquent,顯然是希望在這股潮流中建立自己的產品定位。若這款實驗性應用在 iOS 上獲得良好反饋,不排除 Google 未來會將其整合進 Android 系統層級,讓語音輸入成為更自然、更普及的操作方式。



