AI语音转写应用在短时间内取得了巨大进步。过去,这类应用速度慢且准确率低,除非你说话带有特定口音且发音清晰。随着大型语言模型(LLMs)和语音转文本模型的发展,现有系统能够更准确地识别语音,并保留足够的上下文来正确格式化文本。开发者还加入了自动去除填充词、修正口误和处理标点符号的功能,使输出文本大幅减少了后期编辑的需求。
目前市场上有数十款此类应用,以下是我们精选的几款最佳且最实用的语音转写应用。
Wispr Flow
Wispr Flow是一款资金充足的AI语音转写应用,支持添加自定义词汇和转写指令。它拥有macOS、Windows和iOS的原生应用,Android版本正在开发中。
该应用允许用户根据不同写作需求选择“正式”、“随意”或“非常随意”的转写风格,适用于个人消息、工作和邮件等场景。配合Cursor等vibe-coding工具使用时,还能自动识别变量或在聊天中标记文件。
桌面版每周可免费转写2000字,iOS版每月免费转写1000字。付费订阅起价为每月15美元,提供无限转写。

Willow
Willow主打节省打字时间。除了自动编辑和格式化等常见功能外,它利用大型语言模型,仅凭几句口述即可生成完整段落。
Willow注重隐私,所有转录内容均存储在本地设备,用户可选择完全退出模型训练。它还支持添加自定义词汇,适应行业术语或地方方言。
桌面版每月免费转写2000字,付费订阅起价15美元/月,解锁无限转写并能记忆用户写作风格。

Monologue
如果隐私是首要考虑,Monologue允许用户将AI模型直接下载到设备上,完全避免云端存储。它还能根据所用应用调整语气风格。
免费版每月可转写1000字,订阅费用为每月10美元或每年100美元。活跃用户还可获得实体快捷键设备Monokey。
Superwhisper
Superwhisper主要是语音转写应用,也支持从音频或视频文件转录。用户可选择并下载不同速度和准确度的AI模型,包括自家模型和Nvidia的Parakeet语音识别模型。
支持自定义提示词引导输出,且可直接从系统键盘查看处理前后文本。
基础语音转文本功能免费,提供15分钟试用Pro功能(如翻译和转录)。付费版支持使用自有AI API密钥,连接云端和本地模型,无使用限制。
月费8.49美元,年费84.99美元,终身订阅249.99美元。

VoiceTypr
VoiceTypr采用离线优先、无订阅模式,支持本地模型转写。它在GitHub上开源,方便用户自行托管和运行。支持99种以上语言,兼容Mac和Windows。
提供三天免费试用,之后可购买终身授权。单设备35美元,两设备56美元,四设备98美元。
Aqua
Aqua是由Y Combinator支持的语音输入应用,适用于Windows和macOS,号称延迟极低,语音与文本显示几乎同步。
除了语法和标点处理外,Aqua还能通过语音自动填充文本,如说“我的地址”即可自动输入地址。
还提供自己的语音转文本API,供其他应用接入。
免费版每月转写1000字,付费计划起价8美元/月(年付),解锁无限字数和800个自定义词典条目。
Handy
Handy是一款开源免费转录工具,支持Mac、Windows和Linux。功能简单,定制选项有限,但适合想免费尝试语音输入的用户。
提供基础设置菜单,可切换按键说话和更改启动转录的快捷键。
Typeless
Typeless以高免费字数著称,免费版每周可转写4000字(约每月16000字)。公司承诺不保留数据,也不用于训练AI模型。还支持重写用户可能表达不清的句子。
付费版12美元/月(年付),解锁无限字数和新功能。仅支持Windows和macOS。
VoiceInk
VoiceInk是一款开源私密语音转写应用,适用于Mac。支持全局快捷键控制录音和按键说话模式,能根据屏幕上下文调整输出。
自动识别特定应用和网址,应用自定义格式和规则。内置助手模式可回答用户问题。
售价25美元(单设备终身),39美元(两设备),49美元(三设备)。
Dictato
Dictato是一款Mac词典应用,售价约12美元,包含终身使用权和两年功能更新。支持离线模型如Parakeet、Whisper和Apple Speech Analyzer,利用Apple智能技术进行轻度阅读和填充词去除。延迟仅80毫秒,语音几乎实时转为文本。
AudioPen
AudioPen起初是基于网页的语音笔记应用,现已发展为Mac版本,支持语音转写并可随时切换文本格式和风格。除了实时转录,还支持跨平台存储音频笔记、合并笔记生成摘要、上传音频文件及利用AI重写现有笔记。
价格为33美元(三个月)、99美元(一年)、159美元(两年)。


