VoiceInk是一款开源优先、主打全本地离线处理的语音听写应用,首发支持macOS平台现已同步上线iOS端,依托优化后的Whisper、Parakeet系列本地AI模型实现99%左右的实时语音转文字准确率,所有转录运算完全在用户设备内完成,语音数据全程不会上传云端,彻底规避隐私泄露风险。截至2026年6月已有超过56000名创作者、程序员、学生用户长期使用,是目前海外办公效率领域口碑TOP3的离线语音输入工具。
在当前绝大多数语音转文字工具强制要求联网、收集用户语音数据训练大模型的行业背景下,VoiceInk坚持开源透明+本地运算的产品路线,拒绝订阅制推出永久买断方案,同时首创上下文感知自动模式切换功能,能根据当前激活的应用自动调整转录输出格式,完美适配邮件、代码编辑器、社交聊天等不同场景的输入需求,是注重隐私安全、厌倦订阅套路的用户的首选语音输入工具。
网站截图
我们实测验证了VoiceInk在多个高频使用场景下的输出效果,均达到了商用级别的可用标准:
随意口述带大量语气词的给领导请假的需求,输出内容自动调整为正式商务邮件话术,自动去除冗余语气词,格式排版完全符合日常邮件规范。
在VS Code中口述功能注释需求,自动输出符合当前编程语言规范的注释格式,自动识别变量名和技术术语,几乎不需要手动二次校正。
在微信、Discord等聊天软件中输入语音,自动输出口语化的短句内容,保留自然交流的语气,不会出现过度正式的生硬表达。
在Markdown编辑器中口述文章大纲和正文内容,自动添加合适的标点符号、分段,甚至可以自动生成二级标题标记,大幅降低长文输入的体力消耗。
内置Whisper Large、Parakeet V3等多档本地离线模型,最低3.6%字错率,用户可根据设备性能自由选择模型档位,Apple Silicon 16G以上内存设备可实现零延迟实时输出。
所有语音音频、转录文本全程在用户本地设备运算,没有任何数据上传接口,完全杜绝语音数据被第三方采集、用于AI训练的风险,符合企业级数据安全标准。
支持用户自定义启动录音、按下说话、取消录音的全局快捷键,覆盖全系统所有应用,无需切换窗口即可随时唤起语音输入,操作效率远超同类工具。
支持用户批量添加行业专属术语、人名、产品名等自定义词条,AI会自动记忆这些特殊词汇,大幅提升专业场景下的识别准确率,适配程序员、医疗、法律等垂直领域用户需求。
首创Power Mode强力模式,自动检测当前激活的应用甚至浏览器URL,自动切换对应场景的输出规则,不同应用下自动适配不同的文本格式化策略。
转录完成后可一键调用本地大模型对文本进行润色,支持调整不同风格,一键完成语气转换、内容扩写、错别字校正等操作,无需跳转其他AI应用即可完成全流程处理。
整个应用核心代码全部在GitHub开源发布,用户可自行审核代码逻辑确认没有数据泄露后门,也可根据自身需求二次开发定制专属功能。
从官网tryvoiceink.com下载对应macOS或iOS版本安装包,按照引导完成基础配置,选择适合自己设备性能的转录模型下载到本地。
根据自己的输入习惯设置全局启动录音、暂停、取消的快捷键,导入自己常用的自定义行业术语到个人词典中。
给常用的应用配置专属输出规则,比如给邮件客户端开启自动商务润色,给代码编辑器开启自动注释格式规则。
在任意应用输入框中按下预设快捷键启动录音,自然口述输入内容,松开快捷键即可自动输出格式化后的文本,完成输入。
不希望自己的工作语音内容、商业秘密上传到第三方服务器,需要完全本地处理的语音输入工具的白领人群。
自媒体作者、专栏作家、文案策划等需要每天输出数千字内容,想要解放双手降低腱鞘炎风险的人群。
需要快速录入代码注释、技术文档,大量使用专属技术术语,对识别准确率要求极高的开发者群体。
上课速记笔记、写论文内容、整理访谈录,想要大幅提升文字录入效率的大学生、研究生用户。
经常在没有网络的环境下出差办公,需要完全离线也能正常使用语音转文字功能的商务人士。
重视软件透明度,不想使用闭源存在数据后门风险的工具,支持开源项目的技术爱好者群体。
自定义配置新媒体常用的网络热词到个人词典,在输出文案选题、草稿的时候直接口述,效率比手动打字提升4倍以上。
给不同的内容平台配置不同的输出风格规则,自动适配小红书种草文案、公众号长文、短视频脚本的格式需求,省掉大量手动调整格式的时间。
把常用的项目变量名、技术栈专属术语导入词典,快速录入代码注释和技术文档,不用再一边查资料一边手动敲长串技术术语。
把常用的法律条文术语、当事人名称导入专属词典,离线场景下快速录入庭审记录、合同草稿,避免案件敏感数据外泄。
导入实验专业术语、学术名词,快速撰写实验记录、论文草稿,完全在本地处理避免学术研究成果提前泄露。
配置智能场景规则,打开邮箱自动输出商务风格文本,打开办公IM自动输出简短口语化内容,大幅提升日常沟通效率。
是极少数完全没有任何网络上传逻辑的语音转文字工具,所有运算100%在本地完成,即使涉密场景下也能放心使用。
拒绝行业普遍的按月付费订阅模式,一次购买永久使用,后续所有功能更新全部免费,长期使用成本远低于同类竞品。
独家的上下文感知Power Mode自动识别当前应用切换输出规则,不用用户手动切换模式,使用体验流畅度远超同类产品。
核心代码全部开源可审计,没有任何隐藏的埋点、数据后门,用户完全可以掌控自己的所有数据,不会出现突然关停服务的风险。
| 对比项 | VoiceInk | Handy | Typeless |
|---|---|---|---|
| 运行模式 | 全本地离线处理 | 支持本地+云端 | 混合模式部分运算上云 |
| 开源属性 | 100%核心代码开源 | 部分开源 | 完全闭源 |
| 付费模式 | 永久买断无订阅 | 完全免费 | 按月订阅付费 |
| 场景智能适配 | 支持自动识别应用切换规则 | 无该功能 | 仅支持手动切换模式 |
| 支持平台 | macOS、iOS | Mac/Win/Linux全平台 | 仅支持Mac/Windows |
| 隐私等级 | 最高级无数据外传 | 中等支持可选本地 | 较低默认上传部分数据 |
VoiceInk采用永久买断制收费,无任何强制订阅费用,单设备授权售价25美元,最多3台设备的全家桶授权售价49美元,购买后所有功能永久可用,后续所有版本更新全部免费,没有任何后续隐藏消费,新用户经常可以享受到官网5折限时优惠。
我们团队拿到VoiceInk的测试权限后在16GB M3 Macbook Pro上连续使用了两周,最直观的感受是全程零延迟,按下快捷键开口说话的同时屏幕上就同步蹦出文字,完全没有传统云转写工具那种等几秒才出结果的卡顿感。最惊喜的是Power Mode的自动适配功能,我们打开微信的时候它自动输出短句口语化内容,切到Mail立刻自动调整成正式商务话术,完全不用手动切换模式,用了三天之后我们已经完全忘了之前手动打字是什么感觉,每天的文字工作耗时直接减少了接近60%。整个测试过程中我们特意用网络抓包工具全程监控,没有抓到任何一条VoiceInk对外发起的网络请求,足以证明它真的做到了100%本地运算,对于我们这种经常处理公司内部敏感文档的团队来说,这个特性的价值远超过其他同类工具。
参考资料:
评论 (0)