记者保护消息源。律师保护客户通信。研究人员保护参与者身份。把采访音频发到云端转录服务,所有这些都面临风险。LocalRAG! v3.0 完全在你的 iPhone 或 Android 上转录采访 — 音频永远不离开设备。WhisperKit 转录,AI 清理,你可以用 AI Q&A 在数小时录音中搜索。全部在设备上,全部私密。
云转录服务 (Otter, Rev, Fireflies) 需要把音频上传到他们的服务器。对调查报道,如果消息源的声音进入第三方数据库,可能面临风险。对法律采访,律师-客户特权可能受影响。对 IRB 协议下的研究采访,上传违反参与者同意。即使供应商承诺强大的安全性,音频存在于第三方服务器上本身就是隐私风险。唯一真正的解决方案: 永远不上传。
LocalRAG! 使用 WhisperKit 完全在你的设备上转录采访音频 (MP3, M4A, WAV, AAC, FLAC)。LLM 清理通道去除填充词以产生干净、可读的转录 — 适合直接引用。转录在本地索引;你可以让 AI 查找特定主题的引用、总结受访者说的内容、或比较多个采访之间的陈述。什么都不上传。
使用任何语音录制应用。iOS 内置语音备忘录直接导出 M4A。将文件导入 LocalRAG!。
WhisperKit 在本地运行。音频文件留在应用沙箱中 — 操作系统级隔离。转录步骤无网络调用。
「消息源关于截止日期说了什么?」 — LocalRAG! 返回带时间戳的清理后转录摘录。可逐字复制以供引用。
调查报道第一原则: 保护消息源。音频永远不离开你的设备。云端泄露、传票或内部威胁都无法暴露你的录音。
律师-客户采访保持特权。无第三方处理意味着无第三方可发现性 — 对敏感法律工作有意义的姿态。
对 IRB 协议下的人体研究,设备端转录通常满足更严格的同意书(「数据不会与第三方共享」)。
Whisper 原始输出有填充词;LocalRAG 的 LLM 清理通道产生像编辑后讲话的转录。直接引用,附带时间戳引用。
AI 扫描转录寻找确认时刻并返回精确的引用和时间戳。
搜索 3 月 14 日的引用并逐字返回相关陈述。
返回带具体交流引用的清理后摘要。
将两者放在一个集合中,AI 交叉引用并并列呈现差异。
当消息源保密性和特权很重要时,设备端是唯一可接受的答案。LocalRAG! v3.0 将 WhisperKit 质量的转录和 AI Q&A 带给要求绝对隐私的工作流程。你的消息源、客户和研究参与者应该得到这种保护。
WhisperKit base 模型对清晰英语语音准确率约 85%,中文约 80%。使用更大模型的云服务可达 90-95%,但你用隐私换取了那几个百分点。v3.1 将引入可选的 Whisper small/medium 下载,供需要更高设备端准确性的用户使用。
LocalRAG! 的 LLM 清理通道有意打磨文本 — 它去除填充词并重构不完整句子。对要求逐字记录的法律程序,你应该禁用清理(v3.0 中的设置选项)或使用保留不流畅的原始 Whisper 输出。
目前 LocalRAG! 将所有发言者作为一个流转录。说话人分离(「发言者 1、发言者 2」)在 v4.0 路线图上 — 我们正在评估不需要云处理的设备端说话人分离模型。
免费试用 LocalRAG!
免费版每天5个问题。无需账号。