·4 分钟阅读

私密采访转录: 消息源保密、设备端 AI

记者保护消息源。律师保护客户通信。研究人员保护参与者身份。把采访音频发到云端转录服务,所有这些都面临风险。LocalRAG! v3.0 完全在你的 iPhone 或 Android 上转录采访 — 音频永远不离开设备。WhisperKit 转录,AI 清理,你可以用 AI Q&A 在数小时录音中搜索。全部在设备上,全部私密。

REC Source Protected Interview Transcript A: "I can confirm the documents existed." [3:42] B: "When was the meeting?" [4:15] "On March 14, the source confirmed the document" Citable

问题

云转录服务 (Otter, Rev, Fireflies) 需要把音频上传到他们的服务器。对调查报道,如果消息源的声音进入第三方数据库,可能面临风险。对法律采访,律师-客户特权可能受影响。对 IRB 协议下的研究采访,上传违反参与者同意。即使供应商承诺强大的安全性,音频存在于第三方服务器上本身就是隐私风险。唯一真正的解决方案: 永远不上传。

LocalRAG!解决方案

LocalRAG! 使用 WhisperKit 完全在你的设备上转录采访音频 (MP3, M4A, WAV, AAC, FLAC)。LLM 清理通道去除填充词以产生干净、可读的转录 — 适合直接引用。转录在本地索引;你可以让 AI 查找特定主题的引用、总结受访者说的内容、或比较多个采访之间的陈述。什么都不上传。

1🎤

录制采访

使用任何语音录制应用。iOS 内置语音备忘录直接导出 M4A。将文件导入 LocalRAG!。

2🔒

设备端转录

WhisperKit 在本地运行。音频文件留在应用沙箱中 — 操作系统级隔离。转录步骤无网络调用。

3🔍

搜索和引用

「消息源关于截止日期说了什么?」 — LocalRAG! 返回带时间戳的清理后转录摘录。可逐字复制以供引用。

好处

📰

消息源保护

调查报道第一原则: 保护消息源。音频永远不离开你的设备。云端泄露、传票或内部威胁都无法暴露你的录音。

⚖️

特权通信

律师-客户采访保持特权。无第三方处理意味着无第三方可发现性 — 对敏感法律工作有意义的姿态。

🔋

符合 IRB 的研究

对 IRB 协议下的人体研究,设备端转录通常满足更严格的同意书(「数据不会与第三方共享」)。

📝

干净、可引用的转录

Whisper 原始输出有填充词;LocalRAG 的 LLM 清理通道产生像编辑后讲话的转录。直接引用,附带时间戳引用。

你可以问的示例问题

「找到消息源确认文件存在的时刻」

AI 扫描转录寻找确认时刻并返回精确的引用和时间戳。

「证人关于 3 月 14 日会议说了什么?」

搜索 3 月 14 日的引用并逐字返回相关陈述。

「总结受访者关于公司文化说的话」

返回带具体交流引用的清理后摘要。

「比较采访 A 和采访 B 关于领导力的说法」

将两者放在一个集合中,AI 交叉引用并并列呈现差异。

Verdict

当消息源保密性和特权很重要时,设备端是唯一可接受的答案。LocalRAG! v3.0 将 WhisperKit 质量的转录和 AI Q&A 带给要求绝对隐私的工作流程。你的消息源、客户和研究参与者应该得到这种保护。

FAQ

设备端转录和云转录一样准确吗?

WhisperKit base 模型对清晰英语语音准确率约 85%,中文约 80%。使用更大模型的云服务可达 90-95%,但你用隐私换取了那几个百分点。v3.1 将引入可选的 Whisper small/medium 下载,供需要更高设备端准确性的用户使用。

我可以为法律程序制作逐字转录吗?

LocalRAG! 的 LLM 清理通道有意打磨文本 — 它去除填充词并重构不完整句子。对要求逐字记录的法律程序,你应该禁用清理(v3.0 中的设置选项)或使用保留不流畅的原始 Whisper 输出。

如何处理多发言者采访?

目前 LocalRAG! 将所有发言者作为一个流转录。说话人分离(「发言者 1、发言者 2」)在 v4.0 路线图上 — 我们正在评估不需要云处理的设备端说话人分离模型。

免费试用 LocalRAG!

免费版每天5个问题。无需账号。

← Home