ジャーナリストはソースを守ります。弁護士は依頼者通信を守ります。研究者は参加者の身元を守ります。インタビュー音声をクラウド文字起こしサービスに送信すれば、それらすべてがリスクにさらされます。LocalRAG! v3.0はインタビューを完全にiPhoneまたはAndroidで文字起こし — 音声は端末から一切出ません。WhisperKitが文字起こし、AIが整形、何時間もの録音にAIで質問可能。すべて端末内、すべてプライベートです。
クラウド文字起こしサービス(Otter、Rev、Fireflies)は音声を自社サーバーにアップロードします。調査報道では、ソースの音声が第三者データベースに残ればリスクに。法律相談では弁護士-依頼者特権が問題に。研究インタビューでは、IRBプロトコル下でアップロードは参加者同意違反になります。ベンダーがどれだけセキュリティを約束しても、第三者サーバー上に音声が存在すること自体がプライバシーリスクです。本当の解決策はただ1つ — アップロードしないことです。
LocalRAG!はインタビュー音声(MP3、M4A、WAV、AAC、FLAC)をWhisperKitで完全に端末内で文字起こし。LLMクリーンアップパスがフィラーを除去し、引用に直接使える清書された文字起こしを生成します。文字起こしは端末内でインデックス化され、AIに特定トピックの引用検索、対象が話した内容の要約、複数インタビュー間の発言比較を依頼可能。一切アップロードしません。
任意のボイスレコーダーアプリで。iOS標準のボイスメモはM4Aを直接エクスポート。ファイルをLocalRAG!にインポート。
WhisperKitがローカル実行。音声ファイルはアプリのサンドボックス内に — OSレベルの隔離。文字起こしステップでネットワーク通信なし。
「ソースは締切について何と言った?」 — LocalRAG!がタイムスタンプ付きで清書済み抜粋を返します。引用としてそのままコピー可能。
調査報道の第一原則:ソースを守る。音声は端末から出ません。クラウド侵害、召喚状、内部脅威で録音が漏れることはありません。
弁護士-依頼者間インタビューは特権を保持。第三者処理がないので第三者開示性なし — 機密性の高い法務作業に有意義な姿勢。
IRBプロトコル下の人を対象とする研究で、端末上文字起こしはより厳格な同意書(「データは第三者と共有されません」)を満たすことが多い。
Whisperの生出力にはフィラーがありますが、LocalRAGのLLMクリーンアップで編集済み発話のような文字起こしに。タイムスタンプ引用付きで直接引用可能。
AIが確認の瞬間を特定し、タイムスタンプ付きで正確な引用を返します。
3月14日の言及を検索し、関連発言を逐語的に返します。
具体的やり取りへの引用付きで清書された要約を返します。
両方を1コレクションに入れれば、AIがクロス参照して相違点を並列表示。
ソース守秘性と特権が重要なとき、オンデバイスは唯一受け入れられる答えです。LocalRAG! v3.0は、絶対的プライバシーを要求するワークフローにWhisperKit品質の文字起こしとAI Q&Aをもたらします。あなたのソース、依頼者、研究参加者は、その保護に値します。
WhisperKit baseは明瞭な英語で約85%、日本語で約75%の精度。より大きなモデルを使うクラウドサービスは90-95%に達しますが、プライバシーと引き換えになります。v3.1で精度向上を求めるユーザー向けにWhisper small/mediumのオプションダウンロードを導入予定。
LocalRAG!のLLMクリーンアップパスは意図的にテキストを整形します — フィラーを除去し、不完全文を再構成。逐語記録が必要な法的手続きでは、クリーンアップを無効化(v3.0設定オプション)するか、不全要素を保持する生のWhisper出力を使用してください。
現在LocalRAG!はすべての話者を1ストリームとして文字起こしします。話者分離(「話者1、話者2」)はv4.0のロードマップにあり — クラウド処理を必要としないオンデバイス話者分離モデルを評価中です。
LocalRAG!を無料で試す
1日5回まで無料。アカウント登録不要。