2026-03-11·4分钟阅读

图片OCR：将照片转化为可搜索、可AI问答的文档

并非所有文档都以PDF或Word文件形式存在。会议白板上的笔记、钱包里的收据、打印的讲义、名片 — 这些都是困在图片形式中的「文档」。LocalRAG! v1.2新增图片导入和设备端OCR功能：拍照或导入图片，应用会使用Vision（iOS）或ML Kit（Android）提取所有可读文字。提取后，您可以像对待其他文档一样向AI提问。

困在照片中的文档

您拍下了会议后白板上的内容、用手机扫描了合同、或保存了重要信息的截图。文字就在那里，在图片中清晰可见，但您无法搜索、复制或向AI提问。大多数AI文档工具只接受PDF或文本文件 — 它们完全忽略图片。您只能手动输入内容，或使用单独的OCR应用，再将文字粘贴到另一个工具中。

LocalRAG!如何处理图片

LocalRAG!直接接受JPG、PNG、HEIC和WebP图片。导入图片时，设备端OCR（iOS上的Apple Vision，Android上的Google ML Kit）提取所有可读文字 — 无需将图片发送到任何地方。提取的文字像PDF或DOCX一样被分块和索引，因此您可以立即提问、请求摘要或搜索包括图片在内的所有文档。

1📷

导入图片

拍照或导入现有的JPG、PNG、HEIC或WebP文件。支持一次选择多张图片批量导入。

2🔍

设备端OCR

Vision（iOS）或ML Kit（Android）扫描图片并提取所有可读文字。支持中文、日文和英文。一切都在您的设备上完成。

3💬

提问

提取的文字与其他文档一起索引。向AI提问，获得带有来源引用的回答。

为什么用LocalRAG!处理图片文档

📷

直接导入图片

无需单独的OCR应用。直接将照片导入LocalRAG! — 支持JPG、PNG、HEIC和WebP。

🛡️

设备端OCR

文字提取完全在您的设备上使用Apple Vision或Google ML Kit完成。您的图片永远不会上传到任何服务器。

📚

混合文档库

图片与PDF、EPUB和其他文档共存于集合中。跨所有格式同时搜索和提问。

📱

批量导入

从相册一次选择多张图片。每张图片按顺序处理，并有清晰的进度提示。

图片文档提问示例

「这个白板上的行动项有哪些？」

LocalRAG!提取白板文字并识别笔记中提到的行动项、截止日期和分工。

「总结这张收据的要点」

AI读取OCR识别的收据文字，总结商家、商品、金额和日期。

「这份打印文件关于截止日期说了什么？」

LocalRAG!搜索扫描文件中提取的文字，找到与截止日期相关的信息并引用来源。

「将这张照片中的信息与我的PDF合同进行比较」

当两份文档在同一集合中时，LocalRAG!跨两者搜索并比较相关部分。

Verdict

通过图片OCR支持，LocalRAG!弥合了实体文档和数字文档之间的差距。白板、收据、打印讲义、截图 — 任何包含可读文字的内容都可以导入、索引和用AI查询。结合其他12种支持格式、子集合组织功能和完全的设备端隐私保护，LocalRAG!是最versatile的移动文档AI工具。

FAQ

LocalRAG!支持哪些图片格式？

LocalRAG!支持JPG、JPEG、PNG、HEIC、HEIF和WebP图片格式。您可以导入手机拍摄的照片或从其他应用保存的图片。

OCR准确度如何？

LocalRAG!使用Apple Vision（iOS）和Google ML Kit（Android）进行OCR，对中文、日文和英文的印刷文字具有很高的准确度。手写文字的识别取决于字迹清晰度。请注意，OCR仅提取文字 — 不理解图表标签或流程图箭头等视觉关系。

可以在同一集合中混合使用图片和其他文档类型吗？

可以。图片、PDF、EPUB和所有其他支持的格式可以共存于同一集合或子集合中。当您提问时，LocalRAG!会在选定范围内搜索所有文档类型。

免费试用LocalRAG!

免费版每天5次提问。无需注册账号。

← Home

困在照片中的文档

LocalRAG!如何处理图片

导入图片

设备端OCR

提问

为什么用LocalRAG!处理图片文档

直接导入图片

设备端OCR

混合文档库

批量导入

图片文档提问示例

Verdict

FAQ

其他用例

相关对比文章