PDF转文本 — 从PDF文件中提取文本

可以。GrabText自动检测文本层。对扫描PDF使用Tesseract OCR。

在高级选项中，在页面选择字段输入范围如1-3或单独页码如1,3,5。

德语、英语、西班牙语、法语、意大利语、葡萄牙语和荷兰语，支持语言组合。

每个文件最大20 MB。较大PDF可在上传前拆分。

Markdown保留文档结构（标题为#，列表为-）。纯文本只有原始文字。推荐AI工具使用Markdown。

功能特点

GrabText能处理没有文本层的扫描PDF吗？

可以。GrabText自动检测PDF是否包含原生文本层。对于扫描或基于图片的PDF，将使用Tesseract OCR进行识别。OCR语言可手动设置，也可选择自动模式。

如何选择特定页面？

在高级选项中，使用页面选择字段。输入范围如1-3或单独页码如1,3,5，只提取PDF中相关部分。

OCR支持哪些语言？

德语、英语、西班牙语、法语、意大利语、葡萄牙语和荷兰语——单独使用或作为多语言文档的语言组合。

最大文件大小是多少？

每个文件最大20 MB。较大的PDF可在上传前拆分。多页PDF按页逐一处理。

Markdown和纯文本有什么区别？

Markdown保留文档结构：标题格式为#，列表格式为-。纯文本只包含无格式的原始文本。AI工具推荐使用Markdown格式。