功能特点
- 原生文本提取从可搜索PDF中快速精准提取文本——直接读取文本层,无需OCR。
- 扫描PDF的OCR识别对扫描或基于图片的页面使用Tesseract文字识别,自动检测。
- 页面选择仅提取特定页面,例如
1-3,5——处理大文档时节省时间。 - Markdown输出保留文档结构(标题、列表)——非常适合AI处理。
- 批量处理与ZIP同时处理多个PDF,将所有结果下载为ZIP压缩包。
- 最大20MB/文件支持大型和多页PDF的完整处理。
Text aus PDF-Dateien extrahieren. OCR-Unterstützung, Seitenauswahl, Markdown-Ausgabe. Kostenlos.
1-3,5——处理大文档时节省时间。1-3或单独页码如1,3,5,只提取PDF中相关部分。#,列表格式为-。纯文本只包含无格式的原始文本。AI工具推荐使用Markdown格式。