GrabText peut-il traiter des PDFs scannés sans couche de texte ?
Oui. GrabText détecte automatiquement si un PDF contient une couche de texte native. Pour les PDFs scannés ou basés sur des images, Tesseract OCR est utilisé. La langue OCR peut être définie manuellement ou laissée sur Auto.
Comment sélectionner des pages spécifiques ?
Dans les options avancées, utilisez le champ Sélection de pages. Saisissez des plages comme 1-3 ou des pages individuelles comme 1,3,5 pour n'extraire que la partie pertinente du PDF.
Quelles langues l'OCR prend-il en charge ?
L'allemand, l'anglais, l'espagnol, le français, l'italien, le portugais et le néerlandais — individuellement ou en combinaisons de langues pour les documents multilingues.
Quelle est la taille maximale de fichier ?
Jusqu'à 20 Mo par fichier. Les PDFs plus volumineux peuvent être divisés avant l'envoi. Les PDFs multipages sont traités page par page.
Quelle est la différence entre Markdown et texte brut ?
Markdown conserve la structure du document : titres sous forme de #, listes sous forme de -. Texte brut ne contient que le texte brut sans mise en forme. Le Markdown est recommandé pour les outils d'IA.