Questions fréquentes
Quels sites web peuvent être extraits ?
Tous les sites web accessibles publiquement. GrabText supprime la navigation, les publicités, les bannières de cookies et les pieds de page, ne fournissant que le texte principal de l'article — en Markdown ou texte brut.
Puis-je traiter plusieurs URLs à la fois ?
Oui. Saisissez les URLs ligne par ligne. En mode masse, une archive ZIP est créée avec les fichiers individuels et une sortie de texte combinée de toutes les pages.
Fonctionne-t-il avec les sites riches en JavaScript ?
Partiellement. GrabText traite le code source HTML initial. Le contenu chargé exclusivement via JavaScript (Applications Mono-Page) peut ne pas être entièrement disponible.
Dans quel format est la sortie ?
En Markdown (avec liens, mise en forme et structure) ou en texte brut. Pour plusieurs URLs, une archive ZIP avec des fichiers individuels est également disponible.
Qu'est-ce qui est supprimé du texte extrait ?
Les menus de navigation, publicités, bannières de cookies, pieds de page et autres éléments non-contenu sont supprimés automatiquement. Le contenu principal de la page est conservé.