Le Tue, 5 Apr 2016 17:59:17 +0200,
PR a écrit :
Bonjour,
Le 05/04/2016 15:07, charles a écrit :
Bonjour
Quelqu'un sait il si il est possible sous Linux de convertir un fichier pdf obtenu avec un scanner - donc image, en pdf indexé permettant ainsi la recherche sur le texte contenu dans ce fichier ?
La réponse est "paperwork"
+1 +1 +1 je l'utilise depuis longtemps et dommage pas de paquet
*** *ZIP 1- paperwork-stable.zip # https://github.com/jflesch/paperwork --> Download zip 2- decompacter 3- setup.py install # alors dans /usr/local/bin/paperwork
et le programme dans le répertoire de compilation ~/MesFich/autres/EXTENSION/PaperWork/stable_0.2.2
*** *LES FICHIERS REPERTOIRES
/usr/local/bin/paperwork # le programme
/usr/local/bin/paperwork-chkdeps # l'utilitaire
~/MesFich/APPLICATIONS/Bureautique/PaperWork # Les papiers scannés
4- Recommandés Sane: Pour numériser les pages Tesseract: Pour extraire les mots des pages (OCR) GTK / Glade: Pour l'interface utilisateur Whoosh: Pour indexer et de rechercher des documents, et de fournir des suggestions de mots clés
À bientôt, Patrice Reich
Linux06 mailing list Linux06@lists.linux-azur.org https://lists.linux-azur.org/mailman/listinfo/linux06