Re: PDF

6 Apr 2016


      Le Tue, 5 Apr 2016 17:59:17 +0200,
PR a écrit :
...
Bonjour,
Le 05/04/2016 15:07, charles a écrit :
...
Bonjour
Quelqu'un sait il si il est possible sous Linux de convertir un
fichier pdf obtenu avec un scanner - donc image,
en pdf indexé permettant ainsi la recherche sur le texte contenu
dans ce fichier ?
La réponse est "paperwork"
+1 +1 +1  je l'utilise depuis longtemps et dommage pas de paquet
*** *ZIP
 1- paperwork-stable.zip	# https://github.com/jflesch/paperwork
  --> Download zip 2- decompacter
 3- setup.py install		# alors
  dans /usr/local/bin/paperwork
et le programme dans le répertoire de compilation
~/MesFich/autres/EXTENSION/PaperWork/stable_0.2.2
*** *LES FICHIERS REPERTOIRES
/usr/local/bin/paperwork			# le programme
/usr/local/bin/paperwork-chkdeps		# l'utilitaire
~/MesFich/APPLICATIONS/Bureautique/PaperWork	# Les papiers
scannés
4- Recommandés
     Sane: Pour numériser les pages
     Tesseract: Pour extraire les mots des pages (OCR)
     GTK / Glade: Pour l'interface utilisateur
     Whoosh: Pour indexer et de rechercher des documents, et de fournir
 des suggestions de mots clés
...
À bientôt,
  Patrice Reich

Linux06 mailing list
Linux06@lists.linux-azur.org
https://lists.linux-azur.org/mailman/listinfo/linux06

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

Re: PDF