Re: PDF

6 Apr 2016


      Le 06/04/2016 08:26, Georges a écrit :
  Le Tue, 5 Apr 2016 17:59:17 +0200, PR a écrit :
...
...
Bonjour,
Le 05/04/2016 15:07, charles a écrit :
...
Bonjour
Quelqu'un sait il si il est possible sous Linux de convertir un
fichier pdf obtenu avec un scanner - donc image,
en pdf indexé permettant ainsi la recherche sur le texte contenu
dans ce fichier ?
La réponse est "paperwork"
...
+1 +1 +1  je l'utilise depuis longtemps et dommage pas de paquet
*** *ZIP
  1- paperwork-stable.zip	# https://github.com/jflesch/paperwork
   --> Download zip 2- decompacter
  3- setup.py install		# alors
   dans /usr/local/bin/paperwork
et le programme dans le répertoire de compilation
~/MesFich/autres/EXTENSION/PaperWork/stable_0.2.2
*** *LES FICHIERS REPERTOIRES
/usr/local/bin/paperwork			# le programme
/usr/local/bin/paperwork-chkdeps		# l'utilitaire
~/MesFich/APPLICATIONS/Bureautique/PaperWork	# Les papiers
scannés
4- Recommandés
      Sane: Pour numériser les pages
      Tesseract: Pour extraire les mots des pages (OCR)
      GTK / Glade: Pour l'interface utilisateur
      Whoosh: Pour indexer et de rechercher des documents, et de fournir
  des suggestions de mots clés
...
À bientôt,
   Patrice Reich
Bonjour et merci à tous
Je vais essayer d'installer paperwork sur une Fedora 23 
(4.4.4-301.fc23.x86_64 - Mini PC Asus Vivo Intel E5)
Charles

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

Re: PDF