Résolu Eclaircir photocopie en PDF

shub22

Membre actif
13 Juillet 2018
315
22
68
Bonjour
Voilà ma question. J'ai un livre fort rare et difficile à trouver dont on m'a passé les photocopies et qui fait environ 200 pages.
Heureusement j'ai pu améliorer la netteté des caractères avec un logiciel OCR, reconnaissance automatique de caractère. Mais les photocopies sont en mauvais état pour beaucoup.
Sans doute du à un mauvais réglage de la machine, la moitié de la page est gris voire gris foncé ce qui rend la lecture difficile. Seule la moitié inférieure est blanche...
Sous Acrobat Pro DC il existe un réglage "améliorer la numérisation" avec une option "enlever le fond" et "détramage". Je l'ai passé -même plusieurs fois- sous cette option et ça améliore les choses mais ça n'enlève pas la totalité loin de là.
Auriez-vous un conseil à me donner ?
Sous Photoshop je sais faire cela grâce à la détection des plages de couleur mais c'est sur une page ou photo: et là j'en ai plus de 200 donc il faudrait un traitement par lot à la limite.
Si ça existe...
 
Ah d'accord vous êtes sous un autre pseudo et un autre forum: vous avez le droit remarquez hahaha!
Je vais essayer mais suis pas très à l'aise avec les actions sur Photoshop
 
Le pb est que lorsque j'importe un fichier pdf de 60 pages sous Photoshop il l'importe globalement mais pas en fractionnant les 60 pages en 60 calques différents.
Impossible d'accéder à chaque page séparément pour en faire un calque ou alors j'ai pas compris la manip'
De cette façon j'aurais pu appliquer un traitement par lots.
Ou alors prendre les 60 fichiers TIFF en les sélectionnant tous mais comment les importer en un seul fichier sous Photoshop comportant donc 60 calques ?
Je sèche.. Une idée ?
 
Que dire de plus… ?

1. Acrobat Pro : menu Fichier : Enregistrer sous : image : TIFF (pour éviter les dégradations du JPEG).
2. Photoshop : tu utilises ton script/action sur toutes les pages /images.
3. Acrobat Pro : menu Fichier : Créer : Combiner…
 
Le problème est qu'en exportant sous Acrobat en Exporter vers --> Image -->.. on a le choix entre 4 formats possibles dont JPEG, TIFF et PNG
Et le problème est que l'image via l'exportation fait que le texte à la sortie est très dégradé et limite reconnaissable dans tous les formats: même TIFF ce qui est bizarre quand même
 
Il faut faire ça avant toute optimisation ou OCR avec Acrobat, sur les "brut de scan".

À condition d'avoir des bruts de scans, des vrais.
Car la multiplication des scans-copieurs qui scannent par défaut en PDF et font un OCR à la volée est une vraie calamité pour les graphistes.
On reçoit de plus en plus des scans-PDF inexploitables, avec des textes dégueulasses mais OCRisés (ou plutôt dégueulasses car OCRisés).
 
Ah bon tu me surprends! Je connais pas bien le principe mais les OCR remplacent le caractère imprécis ou douteux qu'ils détectent et qui bave ou est flou par un vrai de vrai sur fond blanc. Il y a aussi reconnaissance automatique de la langue ce qui sert dans l'algorithme
L'erreur classique des OCR est de transformer les e en c.
 
Acrobat Pro a deux façons d'effectuer l'OCR :

- soit en mode "textes et images éditables", qui "nettoie" et modifie un peu l'aspect du document original;
- soit en mode "images indexables", qui ne modifie pas du tout l'aspect du document original.
 
Ah je n'ai pas essayé celui-là: je le fais avec PDF premiere Pro à mon boulot: ce qui est long mais à la fin c'est vraiment propre.
Sinon il est relativement cher et pour des usages peu fréquents sans doute que acrobat Pro suffit.