Gestion de la taille d'une image Jpeg.

booya66

Membre enregistré
17 Septembre 2003
5
0
Voila mon problème.
Je cherche à scanner des images d'articles, pour ensuite permettre leur lecture via un site Web (Droits d'auteur respectés!). Je cherche donc à optimiser au max. la taille de ces fichiers (100/200Ko max). J'hesite entre OCR et JPEG pour la mise en ligne. L'OCR semble ne pas respecter la mise en page et la reconnaissance en 600 dpi est aleatoire et gavée de fautes. Le JPeg lui, est pas mal, mais les fichiers optenus sont trop lourds. D'autant que les utilisateurs doivent etre en mesure de les imprimer derrière. Est ce que vous auriez une solution à me proposer ? Merci...
smile.gif
 
Si tes articles sont en noir et blanc, peut etre peux tu tenter le GIF avec 2 couleurs (noir et blanc), voir avec quelques niveaux de gris…

Cela devrait limiter le poids fichier.

Apres au niveau du site, peut etre peux tu "repenser" l'ergonomie afin de ne pas trop affichier d'articles en meme temps (?), ce qui permettra une navigation moins contraignante…
 
Avec quel outils tu compresse les docs ?
Si tu utilise Photoshop, tu as les moyens de choisir correctement ton taux de compression et du gif ou jpg ou png.
Quel est le format d'origine de tes docs ?
Si c'est du Xpress, il faut les convertir en eps avant de l'ouvrir sous photoshop.....
 
booya66 a dit:
D'autant que les utilisateurs doivent etre en mesure de les imprimer derrière. Est ce que vous auriez une solution à me proposer ? Merci...
smile.gif

voilà voilà... à mon avis le probleme est là. si tu fournis des jpeg, les gens qui voudront imprimer devront imprimer des jpeg, et imprimer une image, c'est pas du tout pareil que d'imprimer du texte : c'est long, ça prend de l'encre et puis, et puis ça fait ch*** d'imprimer une page de texte sous forme d'image... perso les pliures et défauts du papier je m'en fout, seul le texte est intéressant.
La solution la plus logique vis à vis des visiteurs/utilisateurs, c'est que ces textes soient du texte et pas de l'image... mais apparemment les OCR ne fonctionnent pas bien...

Moi je recopierais tout à la main à ta place, c'est le plus propre (mais pas le moins ennuyeux, je te l'accorde)...
 
Olive94 a dit:
Si tes articles sont en noir et blanc, peut etre peux tu tenter le GIF avec 2 couleurs (noir et blanc), voir avec quelques niveaux de gris…

Cela devrait limiter le poids fichier.

Apres au niveau du site, peut etre peux tu "repenser" l'ergonomie afin de ne pas trop affichier d'articles en meme temps (?), ce qui permettra une navigation moins contraignante…

Merci pour la reponse, mais j'ai deja essayé et cela me parait pas très viable niveau qualité. De plus, dans l'ideal, il faudrait que les utilisateurs puissent faire une recherche par mots-clés, pour identifier le type d'articles qui correspondent à leur recherche.
smile.gif
 
fredzob a dit:
Avec quel outils tu compresse les docs ?
Si tu utilise Photoshop, tu as les moyens de choisir correctement ton taux de compression et du gif ou jpg ou png.
Quel est le format d'origine de tes docs ?
Si c'est du Xpress, il faut les convertir en eps avant de l'ouvrir sous photoshop.....

A la base, ce sont de simples articles tirés de journaux, que je scanne (environ 80 pages) C'est à partir de la que j'ai un gros dilemme. Soit j'"océrise" le tout, mais Omnipage 10 m'oblige a faire un paquet de retouche à la main (redactionnel et de mise en page), soit je garde un format image (Jpeg ou GIF) mais, le poids augmente très vite et la recherche de mots clés devient problematique...
frown.gif
Merci de ta reponse en tout cas
smile.gif
 
obi wan a dit:
voilà voilà... à mon avis le probleme est là. si tu fournis des jpeg, les gens qui voudront imprimer devront imprimer des jpeg, et imprimer une image, c'est pas du tout pareil que d'imprimer du texte : c'est long, ça prend de l'encre et puis, et puis ça fait ch*** d'imprimer une page de texte sous forme d'image... perso les pliures et défauts du papier je m'en fout, seul le texte est intéressant.
La solution la plus logique vis à vis des visiteurs/utilisateurs, c'est que ces textes soient du texte et pas de l'image... mais apparemment les OCR ne fonctionnent pas bien...

Moi je recopierais tout à la main à ta place, c'est le plus propre (mais pas le moins ennuyeux, je te l'accorde)...

Ben, l'impression n'est pas forcement problematique, si les jpeg (leger) sont ensuite transferé en PDF, suivant la demande et pour l'impression. Et je te confirme que le OCR ne fonctionne vraiment pas bien.
smile.gif
 
Bon. Une fois pour toute
zen.gif
: Il faut du GIF !
Le Jpeg ne convient pas pour du texte et sera trop lourd !

Pour un article sur papier chiotte genre journal (en partant du principe que tu as Photoshop):

1) D'abord, tu scannes en niveaux de gris avec quelque chose de noir entre ton papier et le couvercle du scanner si celui-ci n'est pas déjà noir (pour atténuer les problèmes liés à la transparence). Scanne en tiff ou en import direct dans Photoshop : éviter à tout prix une compression Jpeg sur du texte.

2) Dans Photoshop, tu utilises les niveaux ou les courbes pour corriger ton image, le fond doit être bien blanc et le texte bien noir.

3) Tu convertis en gif : normalement, une palette de 2 couleurs (noir et blanc) doit suffir. À la limite 3 ou 4 pour lisser si la résolution est faible.

(une fois les essais réalisés, enregistrer tout ça dans un script pour le traitement par lot)

4) Pour l'indexation/recherche web), tu saisis quelques Mots clés dans ta page web et le tour est joué.
smile.gif

 
booya66 a dit:
Ben, l'impression n'est pas forcement problematique, si les jpeg (leger) sont ensuite transferé en PDF, suivant la demande et pour l'impression. Et je te confirme que le OCR ne fonctionne vraiment pas bien.
smile.gif

c'était pas le format jpeg que je trouve problématique, c'est le fait qu'une imprimante ne se comporte pas du tout de la meme maniere pour imprimer une image et pour imprimer du 'vrai' texte (ça va bcp plus vite, le 'vrai' texte)
 
Niconemo a dit:
Bon. Une fois pour toute
zen.gif
: Il faut du GIF !
Le Jpeg ne convient pas pour du texte et sera trop lourd !

Pour un article sur papier chiotte genre journal (en partant du principe que tu as Photoshop):

1) D'abord, tu scannes en niveaux de gris avec quelque chose de noir entre ton papier et le couvercle du scanner si celui-ci n'est pas déjà noir (pour atténuer les problèmes liés à la transparence). Scanne en tiff ou en import direct dans Photoshop : éviter à tout prix une compression Jpeg sur du texte.

2) Dans Photoshop, tu utilises les niveaux ou les courbes pour corriger ton image, le fond doit être bien blanc et le texte bien noir.

3) Tu convertis en gif : normalement, une palette de 2 couleurs (noir et blanc) doit suffir. À la limite 3 ou 4 pour lisser si la résolution est faible.

(une fois les essais réalisés, enregistrer tout ça dans un script pour le traitement par lot)

4) Pour l'indexation/recherche web), tu saisis quelques Mots clés dans ta page web et le tour est joué.
smile.gif


Yes !! Merci, j'ai testé ta solution en y rajoutant quelques bidouilles de mon cru et le resultat est parfait....

Merci beaucoup !
zen.gif
smile.gif
zen.gif