Logiciel pour des Archives

Un bon scanner et un logiciel de reconnaissance des caractères.
 
Qu'entends-tu par "informatiser" ?
- Scanner des documents papiers pour les conserver ?
- Cataloguer des supports (CD...) existants pour faciliter la recherche ?
 
Il y a surtout : des papiers et des registres. Tout cela est dans des cartons. On voudrait informatiser les Archives, c'est-à-dire, classer sur un ordinateur tout ce bazar... pour d'abord savoir ce qui existe et ensuite où le chercher.
 
Donc, ce qu'il te faut, c'est bien un scanner avec chargeur automatique et un logiciel de reconnaissance de caractères du genre ReadIris Pro.
 
Pourquoi un OCR ? le plus simple est de scanner les doc et de les associer à une base de données bien documentée (mots clé, thèmes) pour y accéder facilement. Si le nombre de documents n'est pas trop important (disons moins de 10 000), ça peut même se faire avec Excel.
 
Car au poids d'une page A4, ça risque de faire lourd.
 
Ce qui risque de faire lourd, c'est de passer une doc importante à l'OCR, il suffit de convertir les doc en jpeg pour quela place qu'ils prennent ne soit pas rhédibitoire. Sur un serveur, quelques Go de documents, ce n'est pas une affaire, passer des semaines à les passer à l'OCR, par contre ...
 
OCR : optical character recognition, soit en Français reconnaissance optique de caractères.

Cela permet via un stylo, un scanner et une application dédiée de numériser des documents et de transformer les informations "image" (bitmap) des caractères en véritables polices saisissables.

Vu le nombre de documents si en plus certains sont manuscrits, moi je pencherai aussi pour un scan Basse déf associé à une base de mot clefs pour chaque document, sinon tu risques d'y passer un temps infini, surtout au vu des documents originaux que tu as à traiter.
 
Merci pour vos réponses. On avance... Alors, il me faut un scanner hyper top niveau avec un logiciel OCR hyper top aussi ; le tout associé à une base de données hyper top !


Des noms ? des marques ? Ca m'arrangerait si tout cela pouvait être compatible Mac/PC (Mac Intel ?) parce que le but ultime, quand le travail de titan... sera fait, c'est de partager tout ça en réseau sur différentes plateformes et, pourquoi pas, sur le Net.

Si j'exagère... dites-le moi :rose:
 
Ca veut dire quoi OCR ?
Il y a effectivement des millions de documents ! et une grande partie (registres) est écrite à la main...

Ouuutch ! Là, je pense que ta boite va devoir prévoir un budget conséquent à l'opération. Je pense que l'opération de numérisation pourrait être sous-traitée à une société spécialisée, ces boites, dotée d'un matos performant, peuvent faire le travail pour un coût moins élevé que si vous le faites en interne.

Par contre, la base de données associée devra être conçue avec le plus grand soin, et avec un véritable SGDB relationnel (Oracle, DB2, Sybase, ...), gérer ça avec un système style FM Pro engendrerait des temps de réponse ingérables.

A mon humble avis, si vous voulez obtenir un résultat exploitable au meilleur prix, le mieux serait de confier l'ensemble de la réalisation à une société spécialisée dans ce domaine (je n'ai pas d'adresse mais je sais qu'il en existe, il y a une quinzaine d'années, l'une d'entre elles occupait le stand voisin du nôtre sur un salon informatique).
 
Ouuutch ! Là, je pense que ta boite va devoir prévoir un budget conséquent à l'opération. Je pense que l'opération de numérisation pourrait être sous-traitée à une société spécialisée, ces boites, dotée d'un matos performant, peuvent faire le travail pour un coût moins élevé que si vous le faites en interne.

Par contre, la base de données associée devra être conçue avec le plus grand soin, et avec un véritable SGDB relationnel (Oracle, DB2, Sybase, ...), gérer ça avec un système style FM Pro engendrerait des temps de réponse ingérables.

A mon humble avis, si vous voulez obtenir un résultat exploitable au meilleur prix, le mieux serait de confier l'ensemble de la réalisation à une société spécialisée dans ce domaine (je n'ai pas d'adresse mais je sais qu'il en existe, il y a une quinzaine d'années, l'une d'entre elles occupait le stand voisin du nôtre sur un salon informatique).

Merci Pascal 77. Tu confirmes ma première pensée ! D'autant plus, qu'ici je ne vois pas qui a les compétences pour faire ce boulot... on a déjà envisagé d'embaucher un Archiviste professionnel, mais il lui faudra le matos pour travailler ! L'option "sous traitance", j'y avais pas pensé, mais c'est une bonne idée. C'est quel type de société que je pourrais contacter = je cherche quoi sur Google ?
 
Perso, j'ai commencé à numériser (environs 500 articles pour l'instant) ma pile de magazines divers et variés avec un Canon Lide 60, un scanner ultra plat à 60 Euro, l'un des moins chers du marché.

Il est livré, comme tout scanner moderne, avec une espèce de logiciel à tout faire, en l'occurrence Cannoscan Toolbox, qui gère les fonctions mail, photocopie, fax, etc...

... et, ce qui nous intéresse ici, des PDF indéxables dans Spotlights.
Avantages : beaucoup plus rapide à mettre en oeuvre qu'un logiciel pro tel qu'OmniPage. On peut même faire tu traitement par lot.

Voilà donc ce que l'on peut faire avec l'un des scanners les moins chers du marché. Donc si tu veux faire fu travail "de gros", ne vise pas forcément un scanner haut de gamme en définition mais surtout rapide, choisis les bon réglages (pour le poids) ou investit dans un logiciel pro et prends le temps de l'appréhender (conversion au texte brut, etc...)

Ensuite, tu peux combiner les PDF avec PDF Lab et/ou leur adjoindre des mots clefs supplémentaires pour l'indéxation Spotlight.
 
Ca veut dire quoi OCR ?
Il y a effectivement des millions de documents ! et une grande partie (registres) est écrite à la main...

Perso, j'ai commencé à numériser (environs 500 articles pour l'instant) ma pile de magazines divers et variés avec un Canon Lide 60, un scanner ultra plat à 60 Euro, l'un des moins chers du marché.

Il est livré, comme tout scanner moderne, avec une espèce de logiciel à tout faire, en l'occurrence Cannoscan Toolbox, qui gère les fonctions mail, photocopie, fax, etc...

... et, ce qui nous intéresse ici, des PDF indéxables dans Spotlights.
Avantages : beaucoup plus rapide à mettre en oeuvre qu'un logiciel pro tel qu'OmniPage. On peut même faire tu traitement par lot.

Voilà donc ce que l'on peut faire avec l'un des scanners les moins chers du marché. Donc si tu veux faire fu travail "de gros", ne vise pas forcément un scanner haut de gamme en définition mais surtout rapide, choisis les bon réglages (pour le poids) ou investit dans un logiciel pro et prends le temps de l'appréhender (conversion au texte brut, etc...)

Ensuite, tu peux combiner les PDF avec PDF Lab et/ou leur adjoindre des mots clefs supplémentaires pour l'indéxation Spotlight.

Avec un Mac et un scanner à plat ? je vois le temps qu'il m'a fallu pour numériser mes bulletins de salaires depuis 1970, là, il sera mort de vieillesse avant d'en avoir fait la moitié. :mouais:
 
Avec un Mac et un scanner à plat ? je vois le temps qu'il m'a fallu pour numériser mes bulletins de salaires depuis 1970, là, il sera mort de vieillesse avant d'en avoir fait la moitié. :mouais:

Oups ! Je n'avais pas lu les "millions de documents manuscrits". Ma méthode ne vaut que pour un usage privé et des documents imprimés bien sûr.

Vue la demande, je ne vois effectivement que les services de sociétés spécialisées.
 
Autrement, que ta societe embauche des stagiaires pour l'ete prochain pour scanner "a mano" tout vos documents, en deux mois de temps, et de bons employés… :D :rateau: :o
 
Ça reviendrait cher, pour faire ça en deux mois, il faudrait environ 45 stagiaires, donc 45 postes équipés et 45 scanners qui ne serviraient plus après. Par ailleurs, le temps nécessaire pour constituer la base de données associée serait au moins aussi important, mais nécessiterait lui du personnel qualifié.

Non, la sous-traitance reste la meilleure option. ces gens ont un matériel bien plus adapté, des compétences et de l'expérience. En outre, leur prestation, au lieu de gonfler la taxe professionnelle de l'entreprise (en partie basée sur les salaires), se déduit des impôts via les frais de gestion, donc ... :siffle:
 
Ça reviendrait cher, pour faire ça en deux mois, il faudrait environ 45 stagiaires, donc 45 postes équipés et 45 scanners qui ne serviraient plus après. Par ailleurs, le temps nécessaire pour constituer la base de données associée serait au moins aussi important, mais nécessiterait lui du personnel qualifié.

Non, la sous-traitance reste la meilleure option. ces gens ont un matériel bien plus adapté, des compétences et de l'expérience. En outre, leur prestation, au lieu de gonfler la taxe professionnelle de l'entreprise (en partie basée sur les salaires), se déduit des impôts via les frais de gestion, donc ... :siffle:

C'est effectivement la solution que nous allons sans doute retenir. Une autre Association m'a indiquée qu'elle avait suivi ce processus : création par un programmeur (programmateur ?) de la base de données sur Access ; puis sous traitance pour la numérisation. Je vais aller leur rendre une petite visite pour voir de visus tout ça ; comme elle est dans le Sud je prévois la baignade en méditerranée :D