Hello !
Dans le cadre d'un gestion de documents de patients dans un cabinet de pédiatrie, j'ai une base de données (4D mais peux l'exporter sous d'autres formats si besoins) avec id, nom, prénom.
D'un autre côté j'ai des pdf issus de scan reconnus par OCR (ces scans sont très variables, pas de garbarit fixe). Chaque scan possède quelque part dans le texte un nom et prénom.
Mon but est d'ajouter l'id du nom,prénom dans le nom du fichier pdf si ce nom, prénom apparaissent dans le texte.
En fait il faudrait qu'un script passe en revue le texte du pdf et compare chaque mot trouvé à la base de donnée, établisse un score et, le cas échéant, modifie le nom du fichier.
Est-ce que quelqu'un a une idée de la direction à prendre ? Acheter un soft qui le ferait, programmer quelque chose (quel langage ? est-ce que ce serait réalisable via un applescript utilisant spotlight ?), autre ?
Merci pour toute contribution, idée, proposition !
La bonne journée
pioutar
Dans le cadre d'un gestion de documents de patients dans un cabinet de pédiatrie, j'ai une base de données (4D mais peux l'exporter sous d'autres formats si besoins) avec id, nom, prénom.
D'un autre côté j'ai des pdf issus de scan reconnus par OCR (ces scans sont très variables, pas de garbarit fixe). Chaque scan possède quelque part dans le texte un nom et prénom.
Mon but est d'ajouter l'id du nom,prénom dans le nom du fichier pdf si ce nom, prénom apparaissent dans le texte.
En fait il faudrait qu'un script passe en revue le texte du pdf et compare chaque mot trouvé à la base de donnée, établisse un score et, le cas échéant, modifie le nom du fichier.
Est-ce que quelqu'un a une idée de la direction à prendre ? Acheter un soft qui le ferait, programmer quelque chose (quel langage ? est-ce que ce serait réalisable via un applescript utilisant spotlight ?), autre ?
Merci pour toute contribution, idée, proposition !
La bonne journée
pioutar