Extraire un tableau .xls d'un PDF ???

Tu as essayé de faire un "enregistrer sous" au format RTF ? Il faut bien entendu avoir la version "Pro" d'Acrobat.
 
Je viens de faire un essai, c'est vrai qu'il y a une mise en forme à revoir sous Xls mais on récupère au moins tous les textes.
 
Essaie comme suit (à condition de ne pas avoir trop d'espaces dans les valeurs des cellules le résultat est ok)
nb : il va de soi qu'aucune formule n'est récupérable.

ouvre le pdf
sélectionne les valeurs du tableau
copie ces valeurs
lance word
colle les valeurs
sélectionne tout et va dans menu Tableau/convertir/texte en tableau
comme séparateur (en bas) mets un espace
valide

tu obtiens un tableau que tu peux copier et coller dans excel.
 
Ce qui marche (je pense que c'est ce que tu voulais dire) que si aucune cellule n'est vide sinon ça décalera tout.

Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.
 
Avec Acrobat 7+ tu sélectionnes les éléments du tableau avec l'outil de sélection de texte > clic-droit > Copier sous forme d'un tableau (ou Enregistrer sous forme d'un tableau).

Il n'y a plus ensuite qu'à coller (ou importer) dans n'importe quel tableur.

:up:
 
Ce qui marche (je pense que c'est ce que tu voulais dire) que si aucune cellule n'est vide sinon ça décalera tout.

Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.

C'est sur, mais pour un tableau "simple" ça passe.
 
Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.

Les PDF "balisés" (tagged) intègrent ces données, ceux qui ne sont pas balisés ne les intègrent pas, tout dépend comment le PDF a été généré.

Comme toujours : il y a PDF et PDF !

;)
 
Les PDF "balisés" (tagged) intègrent ces données, ceux qui ne sont pas balisés ne les intègrent pas, tout dépend comment le PDF a été généré.

Comme toujours : il y a PDF et PDF !

;)

Je m'attendais à une réaction de ta part ;)

Donc ma phrase corrigée :
... si que le PDF n'est pas balisé et n'intègre donc pas les données de tabulation

Ça voudrait dire que le PDF a été généré exprès pour ça... peu de chance...
 
Ca veut surtout dire que le PDF n'a pas été généré avec une imprimante virtuelle (Mac OSX, Distiller, PrimoPDF, etc) car elles ne retiennent pas ce type d'informations, mais plutôt par une exportation directe depuis un logiciel qui en est capable (Suites Adobe, XPress, OpenOffice, etc.).

Exception : les logiciels de MS-Office version PC lorsque la conversion en PDF se fait avec la macro-commande PDF-Maker (qui utilise Distiller mais en conservant tout un tas d'attributs supplémentaires).

Un PDF balisé est forcément en version 1.4 ou +
C'est pour ça que les PDF "prépresse" qui sont généralement en 1.3 ne contiennent pas ce balisage, bien que ce ne soit absolument pas gênant pour les RIP (sauf erreur de ma part).

;)
 
Quelques années plus tard :D

J'ai le même problème, je dispose d'un PDF produit par la chambre des notaires, listant les tarifs de l'immobilier par arrondissement mais le dit fichier n'a pas été créé "comme il faut".

Je n'y arrive pas, que ce soit manuellement ou avec Adobe Acrobat Pro. Certes je ne le maîtrise pas, c'est la machine de mon frêre, mais il n'y a pas 10 000 manières d'exporter le tableau.

J'ai même, lorsque je fais un export pour ensuite convertir les données sous Excel 2011, des pertes de "0".

Une idée ? Merci.
 
Je teste, merci de ta réponse :)
 
Dernière édition:
Essaie comme suit (à condition de ne pas avoir trop d'espaces dans les valeurs des cellules le résultat est ok)
nb : il va de soi qu'aucune formule n'est récupérable.

ouvre le pdf
sélectionne les valeurs du tableau
copie ces valeurs
lance word
colle les valeurs
sélectionne tout et va dans menu Tableau/convertir/texte en tableau
comme séparateur (en bas) mets un espace
valide

tu obtiens un tableau que tu peux copier et coller dans excel.

********************************
Merci da capo.
La méthode Pdf-Word-Excel fonctionne parfaitement.
Crigou.
********************************
 
Et sinon, on peut toujours manipuler des données massives et amassées avec des rechercher-remplacer, des caractères spéciaux ($, etc) suivi des « changer des contenus en colonne » (ou remplacer caractère spéciaux par tab dans xpress) quand certains contenus de colonnes commencent par des choses récurrentes.
 
Merci ccciolll.
La méthode de da capo fonctionne à partir d'un simple lecteur PDF. Est-ce aussi le cas pour votre méthode ?
Merci.
Crigou.
 
Il y a une nouvelle fonction depuis Acrobat Pro XI, améliorée dans Acrobat Pro DC.
Menu Fichier : Exporter vers : Feuille de calcul : Classeur MS Excel

PDF2XLS.png
 
Merci ccciolll.
La méthode de da capo fonctionne à partir d'un simple lecteur PDF. Est-ce aussi le cas pour votre méthode ?
Merci.
Crigou.

Mon bricolage marche avec du texte pur… Le texte pur peut s'extraire d'un fichier PDF pour autant qu'il ne soit pas vectorisé.
Mais mon bricolage est celui de la dernière chance. Si tu as un outil qui le fait à ta place, profites-en.