Extraire un tableau .xls d'un PDF ???

vailtony · 4 Septembre 2008

bonjour,
je viens de recevoir un tableau enregistré sous PDF.
Je souhaiterais récupérer ce tableau pour le mettre sous Excel.

Avez-vous une soution ????

Merci

Membre supprimé 56091 · 4 Septembre 2008

Tu as essayé de faire un "enregistrer sous" au format RTF ? Il faut bien entendu avoir la version "Pro" d'Acrobat.

vailtony · 4 Septembre 2008

oui j'ai essayé avec la version Pro 8 mais ça ne fonctionne pas

merci quand même

Membre supprimé 56091 · 4 Septembre 2008

Je viens de faire un essai, c'est vrai qu'il y a une mise en forme à revoir sous Xls mais on récupère au moins tous les textes.

da capo · 4 Septembre 2008

Essaie comme suit (à condition de ne pas avoir trop d'espaces dans les valeurs des cellules le résultat est ok)
nb : il va de soi qu'aucune formule n'est récupérable.

ouvre le pdf
sélectionne les valeurs du tableau
copie ces valeurs
lance word
colle les valeurs
sélectionne tout et va dans menu Tableau/convertir/texte en tableau
comme séparateur (en bas) mets un espace
valide

tu obtiens un tableau que tu peux copier et coller dans excel.

Niconemo · 4 Septembre 2008

Ce qui marche (je pense que c'est ce que tu voulais dire) que si aucune cellule n'est vide sinon ça décalera tout.

Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.

magicPDF · 4 Septembre 2008

Avec Acrobat 7+ tu sélectionnes les éléments du tableau avec l'outil de sélection de texte > clic-droit > Copier sous forme d'un tableau (ou Enregistrer sous forme d'un tableau).

Il n'y a plus ensuite qu'à coller (ou importer) dans n'importe quel tableur.

:up:

da capo · 4 Septembre 2008

Niconemo a dit:
Ce qui marche (je pense que c'est ce que tu voulais dire) que si aucune cellule n'est vide sinon ça décalera tout.

Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.

C'est sur, mais pour un tableau "simple" ça passe.

magicPDF · 4 Septembre 2008

Niconemo a dit:
Il n'y a pas de solution à ça vu que les PDF n'intègrent pas les données de tabulation.

Les PDF "balisés" (tagged) intègrent ces données, ceux qui ne sont pas balisés ne les intègrent pas, tout dépend comment le PDF a été généré.

Comme toujours : il y a PDF et PDF !

Niconemo · 4 Septembre 2008

AbracadabraPDF a dit:
Les PDF "balisés" (tagged) intègrent ces données, ceux qui ne sont pas balisés ne les intègrent pas, tout dépend comment le PDF a été généré.

Comme toujours : il y a PDF et PDF !

Je m'attendais à une réaction de ta part

Donc ma phrase corrigée :

... si que le PDF n'est pas balisé et n'intègre donc pas les données de tabulation

Ça voudrait dire que le PDF a été généré exprès pour ça... peu de chance...

magicPDF · 4 Septembre 2008

Ca veut surtout dire que le PDF n'a pas été généré avec une imprimante virtuelle (Mac OSX, Distiller, PrimoPDF, etc) car elles ne retiennent pas ce type d'informations, mais plutôt par une exportation directe depuis un logiciel qui en est capable (Suites Adobe, XPress, OpenOffice, etc.).

Exception : les logiciels de MS-Office version PC lorsque la conversion en PDF se fait avec la macro-commande PDF-Maker (qui utilise Distiller mais en conservant tout un tas d'attributs supplémentaires).

Un PDF balisé est forcément en version 1.4 ou +
C'est pour ça que les PDF "prépresse" qui sont généralement en 1.3 ne contiennent pas ce balisage, bien que ce ne soit absolument pas gênant pour les RIP (sauf erreur de ma part).

nemrod · 30 Mai 2011

Quelques années plus tard

J'ai le même problème, je dispose d'un PDF produit par la chambre des notaires, listant les tarifs de l'immobilier par arrondissement mais le dit fichier n'a pas été créé "comme il faut".

Je n'y arrive pas, que ce soit manuellement ou avec Adobe Acrobat Pro. Certes je ne le maîtrise pas, c'est la machine de mon frêre, mais il n'y a pas 10 000 manières d'exporter le tableau.

J'ai même, lorsque je fais un export pour ensuite convertir les données sous Excel 2011, des pertes de "0".

Une idée ? Merci.

magicPDF · 30 Mai 2011

Acrobat X est doté d'un panneau d'outils dédiés à l'accessibilité (balisage), l'automatisme donne souvent de bons résultats : http://help.adobe.com/fr_FR/acrobat/pro/using/WS58a04a822e3e50102bd615109794195ff-7d09.w.html

:zen:

nemrod · 30 Mai 2011

Je teste, merci de ta réponse

Crigou · 18 Avril 2018

da capo a dit:
Essaie comme suit (à condition de ne pas avoir trop d'espaces dans les valeurs des cellules le résultat est ok)
nb : il va de soi qu'aucune formule n'est récupérable.

ouvre le pdf
sélectionne les valeurs du tableau
copie ces valeurs
lance word
colle les valeurs
sélectionne tout et va dans menu Tableau/convertir/texte en tableau
comme séparateur (en bas) mets un espace
valide

tu obtiens un tableau que tu peux copier et coller dans excel.

********************************
Merci da capo.
La méthode Pdf-Word-Excel fonctionne parfaitement.
Crigou.
********************************

Crigou · 18 Avril 2018

Merci da capo.
La méthode Pdf-Word-Excel fonctionne parfaitement.
Crigou.

ccciolll · 23 Avril 2018

Et sinon, on peut toujours manipuler des données massives et amassées avec des rechercher-remplacer, des caractères spéciaux ($, etc) suivi des « changer des contenus en colonne » (ou remplacer caractère spéciaux par tab dans xpress) quand certains contenus de colonnes commencent par des choses récurrentes.

Crigou · 23 Avril 2018

Merci ccciolll.
La méthode de da capo fonctionne à partir d'un simple lecteur PDF. Est-ce aussi le cas pour votre méthode ?
Merci.
Crigou.

magicPDF · 24 Avril 2018

Il y a une nouvelle fonction depuis Acrobat Pro XI, améliorée dans Acrobat Pro DC.
Menu Fichier : Exporter vers : Feuille de calcul : Classeur MS Excel

ccciolll · 24 Avril 2018

Crigou a dit:
Merci ccciolll.
La méthode de da capo fonctionne à partir d'un simple lecteur PDF. Est-ce aussi le cas pour votre méthode ?
Merci.
Crigou.

Mon bricolage marche avec du texte pur… Le texte pur peut s'extraire d'un fichier PDF pour autant qu'il ne soit pas vectorisé.
Mais mon bricolage est celui de la dernière chance. Si tu as un outil qui le fait à ta place, profites-en.

Extraire un tableau .xls d'un PDF ???

Membre confirmé

Membre supprimé 56091

Invité

Membre confirmé

Membre supprimé 56091

Invité

abonné absent

Modo (toujours vivant !)

abracadabrantesque

abonné absent

abracadabrantesque

Modo (toujours vivant !)

abracadabrantesque

Membre expert

abracadabrantesque

Membre expert

Membre enregistré

Membre enregistré

Membre expert

Membre enregistré

abracadabrantesque

Membre expert

Sujets similaires