Comment éviter la corruption d'un .docx ou d'un .pdf dans le temps ?

Pam

Une muse sur la toile
26 Septembre 2021
57
5
Bonjour,
Je suis en train de faire un gros travail de tri sur mon Mac, et je me trouve confrontée à un problème pour sauvegarder mes documents.
J'ai des milliers de documents de travail en .doc (20 ans de boulot) et une bonne partie ne s'ouvrent plus avec mon actuelle version de Word (version 2016). Je vais être obligée de passer par un vieux Macbook sur laquelle j'ai une version de Word plus ancienne pour opérer une première conversion (sous un format .doc plus récent), puis de là procéder sur mon Mac à une deuxième conversion en .docx. Des semaines de travail en perspective !
Y aurait-il une méthode plus simple ?

D'autre part, chaque conversion entraine la perte de la mise en page, et dans la plupart des cas, les documents d'une page en font deux après conversion. Impossible de refaire la mise en page de milliers de documents, et je suis un peu désespérée en me disant que toutes ces heures de boulot à peaufiner la mise en page au millimètre près sur chaque document n'ont servi à rien.
Y a-t-il moyen d'éviter la perte de la mise en page lorsque l'on passe à une version plus récente de Word ?

Enfin, pire encore : je constate que les pdf créés avec mes Mac précédents sont corrompus lorsque je les ouvre sur mon Mac actuel. Pas tous, mais un certain nombre. Des rectangles apparaissent dans le texte, la mise en page est modifiée, les images sont décalées. Je n'ai pas le problème avec Adobe, mais avec Aperçu. Pas très rassurant pour l'avenir de ces pdf...
Comment faire pour conserver la mise en page des pdf dans le temps ?

Merci par avance pour vos réponses :)
 
Pour les fichiers Word. Tu devrais pouvoir les ouvrir sur ton Mac actuel avec un autre logiciel comme Pages ou Open Office. Mais il est étrange que Word ne puisse pas les ouvrir.

Par contre, concernant la mise en page, c'est un souci propre à Word. Un fichier mise en forme avec le logiciel de Microsoft ne s'ouvrira de la même manière qu'avec l'ordinateur l'ayant créé et si celui-ci n'a pas évolué de version ou changé d'imprimante par exemple. Word n'est pas un logiciel de mise en page.

Pour les PDF, c'est plus surprenant. Mais Apperçu est connu pour poser des soucis avec les PDF. Tant qu'ils s'ouvrent correctement avec Acrobat Reader, il ne devrait pas y avoir de soucis. J'ai des PDF qui datent de largement 20 ans qui s'ouvrent toujours très bien. C'est un des rares formats à peu près pérennes en informatique.
 
  • J’aime
Réactions: Beauchadiniou
Le plus simple pour l'avenir est de tout convertir au fur et à mesure, il n'y a pas d'autre solution.
Ne pas s'alarmer sur Aperçu si Acrobat fait le job.
 
Merci beaucoup pour vos réponses.

Je viens de vérifier : mes anciens documents Word ne s'ouvrent pas non plus avec Pages. Et je n'ai pas OpenOffice. Ils ne s'ouvrent dans le meilleur des cas qu'avec TextEdit, mais dans ce cas, il n'y a plus de mise en page du tout (ni d'images ni de tableaux, je suppose).
Je vais essayer de tout reconvertir en .docx en procédant en deux étapes si pas d'autre solution.

Pour les pdf, je vais laisser comme ça.
 
Bonsoir,
Comme dit précédement, Word n'est pas un outil de mise en page, il n'a pas vocation à conserver les micro-ajustements que l'on fait sur un document. L'essentiel est qu'il conserve le contenu du document et qu'il refasse une mise en page propre même si légèrement différente de l'original. Ce devrait être le cas, je ne vois pas pourquoi tes documents DOC ne s'ouvrent pas.

Le PDF par contre est un format qui conserve la mise en page, et si tu veux assurer au maximum tu peux utiliser le format PDF/A dédié à l'archivage longue durée (mais c'est probablement excessif pour un usage privé).

Comme le PDF est difficile à modifier, le mieux est de conserver chaque document dans les 2 formats (voir y ajouter le format OpenDocument/ODT pour être tranquille :) )
 
Les documents Word trop anciens ne s'ouvrent pas avec les logiciels modernes (Les docs des années 90 par exemple). Le .doc n'est pas un format d'archivage, il faut toujours en faire une copie PDF.
 
  • J’aime
Réactions: Beauchadiniou
Les documents Word trop anciens ne s'ouvrent pas avec les logiciels modernes (Les docs des années 90 par exemple). Le .doc n'est pas un format d'archivage, il faut toujours en faire une copie PDF.
Une copie en format texte brute est même une bonne idée. Un PDF étant normalement un format figé.
 
Le problème de mes docs Word est que ce sont des documents avec beaucoup de tableaux, de caractères spéciaux et d'images, et de nombreuses polices différentes. En texte brut, je suppose que je perdrais la moitié du contenu, du coup.
Quant à doubler tous mes documents en pdf, j'y pense, mais cela va faire quelques milliers de documents en plus dans mon ordi...
 
En fait, il faut garder les documents d'un côté (texte, image, tableaux, etc.) et un PDF de la version mise en page finale. Un fichier Word n'est ni un bon système d'archivage ni un vrai outil de mise en page. La moindre modification dans les marges d'un fichier (du souvent a un changement d'imprimante ou d'ordinateur) décale tous les éléments.

Page est dans un sens meilleur pour la mise en page, même si c'est loin d'être la panacée. Les anciens fichiers étant tout simplement impossibles à ouvrir avec la dernière version du logiciel.
 
  • J’aime
Réactions: Beauchadiniou
Pour les documents très formatés, mais qui doivent être éditables et pérennes sur une longue durée, il y a les outils de type TeX/LaTex, mais il faut être très motivé pour les utiliser : https://fr.wikipedia.org/wiki/LaTeX
 
J'ai des milliers de documents de travail en .doc (20 ans de boulot)
Je viens de tester : ma version de Word (2016) ouvre très bien le Word 1997 - 2004.
Pour les versions plus anciennes de Word (du genre, Word5 ou Word6), c'est plus compliqué…
 
Il y a beaucoup d’inexactitudes racontée ici. Les documents ne sont pas « corrompus » ils ne sont simplement plus pris en compte tels quels par une version récente du logiciel dédié.

Déjà, des documents .doc il n’est pas surprenant qu’une version moderne de Microsoft Office ait des problèmes à les ouvrir.

Déjà, il s’agit d’un format binaire et non xml. Si les documents ont été créés avec une très ancienne version d’Office, il est fort possible que cela coince.

Une solution possible : ouvrir ces documents avec Microsoft Office 2008, la dernière version sur Mac à gérer les vieux .doc et enregistrer directement en .docx (format xml). Il seront compatibles avec les versions actuelles.

Si on ne dispose pas de Office 2008, la solution la plus simple est d’ouvrir ces documents avec LibreOffice — je dis bien LibreOffice et pas OpenOffice — et de les enregistrer là aussi directement en .docx.
 
Dernière édition:
Une VM, un XP, une vieille version d'Office (2003 ou 2007 ?) et ça devrait le faire pour mettre à jour les formats vers quelque chose de plus moderne.
 
Je plussoie Moonwalker :coucou: c'est LibreOffice qui dispose des meilleurs convertisseurs et ça devrait te permettre de convertir en .docx tes documents sans trop de problèmes.

Les modifications de mise en forme tiennent le plus souvent à des changements de polices (les polices qu'on utilisait il y a 20 ans ne sont souvent plus disponibles sur les machines actuelles) et d'imprimante. Et ça n'a rien de spécifique à Word, ceci dit.
 
Merci pour toutes vos réponses :)
Pour être un peu plus précise, les documents qui ne s'ouvrent pas avec Word 2016 sont des documents créés avec Word 6.0 (version de 1995). L'erreur affichée est : "[nom_fichier] utilise un type de fichier dont l’ouverture est bloquée dans cette version".
Je peux encore les ouvrir avec une vieille version de Word installée sur mon ancien MacBook : Word X (version de 1983-2001).
Mais je ne peux pas les enregistrer directement en .docx avec cette version.
La seule option possible est "Document Microsoft Word", qui les enregistre en .doc.
Je dois donc ensuite transférer les documents sur mon Mac actuel et procéder à un deuxième enregistrement, cette fois sous .docx.

D'après ce que tu me dis, Moonwalker, il faudrait donc que je récupère Word 2008 ou LibreOffice pour gagner une étape.

Et pour les documents .doc plus récents, il va falloir prendre le temps de tous les ouvrir un par un pour les enregistrer en .docx et en pdf (et encore : quel intérêt de créer des pdf si la mise en page est perdue ? ça semble déjà trop tard).
Pour répondre à Gwen, je ne pourrai pas enregistrer les tableaux à part (à moins de faire des copies d'écran, mais c'est trop galère) car j'ai créé tous mes tableaux sous Word.
 
Les modifications de mise en forme tiennent le plus souvent à des changements de polices (les polices qu'on utilisait il y a 20 ans ne sont souvent plus disponibles sur les machines actuelles) et d'imprimante. Et ça n'a rien de spécifique à Word, ceci dit.
Ce qui est assez curieux, c'est que le nombre de mots par ligne n'est plus le même, alors que le format d'impression reste inchangé, ainsi que la mise en forme du document (taille des marges) et des paragraphes, et que d'autre part la police (une police basique comme times ou arial) est la même, non condensée ni étendue, et de même taille. Bref : avec tous les réglages identiques, il y a plus de mots par ligne dans les nouvelles versions de Word. Du coup, cela décale tout. Sur un document de 300 pages, c'est la cata... Les notes de bas de page ne sont plus au bon endroit, la table des matière ne correspond plus...

Et puis, bien sûr, il y a les polices qui ne sont plus prises en charge, ou celles que je n'ai pas réinstallées, et tout le reste... (bordures des tableaux qui ne sont plus reconnues, transparence des images perdue, etc). Argh...
 
  • Wow
Réactions: Beauchadiniou
Merci pour toutes vos réponses :)
Pour être un peu plus précise, les documents qui ne s'ouvrent pas avec Word 2016 sont des documents créés avec Word 6.0 (version de 1995). L'erreur affichée est : "[nom_fichier] utilise un type de fichier dont l’ouverture est bloquée dans cette version".
Je peux encore les ouvrir avec une vieille version de Word installée sur mon ancien MacBook : Word X (version de 1983-2001).
Mais je ne peux pas les enregistrer directement en .docx avec cette version.
La seule option possible est "Document Microsoft Word", qui les enregistre en .doc.
Je dois donc ensuite transférer les documents sur mon Mac actuel et procéder à un deuxième enregistrement, cette fois sous .docx.

D'après ce que tu me dis, Moonwalker, il faudrait donc que je récupère Word 2008 ou LibreOffice pour gagner une étape.

Et pour les documents .doc plus récents, il va falloir prendre le temps de tous les ouvrir un par un pour les enregistrer en .docx et en pdf (et encore : quel intérêt de créer des pdf si la mise en page est perdue ? ça semble déjà trop tard).
Pour répondre à Gwen, je ne pourrai pas enregistrer les tableaux à part (à moins de faire des copies d'écran, mais c'est trop galère) car j'ai créé tous mes tableaux sous Word.
Concernant le Word 6 je peux te confirmer d’expérience que 1. Office 2008 est la dernière version à le gérer et que la conversion directement en .docx s’y passe très bien ; 2. à défaut, LibreOffice fera aussi l’affaire.
J’avais moi-même ce type de documents jadis et je les ait convertis depuis en .docx ou en .odt. Idem pour mes tableurs issus de Excel 5.

Normalement les .doc plus récents ne devraient pas poser de problèmes avec Microsoft Office 2016 et suivants. LibreOffice les gère aussi assez bien.

L’avantage de ce dernier est qu’il est disponible gratuitement :

J’ai récupéré des trucs encore plus ancien que du Word 6 grâce à LibreOffice.

Du moment où tu n’as pas besoin du document, inutile de t’inquiéter. Tu peux les convertir « à l’occasion » et ajuster ce qui doit l’être.
 
Dernière édition:
Ce qui est assez curieux, c'est que le nombre de mots par ligne n'est plus le même, alors que le format d'impression reste inchangé, ainsi que la mise en forme du document (taille des marges) et des paragraphes, et que d'autre part la police (une police basique comme times ou arial) est la même, non condensée ni étendue, et de même taille. Bref : avec tous les réglages identiques, il y a plus de mots par ligne dans les nouvelles versions de Word. Du coup, cela décale tout. Sur un document de 300 pages, c'est la cata...
Disons que c'est assez complexe. Même quand ce sont les mêmes polices, elles ont changé. Et les outils logiciels qui permettent l'affichage ont changé. Entre autres par souci de compatibilité entre les versions Mac et Windows pour ce qui concerne Word. Mais aussi parce que le passage à Mac OS X a été un changement complet de l'environnement (et toute la force d'Apple a été de rendre cette véritable révolution quasiment transparente pour l'utilisateur).

Les notes de bas de page ne sont plus au bon endroit, la table des matière ne correspond plus...
Ça m'étonne un peu. S'il s'agit bien des notes de bas de page gérées par Word, elles devraient s'adapter. Même chose pour les tables des matières.
 
L'erreur affichée est : "[nom_fichier] utilise un type de fichier dont l’ouverture est bloquée dans cette version".
Sur Windows il y a une option pour débloquer l'ouverture des fichiers Word 6 (et jusqu'à Word 2), mais je ne crois pas que ce soit possible sur Word Mac.