[RCH] Outil de conversion HTML -> txt

thunderheart

Membre expert
Club iGen
16 Mai 2009
5 004
432
Lorient
Bonsoir,

je recherche un outil de conversion HTML-> txt.
J'ai essayé html2text des macports mais le résultat ne me convient pas.

Merci pour votre aide.
 
Lequel ? Html2Text, Html2Text ou bien Html2Text (il y en a peut-être bien d'autres, je n'ai pas vraiment cherché) ? Et qu'est-ce que tu lui (leur) reproches ?


----------------------
Note du modérateur (Aliboron aussi, mais avec sa casquette verte, pour le coup) :
Il est ici question d'internet. Donc, comme on a bien entendu lu au préalable le message de Pascal77 en tête de ce forum ou/et la table d'orientation, on déménage vers "Internet et réseau". Et hop !!!
 
Bonsoir,

Avec textutil

Ex :
Bloc de code:
/usr/bin/textutil ~/file_path.html -convert txt -format html -output ~/file_path.txt
 
Bonjour,

Lequel ? Html2Text, Html2Text ou bien Html2Text (il y en a peut-être bien d'autres, je n'ai pas vraiment cherché) ? Et qu'est-ce que tu lui (leur) reproches ?

J'ai essayé celui-ci et aussi celui des Macports.
Tous produisent un fichier txt en sortie mais avec pas mal de codes qui traînent. Une édition du résultat avec Vim :)set list pour voir en plus les caractères spéciaux) montre que chaque outil fonctionne à un certain degré.

Bonsoir,
Avec textutil
Ex :
Bloc de code:
/usr/bin/textutil ~/file_path.html -convert txt -format html -output ~/file_path.txt

textutil marche pas trop mal non plus.

Chaque outil a ses plus et ses moins et un petit coup de sed, grep & awk devrait l'faire :D

Merci pour votre aide.