Editeur/TTX pour gros fichier volumineux !?

Mediterranneo

Membre actif
10 Mai 2005
387
11
44
Bonjour,

Ayant à ma charche un fichier texte très volumineux, 444 kb environ, j'aimerais savoir si vous pouvez me conseiller un traitement de texte très puissant et en français si-possible pour "nettoyer" un fichier qui se présente ainsi:

> = tabulations (invisible)

[email protected] > > > > > > > > > > > > > > > > [email protected] > > > > > > > > > > > > > > > > > > > > > > [email protected] > > > > > > > > > > > > > > > > > > > > > > > > > > > > >> > > > > > > > > > > >> > >> > > > > > > > > > > > > > > > > >> > > > > >


[email protected]

Avec des retours à la ligne, tabulations, etc...

Il me faudrait idéalement avoir cette présentation:


Avec Word, ça plante (peut-être à cause de mon "vieux" Mac > G4/450mhz)
Avec TexEdit, ça me semble limité pour effectuer des opérations de:

RECHERCHER ET REMPLACER

Et BBEdit, qui à l'air très bien, mais en anglais - et ne comprends pas tous les avantages de ce programme qui pourrait certainement me venir au secours.

J'ai même essayé de "copier/coller" le contenu du fichier "source" de TextEdit sur Xpress (mais après des opérations de "rechercher/remplacer" - ça mouline dans le vide.

J'aimerais surtout savoir si des tâches répétitives de RECHERCHER/REMPLACER sont disonibles et que mon petit G4 tient la route avec ça.

Autrement, s'il y a pas d'autres programmes, je devrai attendre d'être au boulot; super G5 qui lui, ne perd pas son temps à mouliner dans le "vide" ;) !

Pour informations et pour que vous voyez de quoi il s'agit un peu; je vous joins un "échantillon" de mon fichier TexEdit ci-dessous.

En espérant avoir une réponse et une voie d'issue de votre part, recevez, mes meilleures salutations à tous.

Et excellent week-end B)

P.S. Oui, c'est pour réaliser un envoie en masse, mais LEGALEMENET!
Ce n'est pas du spams, j'avais déjà discuté de cela dans un autre topic; de plus, j'ai le feu vert de mon fournisseur d'accès et ceux qui ne veulent pas recevoir l'échantillon PDF en question, et à ceux qui ont marqué un * avant leur "e-mail" - seront retirées (le nettoyage est également valable pour eux).
 
Mediterranneo a dit:
Bonjour,

Ayant à ma charche un fichier texte très volumineux, 444 kb environ, j'aimerais savoir si vous pouvez me conseiller un traitement de texte très puissant et en français si-possible pour "nettoyer" un fichier qui se présente ainsi:

> = tabulations (invisible)



Avec des retours à la ligne, tabulations, etc...

Il me faudrait idéalement avoir cette présentation:



Avec Word, ça plante (peut-être à cause de mon "vieux" Mac > G4/450mhz)
Avec TexEdit, ça me semble limité pour effectuer des opérations de:

R.

Même avec ton "vieux" Mac, il n'y a pas de raison que ça plante avec Word.

Ce que tu peux faire c'est utiliser Spécial dans [rechercher /remplacer] et remplacer 10 tab par un espace et recommencer jusqu'à ce que ta rechercher soit négative ; puis recommencer avec 9 tab et ainsi de suite jusqu'à 1. Tu nettoies ensuite les espaces de la même manière (remplacer 10, 9 ... espaces par 1) et tu finis en remplaçant le dernier espace par un retour chariot.

Si ton fichier est vraiment trop long, tu peux toujours le segmenter en plusieurs blocs ou utiliser la procédure décrite sur une sélection préalable de texte. Si ça plante sur une selection d'une page par exemple c'est que le problème est ailleurs et n'est pas lié à la puissance de ton Mac.
:cool: :cool: :cool:
 
Salut, je te propose une méthode, un peu fastidieuse mais qui fonctionne à l'aide de TextWrangler (version gratuite de BBEdit, donc cela doit fonctionner chez toi).
Les caractères à éliminer sont les tabulations codées \t, les retours chariot \r et les anti slashs
Ouvrir le fichier dans TextWrangler.
Commencer par sélectionner tout le texte

Pomme F => remplacer \ par rien. (tout remplacer) on élimine les antislashs
Pomme F => remplacer \t par rien (tout remplacer) on élimine les tabulations
Pomme F => remplacer \r par +++ (tout remplacer) on remplace les retours charriot par 3 +++ Le texte tient sur une seule ligne.

Puis jusqu'à épuisement des changements :
Pomme F => remplacer ++++++ par +++ (tout remplacer)

Et enfin pour terminer on remplace les +++ par des sauts de ligne :
Pomme F => remplacer +++ par \r

Pour terminer on élimine les en-tête et fin de fichier et on enregistre au format texte.
 
Peut-être Ragtime.
Mais quel que soit le soft, tu vas avoir un problème, toutes ces adresses vont être collées les unes aux autres :sick:. Je ne vois pas de critère de recherche/remplace qui n'élimine que les "marques de paragraphes" non collées au texte.
Tu n''aurais quand même pas meilleur temps à le faire manuellement ?
 
Hello tout le monde,

Petite question suite au mailing (fichier texte réalisé)

Existe-t-il un moyen de trouver tous les doublons sans les connaître? Et ainsi les effacer...

Du genre;

[email protected]
[email protected]

Il va de soi, que je ne vais pas vérifier si le mailing liste est "propre" - mais il se peut qu'il y ait des doublons ici et là...

Sur plus de 10'000 e-mails, on ne va pas les vérifier un par un ;)
 
Mediterranneo a dit:
Existe-t-il un moyen de trouver tous les doublons sans les connaître? Et ainsi les effacer...
Cela doit être possible en utilisant les expressions régulières.

.*(@toto\.fr.*){2,} par exemple permet de repérer si le domaine toto.fr a deux occurences au moins