Encodage des textes à téléchargé pour site internet

SassaM

Membre junior
4 Novembre 2013
14
0
44
Bonjour,

Cela fait un moment que cherche une solution à mon problème qui est devenu désormais une urgence.

Je suis amenée à fournir des textes pour des sites internet, c-à-d, que j'enregistre des textes sous TextEdit au format .txt et encodage UTF 8 et je les télécharge via Filezilla sur les serveurs ftp des prestataires des sites.
Mon problème est que lorsque les textes sont sur les sites ils apparaissent avec des caractères indésirables, du genre :

sur un 1er site :
Vous êtes sûr de connaître Paris sur le bout du pied ? ...Paris comblera toutes vos envies : marcher dans une ruelle fleurie, boire de l’eau puisée à 587 m, faire bénir votre animal favori, vendanger, participer à l’élection des 12 meilleurs avocats de l’année, jouer à la pelote basque, vous initier à l’astronomie,...

sur un 2ème site avec le même fichier texte ce sont les apostrophes qui sautent :
Vous êtes sûr de connaître Paris sur le bout du pied ?... boire de l?eau puisée à 587 m, faire bénir votre animal favori, vendanger, participer à l?élection des 12 meilleurs avocats de l?année, jouer à la pelote basque, vous initier à l?astronomie, rencontrer des artistes dans leur atelier? Paris vous invite ...

Avez-vous une solution ? J'ai vu des choses sur l'encodage UTF-8 sans BOM mais sous mac comment fait-on ? script ? Application ?

Merci d'avance pour votre aide.
 

Polo35230

Membre d’élite
Club MacG
4 Janvier 2011
1 657
97
Bonjour,

Je n'ai pas la solution, mais l'UTF8 sans BOM m'a intrigué.
J'ai configuré TextEdit avec "Format texte" dans "Nouveau document" et UFT8 dans "Ouverture et enregistrement"
Ensuite, j'ai créé un fichier, et je l'ai passé dans un éditeur hexa (HexEdit) pour voir. Et bien, il n'y aucun caractère inséré en début de fichier.
Comme c'est ce qui caractérise un fichier avec BOM, j'en conclus que l'enregistrement en UTF8 de TextEdit se fait donc sans BOM.
Donc, le fichier d'origine doit être exploitable à l'autre bout.

Il faudrait peut-être essayer de transmettre les fichiers en binaire, pour voir si ça change quelque chose...

Mais bon, c'est un peu compliqué pour moi, ça...:siffle:

Grillé par edd pour filezilla...
 
Dernière édition:

SassaM

Membre junior
4 Novembre 2013
14
0
44
Merci pour vos réponses.
Je suis en mode de transfert automatique et lorsque je regarde dans ma fenêtre de transfert il est reconnaît en Type de fichier : ASCII Text.

C'est ok ou il faut que je change mes paramètre en binaire ?
 

SassaM

Membre junior
4 Novembre 2013
14
0
44
Je viens de faire un transfert avec un fichier texte encodé en Occidental (windows latin1) enregistrés sous TextEdit.
Je vois le résultat demain matin et si ce n'est pas concluant je fais l'essai en binaire et je vous tiens au courant. Merci.
 

SassaM

Membre junior
4 Novembre 2013
14
0
44
Je fais l'essai ce soir de l'UTF8 transféré en binaire car mon précédent essai n'était effectivement pas concluant. Je vous tiens au courant.
Merci.
 

Polo35230

Membre d’élite
Club MacG
4 Janvier 2011
1 657
97
En encodant le fichier en UTF8, et en transferant en binaire, on est sûr qu'il ne sera pas altéré pendant le transfert.
Après, il faut aussi que l'encodage utilisé par la page web soit également UTF8...

Ce qu'il faudrait savoir, c'est l'encodage utilisé par les pages web sur le serveur, et dans Textedit, enregistrer avec l'encodage désiré, et transmettre le fichier en binaire.

Il semblerait (mais je ne suis pas un développeur web) que l'encodage utilisé soit UTF8, mais aussi (pour le français) l'ISO-8859-1, ce qui correspond à "ISO Latin 1".

Donc, si UTF8 ne marche pas, il faudrait essayer (dans Textedit) d'enregistrer en ISO Latin 1, et de transférer en binaire.
 

SassaM

Membre junior
4 Novembre 2013
14
0
44
Malgré un texte encodé en UTF-8 sous TextEdit et un transfert en binaire via Filezilla, mon texte garde des caractères indésirables.
Du coup j'essaie un encodage de mon texte en UTF-8 sans BOM (obligée de passer par un PC sur le logiciel notepad++, car cela n'existe pas sur mac) et je transfère le fichier toujours en binaire.
On va voir si cela fonctionne... Je désespère...:(
 

Polo35230

Membre d’élite
Club MacG
4 Janvier 2011
1 657
97
J'espère me tromper, mais je crois que ça fera pareil...
Je crois que l'UFT8 de Textedit est sans BOM

Voilà un fichier encodé UFT8. et analysé avec un éditeur hexa.
Le fichier est composé uniquement de caractères é (codés C3 A9 en UFT8)
C3 A9 C3 A9 C3 A9 C3 A9 C3 A9 C3 A9 C3 A9 C3 A9

Si ce fichier était avec BOM, il devrait y avoir FE FF devant...

Si ce n'est pas confidentiel, peux-tu mettre un lien vers un de tes sites qui pose pb.
Avec l'inspecteur web (onglet "Développement" de Safari), on verra peut-être l'encodage utilisé par ces pages web, et les spécialistes du forum pourront t'aider.
 

SassaM

Membre junior
4 Novembre 2013
14
0
44

Polo35230

Membre d’élite
Club MacG
4 Janvier 2011
1 657
97
Comme je l'ai déjà dit, je ne suis pas développeur web...:confused:
Dans l'inspecteur web, on voit (sur sur les deux sites) que le texte est déjà altéré dans le code source.
Google renvoie pléthore de sujets sur ce pb.
Tout tourne autour de l'encodage (UTF8 ou ISO-8859-1)
Certains préconisent de passer (pour les caractères accentuées) par leur valeur en octal pour éviter les pbs...

As-tu essayé d'encoder en ISO-8859-1 (ISO Latin 1 dans textedit)?
Parce que dans l'inspecteur web (pour ton premier site), dans propriétés, il y a: defaultCharset: "iso-8859-1"
Mais bon, je n'y connais pas grand chose.

Je pense que c'est plus un pb de développement que de réseau.
Tu devrais poser aussi ton sujet sur le forum dans la partie "Développement web". Les compétences sont là bas. Donc la solution devrait y être aussi.:)
 
Dernière édition:

SassaM

Membre junior
4 Novembre 2013
14
0
44
Ok. Merci pour ton aide Polo35230. Je vais voir mardi comment se comporte le texte en UTF-8 sans bom et en transfert binaire.
Sinon je verrais avec les développeurs.

Bon week-end...;)
 

GaUgAu

Membre confirmé
10 Mai 2013
128
9
Malgré un texte encodé en UTF-8 sous TextEdit et un transfert en binaire via Filezilla, mon texte garde des caractères indésirables.
Du coup j'essaie un encodage de mon texte en UTF-8 sans BOM (obligée de passer par un PC sur le logiciel notepad++, car cela n'existe pas sur mac) et je transfère le fichier toujours en binaire.
On va voir si cela fonctionne... Je désespère...:(



Je n'ai pas la solution a ton problème, mais l'utilisation de TextWrangler ( sous mac, gratuit, disponible depuis l'apple store) ne permettrait pas de faire la même chose que ce que tu dois faire sous notepad++ sans avoir à vitualiser/booter sous windows ?
 

SassaM

Membre junior
4 Novembre 2013
14
0
44
Je n'ai pas la solution a ton problème, mais l'utilisation de TextWrangler ( sous mac, gratuit, disponible depuis l'apple store) ne permettrait pas de faire la même chose que ce que tu dois faire sous notepad++ sans avoir à vitualiser/booter sous windows ?


Ok. merci pour le tuyau. Je viens de le télécharger mais je n'ai que le format UTF-16 sans BOM et non le UTF-8 sans BOM.
J'ai quand même fait un essai. On verra le résultat demain.
En effet tout ce que j'ai essayé ne fonctionne pas, du coup je vais du côté des développeurs web, peut-être auront-il une solution...