25/10/2007 @ 14:20:24: kortenberg: caractères spéciaux
J'ai un fichier xml indiqué comme de l'utf-8 (BOM et encoding="utf-8") mais qui ne l'est pas vraiment.
J'ai les caractères "E7 9F 8D" qui ne sont pas compréhensible (la valeur désiré est "é M" ou "e9 20 4d" en latin1 ) .
gVim et wordpad arrive à les décoder mais notepad, ultraedit et moi n'arrivons à le faire.
Le problème c'est que de dois récuper ce genre de fichier plusieurs fois par jour et les inclure automatiquement dans une db.
Lachez les comz
25/10/2007 @ 14:24:10: zion: caractères spéciaux
notepad ouvrira ton fichier en UTF-8 si il y a le header kivabien dans ton fichier texte.
Ouvre un fichier texte avec notepad, demande lui de le sauver explicitement en UTF-8, tu verras qu'il y a un byte en plus.
Parce que notepad supporte très bien l'utf-8
25/10/2007 @ 14:33:58: kortenberg: caractères spéciaux
ce n'est justement pas de l'utf-8.
j'ai 3 caractères (E7 9F 8D) qui code 3 caractère (é M)
PS: un fichier texte n'a pas de headerQuiVaBien puisqu'il n'y a pas de header. Le seul header c'est 3 caractères au début mais qui ne sert que pour l'unicode(c'est ça le BOM Byte Order Mark)
25/10/2007 @ 14:42:33: zion: caractères spéciaux
Ok donc ton XML est tout foireux il est mal encodé, youpie
Tu peux toujours passer par un logiciel kivabien pour changer l'encodage du fichier, il s'en fout lui que c'est du WinIso alors qu'il est écrit dans le XML que c'est de l'UTF-8
Non?
25/10/2007 @ 14:48:28: kortenberg: caractères spéciaux
le problème c'est que je ne sais pas ce que c'est comme encodage. C'est pas de l'utf-8 et pas de l'iso 8859.
De plus, l'espace est encodé avec deux codes différents !? (20 "normal" et 9F "annormal")
25/10/2007 @ 14:58:06: kortenberg: caractères spéciaux
c'est bien ce que je dis, c'est un encodage àLaCon.