Outils pour utilisateurs

Outils du site


linux:utf8 (lu 14994 fois)

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
linux:utf8 [04-04-2013 22:06]
127.0.0.1 modification externe
linux:utf8 [03-05-2016 14:16]
edmc73 [Fichier hybride]
Ligne 74: Ligne 74:
 |euc-kr |coréen (Unix uniquement)| |euc-kr |coréen (Unix uniquement)|
 |cp936 |chinois simplifié (Windows uniquement)| |cp936 |chinois simplifié (Windows uniquement)|
-|euc-cn |chinois simplifié (Unix uniquement)|+|euc-cn |chinois simplifié (Unix uniquement)|U+2018 (Left Single Quotation Mark)
 |cp950 |chinois classique (sur Unix, alias pour big5)| |cp950 |chinois classique (sur Unix, alias pour big5)|
 |big5 |chinois classique (sur Windows, alias pour cp950)| |big5 |chinois classique (sur Windows, alias pour cp950)|
Ligne 157: Ligne 157:
  
 Plein d'options dans le man http://linux.die.net/man/1/detox Plein d'options dans le man http://linux.die.net/man/1/detox
 +
 +===== Caractères problématiques =====
 +
 +Certains caractères issue de traitement de texte ou de système d'exploitation genre MacOS génère des caractères qui font planter les manipulations d'insertion de données dans des bases de données genre postgresql..
 +
 +Bref, il faut alors faire des rechercher/remplacer sur ces caractères spécifiques.
 +
 +Caractères spéciaux courant à rechercher
 +
 +  * U+2018 (Left Single Quotation Mark)
 +<html>&#8216;</html>
 +
 +  * U+201C (left double quotation mark)
 +<html>&#8220;</html>
 +
 +  * U+201D (right double quotation mark)
 +<html>&#8221;</html>
 +
 +  * U+AB (left double angle quotes)
 +<html>&#171;</html>
 +
 +  * U+BB (right double angle quotes)
 +<html>&#187;</html>
 +
 +  * U+2026 (horizontal ellipsis) 0xe280a6
 +<html>&#8230;</html>
 +
 +
 +On peut aussi afficher le caractère dans postgresql avec la requête
 +  select convert_from('\xe280a6'::bytea, 'utf-8');
 +si vous avez une vieille version
 +  select convert_from(E'\xe2\x80\xa6'::bytea, 'utf-8');
linux/utf8.txt · Dernière modification: 03-05-2016 14:16 de edmc73