Outils pour utilisateurs

Outils du site


linux:utf8 (lu 6756 fois)

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
linux:utf8 [19-05-2014 15:05]
edmc73
linux:utf8 [03-05-2016 14:16] (Version actuelle)
edmc73 [Fichier hybride]
Ligne 158: Ligne 158:
 Plein d'options dans le man http://linux.die.net/man/1/detox Plein d'options dans le man http://linux.die.net/man/1/detox
  
-===== Fichier hybride =====+===== Caractères problématiques =====
  
-Dans le cas de fichier mixte ou on retrouve plusieurs encode dufférent, le système est complètement perdu.+Certains caractères issue de traitement de texte ou de système d'exploitation genre MacOS génère des caractères qui font planter les manipulations d'insertion de données dans des bases de données genre postgresql..
  
-Il faut alors faire des rechercher/remplacer sur des caractères spécifique souvent issue de Mac ou pas.+Bref, il faut alors faire des rechercher/remplacer sur ces caractères spécifiques.
  
-Caractères spéciaux à rechercher+Caractères spéciaux courant à rechercher
  
   * U+2018 (Left Single Quotation Mark)   * U+2018 (Left Single Quotation Mark)
-+<html>&#8216;</html>
  
-(d'autre suivront au fure et à mesure que je galère..)+  * U+201C (left double quotation mark) 
 +<html>&#8220;</html> 
 + 
 +  * U+201D (right double quotation mark) 
 +<html>&#8221;</html> 
 + 
 +  * U+AB (left double angle quotes) 
 +<html>&#171;</html> 
 + 
 +  * U+BB (right double angle quotes) 
 +<html>&#187;</html> 
 + 
 +  * U+2026 (horizontal ellipsis) 0xe280a6 
 +<html>&#8230;</html> 
 + 
 + 
 +On peut aussi afficher le caractère dans postgresql avec la requête 
 +  select convert_from('\xe280a6'::bytea, 'utf-8'); 
 +si vous avez une vieille version 
 +  select convert_from(E'\xe2\x80\xa6'::bytea, 'utf-8');
linux/utf8.txt · Dernière modification: 03-05-2016 14:16 de edmc73