0

我正在尝试将带有特殊引号符号的 utf-8 字符串转换为 Latin1。代码在 Windows 上完美运行,但省略了 g++ (Ubuntu 5.4.0-6ubuntu1~16.04.4) 5.4.0 上的符号

字符串:Latin1:APOST ( ' ) QUOTE ( " ) ( « » )
Windows:Latin1:APOST ( ' ) QUOTE ( " ) ( < > )
Ubuntu:Latin1:APOST ( ) QUOTE ( ) ( )

转换后的字符串的十六进制表示:

HW: 41 50 4F 53 54 20 28 20 27 20 29 20 51 55 4F 54 45 20 28 20 22 20 29 20 28 20 3C 20 3E 20 29
HU: 41 50 4F 53 54 20 28 20    20 29 20 51 55 4F 54 45 20 28 20    20 29 20 28 20    20    20 29

  const unsigned char utf8[] = { 0x41, 0x50, 0x4f, 0x53, 0x54, 0x20, 0x28, 0x20, 0xe2, 0x80, 0x98, 0x20, 0x29, 0x20, 0x51, 0x55, 0x4f, 0x54, 0x45, 0x20, 0x28, 0x20, 0xe2, 0x80, 0x9c, 0x20, 0x29, 0x20, 0x28, 0x20, 0xc2, 0xab, 0x20, 0xc2, 0xbb, 0x20, 0x29, 0x00 };

  boost::locale::generator loc_g;
  std::string ansi0 = boost::locale::conv::from_utf<char>((const char*)utf8, loc_g.generate("Latin1"));

  printf("Latin1: %s", ansi0.c_str());

如何获得类似于 Windows 的 Ubuntu 结果?

使用 iconv 在 Ubuntu 上的结果

ASCII:      APOST ( ' ) QUOTE ( " ) ( << >> )
Latin1:     APOST ( ` ) QUOTE ( " ) ( . . )
ISO-8859-1: APOST ( ` ) QUOTE ( " ) ( . . )
4

0 回答 0