2

使用这个简单的 PHP 代码:

$xmlWriter = new XMLWriter();
$xmlWriter->openURI('php://output');
$xmlWriter->startDocument('1.0', 'utf-8');

$xmlWriter->writeElement('test', $data);

$xmlWriter->endDocument();
$xmlWriter->flush();

XMLWriter 类有一个很好的特性:它将您提供给它的任何数据转换为输出编码。例如这里它将转换$data为 UTF-8,因为我传入'utf-8'startDocument函数。

问题是,在我的情况下,内容$data来自输出格式为 UTF-8 的数据库,因此已经在 UTF-8中。XMLWriter可能认为数据在 ISO-8859-1 中并再次将其转换为 UTF-8,我在应该得到重音符号的地方得到奇怪的符号。

目前我正在使用utf8_decode来自数据库的每个字符串,这意味着我正在从 UTF-8 转换为 ISO-8859-1,然后 XMLWriter 将其转换回 UTF-8。

这有效但不干净:

$xmlWriter->writeElement('test', utf8_decode($data));

有更清洁的解决方案吗?

编辑:显示一个完整的例子

$xmlWriter = new XMLWriter();
$xmlWriter->openURI('php://output');
$xmlWriter->startDocument('1.0', 'utf-8');
$xmlWriter->startElement('usersList');

$database = new PDO('mysql:host=localhost;dbname=xxxxx', 'xxxxx', 'xxxxx');
$database->exec('SET CHARACTER SET UTF8');
$database->exec('SET NAMES UTF8');
foreach ($database->query('SELECT name FROM usersList') as $user)
   $xmlWriter->writeElement('user', $user[0]);   // if the user's name is 'hervé' in the database, it will print 'hervé' instead

$xmlWriter->endElement();
$xmlWriter->endDocument();
$xmlWriter->flush();
4

1 回答 1

7

我不确定你从哪里得到XMLWriter转换编码的想法。它没有。您必须为它提供 utf-8。它可以输出不同的编码,但输入字符串必须是utf-8。

这里可能会发生两件事之一:

  1. 无论您使用什么来查看输出文档,都将字符串解释为 win-1252。如果您在浏览器中查看输出,则可能需要像这样设置内容类型标头:header('Content-Type: application/xml; charset=UTF-8');
  2. 您将数据错误地存储在数据库中,并且您的“é”实际上是两个 unicode 字符“é”。解决这个问题很困难。
于 2012-04-16T14:54:20.283 回答