0

有一个简单的 PHP 脚本,它解析 XML 文档并显示项目的属性(属性是俄语,XML 文件使用“utf-8”字符集):

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body>
<?php
    //header('Content-Type: text/html; charset=utf-8');
    $xml=simplexml_load_file('output.xml');
    echo $xml['moves'];
?>
</body>
</html>

我的 XML:

<?xml version="1.0" encoding="UTF-8"?>
<game moves="Папа"> 
<a attr="2">123</a>
</game> 

使用此代码,我只看到“Папа”而不是“Папа”俄语文本。但如果我删除所有 HTML 并通过 header() PHP 方法设置字符集,它将正常工作!我该如何解决?

4

2 回答 2

0

当创作文档是 HTML 或 XHTML 时,添加 Doctype 声明很重要。它可能会解决你的问题

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
        "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
于 2013-03-09T13:13:03.543 回答
0

如果您不确定,您应该始终仔细检查。让我们这样做。

首先检查 XML 文件是否实际上是UTF-8 编码的

其次,最后检查您生成的 HTML 是否实际上是 UTF-8 编码的。

这是您上面的示例,其中包含以下两项检查:

<?php
ob_start();
?>
    <html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    </head>
    <body>
    <?php
    $buffer = file_get_contents('output.xml');
    if (!preg_match('//u', $buffer)) {
        throw new Exception("XML file is not UTF-8 encoded!");
    }

    $xml = simplexml_load_string($buffer);
    echo $xml['moves'];
    ?>
    </body>
    </html>
<?php
$buffer = ob_get_clean();
if (!preg_match('//u', $buffer)) {
    throw new Exception("HTML is not UTF-8 encoded!");
}
?>
于 2013-03-09T13:27:00.583 回答