0

我从网站的早期版本(它是一个自定义 CMS)中获得了数据,并希望将其设置为可以将其导入我的 Wordpress 网站的状态。

就是我正在做的事情 - http://www.teamworksdesign.com/clients/ciw/datatest/index.php如果向下滚动到第 187 行,数据开始失败(应该有一条红色消息)并显示以下错误消息:

致命错误:在 /home/teamwork/public_html/clients/ciw/datatest/index.php:132 中未捕获的异常“异常”和消息“字符串无法解析为 XML” 堆栈跟踪:#0 /home/teamwork/public_html/客户端/ciw/datatest/index.php(132): SimpleXMLElement->__construct('

谁能看到问题是什么以及如何解决?

这就是我输出日期的方式:

<!DOCTYPE html>
<html>
<head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
</head>
<body>

<?php


ini_set('memory_limit','1024M');

ini_set('max_execution_time', 500); //300 seconds = 5 minutes

echo "<br />memory_limit: " .  ini_get('memory_limit') . "<br /><br />";
echo "<br />max_execution_time: " .  ini_get('max_execution_time') . "<br /><br />";

libxml_use_internal_errors(true); 

$z = new XMLReader;
$z->open('dbo_Content.xml');

$doc = new DOMDocument;
$doc->preserveWhiteSpace = false;

// move to the first <product /> node
while ($z->read() && $z->name !== 'dbo_Content');

$c = 0;

// now that we're at the right depth, hop to the next <product/> until the end of the tree
while ($z->name === 'dbo_Content')
{

    if($c < 201) {

        // either one should work
        $node = simplexml_import_dom($doc->importNode($z->expand(), true));

        if($node->ClassId == 'policydocument') {

            $c++;

            echo "<h1>Row: $c</h1>";

            echo "<pre>";

            echo htmlentities($node->XML) . "<br /><br /><br /><b>*******</b><br /><br /><br />";

            echo "</pre>";

            try{ 
                $xmlObject = new SimpleXMLElement($node->XML);

                foreach ($xmlObject->fields[0]->field as $field) {

                    switch((string) $field['name']) {
                        case 'parentId':
                            echo "<b>PARENT ID: </b> " . $field->value . "<br />";
                            break;
                        case 'title':
                            echo "<b>TITLE: </b> " . $field->value . "<br />";
                            break;
                        case 'summary':
                            echo "<b>SUMMARY: </b> " . $field->value . "<br />";
                            break;
                        case 'body':
                            echo "<b>BODY:</b> " . $field->value . "<br />";
                            break;
                        case 'published':
                             echo "<b>PUBLISHED:</b> " . $field->value . "<br />";
                             break;
                    }
                }

                echo '<br /><h2 style="color:green;">Success on node: '.$node->ContentId.'</h2><hr /><br />';           

            } catch (Exception $e){ 
                echo '<h2 style="color:red;">Failed on node: '.$node->ContentId.'</h2>'; 
            }

        }

        // go to next <product />
        $z->next('dbo_Content');

    }


} ?>

</body>
</html>
4

1 回答 1

1

您收到的错误消息“ String could not be parsed as XML ”意味着 XML 解析器在输入数据中发现了无效 XML 的内容。

您还没有向我们展示数据,所以我不能确切地告诉您什么是无效的,但是其中的某些内容不符合 XML 解析的严格规则。这有很多可能的原因。

如果我不得不伸出脖子猜测,我会说文件中间出现错误 XML 的最常见原因是&在它应该是&amp;实体代码时未转义。

任何使用适当的 XML 编写器创建 XML 的人都不应该有这个问题,但是我遇到过很多情况,人们不费心使用 XML 编写器,只是将原始 XML 输出为文本而忘记转义实体,这意味着数据没有问题,直到您找到一个包含 的公司名称&

如果它就这么简单,而且是一次性导入,那么您可以在文本编辑器中手动修复文件。

然而,这只是一个猜测。您需要亲自检查 XML 文件才能发现问题。如果您无法直观地看到问题,我建议使用 GUI XML 工具来分析文件。

希望有帮助。

[编辑]

好的,我只是更好地查看了您提供的链接中的数据,并且事情像拇指一样突出......

encoding="utf-16"

我注意到所有有效的数据都使用 UTF-8,所有失败的数据都使用 UTF-16。

PHP 通常可以使用 UTF-8,但它不能很好地处理 UTF-16。所以很明显这是你的问题。

而且,老实说,真的没有必要使用 UTF-16,所以这里的解决方案是为所有内容切换到 UTF-8 编码。

这对你来说有多容易,我不能说,但最坏的情况是我相信你可以找到一个批量转换工具。

希望有帮助。

于 2013-11-11T10:16:07.753 回答