0

有一天我在测试我的 PHP Tidy 配置,发现它无法处理来自Guardian 的任何页面。

我的配置是:

$tidy_config = array(
    'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
    'new-empty-tags' => 'source track',
    'new-inline-tags' => 'audio canvas embed video',
    'wrap' => 0,
    'markup' => false,
);

$tidy->body()输出一个空的主体,而我注意到$tidy->html()输出不包含原始的</head>(存在于源中),而是将它移到最后(好像它是由 Tidy 本身添加的)。

我已经测试了 Guardian 头版和一些新闻/专栏页面,同样的问题。在我的测试中,此配置适用于 BBC 或其他网站,至少我不希望它返回空body或移动结束head标签。

谁能弄清楚为什么?

PS:我的 Tidy 发布版本是25 March 2009,据我所知是最新版本

4

1 回答 1

0

Sourceforge 上的 Tidy 票证系统中有一个功能请求,请求支持 HTML5。Guardian 页面使用 HTML5。

另一方面,我想说 Tidy 不再被积极开发。CVS 存储库中的所有提交都已有多年历史,最新的提交位于 21 个月前的实验目录中,改变了有关 HTML5 的一些内容。Github 也有一个分支,最后一次提交是一年前。https://github.com/w3c/tidy-html5你可以尝试编译它。

于 2013-10-30T07:40:53.443 回答