有一天我在测试我的 PHP Tidy 配置,发现它无法处理来自Guardian 的任何页面。
我的配置是:
$tidy_config = array(
'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
'new-empty-tags' => 'source track',
'new-inline-tags' => 'audio canvas embed video',
'wrap' => 0,
'markup' => false,
);
$tidy->body()
输出一个空的主体,而我注意到$tidy->html()
输出不包含原始的</head>
(存在于源中),而是将它移到最后(好像它是由 Tidy 本身添加的)。
我已经测试了 Guardian 头版和一些新闻/专栏页面,同样的问题。在我的测试中,此配置适用于 BBC 或其他网站,至少我不希望它返回空body
或移动结束head
标签。
谁能弄清楚为什么?
PS:我的 Tidy 发布版本是25 March 2009
,据我所知是最新版本。