我HTML::TreeBuilder::XPath
用来解析复杂的 HTML 文档,然后对其进行编辑,然后再将其写回磁盘。我遇到的问题是,当我尝试解析 HTML 内容( )时,它拒绝<link...>
了块内的标签:<body>
$tree->parse_content($page);
HTML::Parse:
<link>
正文中的标题元素
我知道这些在 HTML5 之前是非法的,现在看来它们是合法的。有没有人知道一种方法来告诉树生成器这是合法的,或者只是让它接受它,即使它会发出警告。这些没有进入输出阶段,并且弄乱了布局。