背景:
我正在使用 HTML::TreeBuilder 解析整个 html 页面,为了参考而说“whole_page”。然后,我使用新 TreeBuilder 对象的继承 parse_content 方法(与 whole_page 相同)来解析一大块 html,例如“html_to_insert”。html_to_insert 的根元素应该是一个<div>
标签。最终,需要将 html_to_insert 树插入到 whole_page 树中。
问题:
html_to_insert 树用<html>
,<head>
和<body>
标签包装,我显然不需要。我查看了 HTML::Parser 以查看是否有可能解决问题的参数,但我找不到任何东西。
问题:
有没有一种简单的方法可以阻止 parse 方法用不需要的标签包装 html_to_insert?知道我要做什么,我是不是倒着做这个屁股(有没有更好的方法)?
谢谢你的帮助。