我想解析一个 Html 并将结果作为一个字符串。鉴于外部 Html 的主体包含另一个 Html 字符串,我希望将内部 Html 作为输出字符串。
示例> 输入 HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html><head></head><body><p><!DOCTYPE html><br /><html><br /><body><br /><br /><h1>My First Heading</h1><br /><br /><p>My first paragraph.</p><br /><br /></body><br /></html><br /><br /></p></body></html>
输出字符串:
<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
重要提示:我正在使用 HTML 编辑器,如果我在其中输入内容,它会在执行 getText 时返回该输入的 HTML 表示,上面的第一个 Html 字符串仅是该表示。
此外,输出字符串应该与我在这里运行第一个字符串时相同(http://www.w3schools.com/html/tryit.asp?filename=tryhtml_basic)
请帮我解决一下这个。