2

当我使用 HtmlUnit 运行 page.asXml() 时,我丢失了页面的文档类型。有解决办法吗?

注意:目的是为 Google 提供 DOM。

4

1 回答 1

0

试着打电话

p.getWebResponse().getContentAsString() 

代替

p.asXml()

我只是针对http://google.com进行了尝试,在前一种情况下,“<!doctype html>”仍保留在输出中。

于 2010-12-03T22:39:22.637 回答