当我使用 HtmlUnit 运行 page.asXml() 时,我丢失了页面的文档类型。有解决办法吗?
注意:目的是为 Google 提供 DOM。
当我使用 HtmlUnit 运行 page.asXml() 时,我丢失了页面的文档类型。有解决办法吗?
注意:目的是为 Google 提供 DOM。
试着打电话
p.getWebResponse().getContentAsString()
代替
p.asXml()
我只是针对http://google.com进行了尝试,在前一种情况下,“<!doctype html>”仍保留在输出中。