1

我正在使用 HTMLUnit 来抓取页面,并且我的日志一直被 HTMLUnit 输出弄得杂乱无章。即,如果它返回 403 状态码,它会将整个页面的 HTML 发送到日志。

我尝试了以下方法来推迟它:

System.getProperties().put("org.apache.commons.logging.simplelog.defaultlog", "fatal"); 
webClient.setThrowExceptionOnFailingStatusCode(false);

不幸的是,没有任何效果,我的日志看起来仍然一团糟。我的项目使用 log4j,但我没有以任何方式配置 HTMLUnit 来使用它。

4

2 回答 2

3

尝试添加这个:

webClient.setPrintContentOnFailingStatusCode(false);

我通常最终也会添加这个:

System.setProperty("org.apache.commons.logging.Log", "org.apache.commons.logging.impl.SimpleLog");
System.setProperty("org.apache.commons.logging.simplelog.defaultlog", "fatal");
于 2012-06-02T17:01:29.233 回答
0

实际上没有方法 webClient.setPrintContentOnFailingStatusCode

相反,您应该使用:

webClient.getOptions().setPrintContentOnFailingStatusCode(false);

于 2015-07-23T17:56:57.073 回答