8

我在我的 Java 项目中使用 HtmlUnit 来测试一个包含 Javascript 的网页。我的代码单击一个调用 Javascript 函数的按钮,将用户重定向到另一个页面(如链接缩短服务)。这是代码:

public void click()
{
    WebClient webClient = new WebClient();
    HtmlPage page = webClient.getPage("http://mywebsite.com");
    HtmlImage a = page.getHtmlElementById("my_button");
    page = (HtmlPage) a.click();
}

问题是 HTMLUnit 使用默认的用户代理(Internet Explorer 8),并且只有少数需要设置(Firefox 17 和 Chrome)。如果 mywebsite.com 检测到另一个浏览器/用户代理,它的行为不会改变。顺便说一句,用户代理字符串由网站存储用于统计目的,我每次访问时都需要更改它。

我试图通过BrowserVersion以这种方式创建一个新对象来更改用户代理:

BrowserVersion bv = new BrowserVersion("Chrome", "Mozilla/5.0", "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1468.0 Safari/537.36", 28);

顺便说一句,当我实例化一个传递我的对象的 Webclient 对象时bv,我的代码不再工作了。据我了解,HtmlUnit 文档说我必须检查我的 BrowserVersion 中指定的用户代理是否具有运行 Javascript 的适当功能。

但是,请注意,常量不足以完全自定义浏览器,您还需要查看 BrowserVersionFeatures 和“javascript”包中的类。

这是什么意思?为什么 HtmlUnit 不再工作了?我的目标只是更改用户代理字符串。我怎样才能做到这一点?请注意,我也尝试过 Selenium,但没有成功。谢谢您的帮助。

编辑1:

发现了这个技巧。如果我按如下方式实例化 BrowserVersion:

BrowserVersion bv = new BrowserVersion("Netscape", "blablabla", "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1468.0 Safari/537.36", 0);

它有效,但我不明白为什么。我必须将第一个字符串设置为 Netscape(尝试了 Chrome 和 Mozilla,但它不起作用)。第二个字符串是随机的,如果 Netscape 设置为第一个参数,我可以放任何东西。第三个字符串是格式良好的用户代理,第四个参数是一个整数,表示版本。你能解释一下为什么它只有在Netscape作为第一个参数传递并随机传递给其他参数(第二个除外)时才有效?

更新:

有时它不起作用(如上所述)。对于某些用户代理字符串,页面未正确加载。我不明白为什么用户代理应该修改 HtmlUnit 的行为,因为我很确定 Javascript 它很容易并且应该由所有浏览器版本运行。所以,我的最后一个问题是:在执行 Javascript 时,如何在不改变其行为的情况下更改 HtmlUnit 中的用户代理字符串?

4

5 回答 5

2

您可以将其传递给WebClient构造函数:

WebClient webClient = new WebClient(BrowserVersion.CHROME);

此处列出了支持的用户代理:http: //htmlunit.sourceforge.net/apidocs/com/gargoylesoftware/htmlunit/BrowserVersion.html

于 2018-09-01T23:39:18.043 回答
2

使用 Htmlunit 2.28 你可以像下面这个例子一样设置它

final BrowserVersion myChrome = new BrowserVersion.BrowserVersionBuilder(BrowserVersion.CHROME)
    // do your setup here
    .setXXX(..)
    .build();
于 2017-11-10T00:57:42.957 回答
1

不要担心创建一个新BrowserVersion对象。您可以在创建驱动程序后更改用户代理,而不会弄乱所有版本控制混乱:

String DEFAULT_MOBILE_USER_AGENT_STRING = "Mozilla/5.0 (iPhone; CPU iPhone OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5376e Safari/8536.25";

HtmlUnitDriver driver = new HtmlUnitDriver(); //Or insert a capabilities object
driver.getBrowserVersion().setUserAgent(DEFAULT_MOBILE_USER_AGENT_STRING);
driver.get("http://facebook.com");

这将正确访问http://facebook.com并被重定向到,https://m.facebook.com/?_rdr&refsrc=https://www.facebook.com/因为用户代理字符串告诉 facebook 浏览器是 iPhone。

于 2015-11-11T21:44:08.840 回答
0

在 Selenium 3 上,您可以执行以下操作:

val browser = BrowserVersionBuilder(BrowserVersion.CHROME).build()
val driver = HtmlUnitDriver(browser);

BrowserVersionBuilder带来了很多自定义。

于 2020-11-08T16:28:11.547 回答
-1

在构建 Chrome 驱动程序对象时,我能够将用户代理设置为随机字符串,例如“Selenium”。

ChromeOptions chromeOptions = new ChromeOptions();
chromeOptions.addArguments("--start-maximized");
chromeOptions.addArguments("user-agent=Selenium");
chromeOptions.setExperimentalOption("useAutomationExtension", false);
aDriver = new ChromeDriver(chromeOptions);
aDriver.manage().timeouts().implicitlyWait(Const.Chrome_TIMEOUT, TimeUnit.SECONDS);
于 2019-03-07T14:05:56.653 回答