问题标签 [htmlunit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
341 浏览

c# - 请帮我将此java代码转换为C#

我在我的 C# 项目中使用 Htmlunit,但我无法将此代码在 java 中转换为 C#

任何人都可以将其转换为 C# 吗?预先感谢

0 投票
1 回答
3802 浏览

java - 如何使用 HtmlUnit 从网页中提取没有 HTML 标签的文本?

我刚刚开始使用 HTMLUnit,我想做的是获取一个网页并从中提取原始文本减去所有 html 标记。

htmlunit 可以做到这一点吗?如果是这样,怎么做?还是我应该看另一个图书馆?

例如,如果页面包含

我希望它输出

谢谢

0 投票
3 回答
3001 浏览

java - HtmlUnit 不可能的站点?

为了我的一生,我不能装备 HtmlUnit 来获取这个网站:

http://www.bing.com/travel/flight/flightSearch?form=FORMTRVLGENERIC&q=flights+from+SLC+to+BKK+leave+07%2F30%2F2010+return+08%2F11%2F2010+adults%3A1+ class%3ACOACH&stoc=0&vo1=Salt+Lake+City%2C+UT+%28SLC%29+-+Salt+Lake+City+International+机场&o=SLC&ve1=Bangkok%2C+Thailand+%28BKK%29+-+Suvarnabhumi+International&e= BKK&d1=07%2F30%2F2010&r1=08%2F11%2F2010&p=1&b=COACH&baf=true

我确信这与在后台运行的大量脚本有关。也许这些脚本没有得到足够的时间来完全加载?

我也尝试过简单地抓取 bing.com/travel,但也没有成功。它破坏了新 HtmlPage 客户端的 getPage 功能。

输出给出了过多的 runtimeErrors(“完成此操作所需的数据尚不可用”),所有这些都是相同的 sourceName(“ http://www.bing.com/travel/jsxc.vjs?a=common&v=5.5 .0-1278007084280 ")

然后,在 bing.com 上的几个脚本中,由于缺少“(”而引发了几个异常。

然后它调用javascript,然后突然结束。

我意识到这可能是一些其他人可能看不到的问题,所以如果没有建议,有人会介意通过他们自己的 HtmlUnit 使用的测试实现来抽取这两个站点,看看他们是否可以获得基本输出XML 或文本结果?我不想在这里做任何花哨的事情,只是得到一些基本的文本或结果的 XML 输出。

知道其他人的实施是否有效会很方便,这样我就可以继续陪审团完成我的工作。

代码:

谢谢!

0 投票
2 回答
17869 浏览

java - Java:如何设置 htmlunit

我是 Java 的一个相当大的菜鸟,但我想试试 htmlunit。我使用 netbeans 作为我的 IDE,并创建了一个项目文件夹“hu1”。这是该文件夹的结构:

现在,我下载 htmlunit 2.7 并解压缩该文件夹,其中包含一个“lib”文件夹,其中包含一堆 jar 文件。我应该将该 lib 文件夹放在我的 netbeans 项目文件夹中的什么位置以便我可以使用 htmlunit?

另外,一旦我弄清楚了,我将使用哪些路径进行导入。我在网上看到的很多例子都使用这样的东西:

com.gargoyle 软件从何而来?

我知道这是一个初学者的问题,我真的应该阅读更多关于如何使用 java 编程的内容,但我希望这里的专家能给我一些建议。


更新:这是我的设置图片。

0 投票
2 回答
1502 浏览

java - Google App Engine 上的 Ajax Crawling - HtmlUnit 是否有效?

http://code.google.com/web/ajaxcrawling/docs/html-snapshot.html

HtmlUnit 可以在 AppEngine 上运行吗?如果没有,还有其他方法可以让我的 GWT 应用程序被搜索引擎抓取吗?

0 投票
3 回答
5908 浏览

selenium - 如何在 Web 应用程序中测试上下文菜单功能?

我正在使用具有上下文菜单(右键单击)的 grails 应用程序。上下文菜单是使用 Chris Domigan 的jquery contextmenu 插件构建的。

虽然上下文菜单确实有效,但我想要进行自动化测试,但我不知道如何去做。

  • 我试过 Selenium 2.05a(即 Webdriver),但没有 rightClick 方法。
  • 我注意到 HtmlUnit 有一个 rightclick 方法,但我似乎无法检测到单击之前和之后的 DOM 中的任何差异。
0 投票
1 回答
671 浏览

java - 如何使用 Eclipse 将 .diff 补丁应用于 HtmlUnit

我正在尝试使用此页面底部的补丁来修补 HtmlUnit 。我可以看到如何从 Eclipse 应用补丁,但我不知道如何应用这些特定的补丁。我最初有 JAR,但后来我意识到我需要采购,所以我得到了这些,但仍然没有运气。

在补丁中我看到:

等等,但是“a/htmlunit”是怎么回事?我有软件包,“src/main/java/com/gargoylesoftware/htmlunit/WebClient.java”(例如)很容易找到,但不是/htmlunit。我真的不知道如何应用它。

任何人都可以帮忙吗?

0 投票
2 回答
415 浏览

java - Java HTMLUnit - 如何在提交表单后访问我发送到的页面 DOM

在我 .click() 页面上的提交按钮并被发送到另一个页面后,我对如何访问新加载的页面的 DOM 感到非常困惑。

有任何想法吗?

谢谢。

0 投票
2 回答
3937 浏览

java - 如何使用 XPath 获取元素节点之间的原子值

我只想选择节点内的原子值。例如,下面的“here”文本:

当我在 Java 中使用 Xpath 时,它会返回某种对象/数组,例如

我只想要文字。

这可能吗,怎么做?谢谢!

0 投票
3 回答
4475 浏览

java - 如何将图片作为多部分 POST 请求的一部分发送 - Java HtmlUnit

我正在尝试使用 Java 向 deaptcher.com 提交验证码。Decaptcher 并没有很好地解释如何使用他们的 API,所以我试图弄清楚如何使用 HTTP POST 请求来提交验证码。这是我从他们的网站上获得的示例代码:

我应该向 Web 服务器发送一个这样的 post 请求并得到一个返回给我的字符串。这是我在 Java 中实现它的尝试。

我是否应该将 pict 的值设置为 File 对象而不是指向存储验证码的位置的字符串?(captcha.png 是我要提交的图像的名称)。