问题标签 [htmlunit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 请帮我将此java代码转换为C#
我在我的 C# 项目中使用 Htmlunit,但我无法将此代码在 java 中转换为 C#
任何人都可以将其转换为 C# 吗?预先感谢
java - 如何使用 HtmlUnit 从网页中提取没有 HTML 标签的文本?
我刚刚开始使用 HTMLUnit,我想做的是获取一个网页并从中提取原始文本减去所有 html 标记。
htmlunit 可以做到这一点吗?如果是这样,怎么做?还是我应该看另一个图书馆?
例如,如果页面包含
我希望它输出
谢谢
java - HtmlUnit 不可能的站点?
为了我的一生,我不能装备 HtmlUnit 来获取这个网站:
我确信这与在后台运行的大量脚本有关。也许这些脚本没有得到足够的时间来完全加载?
我也尝试过简单地抓取 bing.com/travel,但也没有成功。它破坏了新 HtmlPage 客户端的 getPage 功能。
输出给出了过多的 runtimeErrors(“完成此操作所需的数据尚不可用”),所有这些都是相同的 sourceName(“ http://www.bing.com/travel/jsxc.vjs?a=common&v=5.5 .0-1278007084280 ")
然后,在 bing.com 上的几个脚本中,由于缺少“(”而引发了几个异常。
然后它调用javascript,然后突然结束。
我意识到这可能是一些其他人可能看不到的问题,所以如果没有建议,有人会介意通过他们自己的 HtmlUnit 使用的测试实现来抽取这两个站点,看看他们是否可以获得基本输出XML 或文本结果?我不想在这里做任何花哨的事情,只是得到一些基本的文本或结果的 XML 输出。
知道其他人的实施是否有效会很方便,这样我就可以继续陪审团完成我的工作。
代码:
谢谢!
java - Java:如何设置 htmlunit
我是 Java 的一个相当大的菜鸟,但我想试试 htmlunit。我使用 netbeans 作为我的 IDE,并创建了一个项目文件夹“hu1”。这是该文件夹的结构:
现在,我下载 htmlunit 2.7 并解压缩该文件夹,其中包含一个“lib”文件夹,其中包含一堆 jar 文件。我应该将该 lib 文件夹放在我的 netbeans 项目文件夹中的什么位置以便我可以使用 htmlunit?
另外,一旦我弄清楚了,我将使用哪些路径进行导入。我在网上看到的很多例子都使用这样的东西:
com.gargoyle 软件从何而来?
我知道这是一个初学者的问题,我真的应该阅读更多关于如何使用 java 编程的内容,但我希望这里的专家能给我一些建议。
更新:这是我的设置图片。
java - Google App Engine 上的 Ajax Crawling - HtmlUnit 是否有效?
http://code.google.com/web/ajaxcrawling/docs/html-snapshot.html
HtmlUnit 可以在 AppEngine 上运行吗?如果没有,还有其他方法可以让我的 GWT 应用程序被搜索引擎抓取吗?
selenium - 如何在 Web 应用程序中测试上下文菜单功能?
我正在使用具有上下文菜单(右键单击)的 grails 应用程序。上下文菜单是使用 Chris Domigan 的jquery contextmenu 插件构建的。
虽然上下文菜单确实有效,但我想要进行自动化测试,但我不知道如何去做。
- 我试过 Selenium 2.05a(即 Webdriver),但没有 rightClick 方法。
- 我注意到 HtmlUnit 有一个 rightclick 方法,但我似乎无法检测到单击之前和之后的 DOM 中的任何差异。
java - 如何使用 Eclipse 将 .diff 补丁应用于 HtmlUnit
我正在尝试使用此页面底部的补丁来修补 HtmlUnit 。我可以看到如何从 Eclipse 应用补丁,但我不知道如何应用这些特定的补丁。我最初有 JAR,但后来我意识到我需要采购,所以我得到了这些,但仍然没有运气。
在补丁中我看到:
等等,但是“a/htmlunit”是怎么回事?我有软件包,“src/main/java/com/gargoylesoftware/htmlunit/WebClient.java”(例如)很容易找到,但不是/htmlunit。我真的不知道如何应用它。
任何人都可以帮忙吗?
java - Java HTMLUnit - 如何在提交表单后访问我发送到的页面 DOM
在我 .click() 页面上的提交按钮并被发送到另一个页面后,我对如何访问新加载的页面的 DOM 感到非常困惑。
有任何想法吗?
谢谢。
java - 如何使用 XPath 获取元素节点之间的原子值
我只想选择节点内的原子值。例如,下面的“here”文本:
当我在 Java 中使用 Xpath 时,它会返回某种对象/数组,例如
我只想要文字。
这可能吗,怎么做?谢谢!
java - 如何将图片作为多部分 POST 请求的一部分发送 - Java HtmlUnit
我正在尝试使用 Java 向 deaptcher.com 提交验证码。Decaptcher 并没有很好地解释如何使用他们的 API,所以我试图弄清楚如何使用 HTTP POST 请求来提交验证码。这是我从他们的网站上获得的示例代码:
我应该向 Web 服务器发送一个这样的 post 请求并得到一个返回给我的字符串。这是我在 Java 中实现它的尝试。
我是否应该将 pict 的值设置为 File 对象而不是指向存储验证码的位置的字符串?(captcha.png 是我要提交的图像的名称)。