问题标签 [jaunt-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
520 浏览

java - 在 Installrapp.com 中自动配置 IOS 应用程序

基本上,我需要为生成的每个应用程序或在安装程序应用程序中发生的每个构建更新下面的屏幕截图详细信息。我彻底检查了 API,没有任何方法可以帮助解决上述情况。我需要为每个构建自动配置 IOS 应用程序。现在我正在尝试使用 Java、Jsoup web Scraping Technic 来完成上述任务。请让我们知道该任务是否无法使用上述技术堆栈也建议我使用任何其他 JS 来完全满足要求。

在此处输入图像描述

0 投票
1 回答
296 浏览

javascript - 使用 Jaunt 单击表单中的按钮时出错

所以我正在尝试使用 Jaunt 提交表单。有两个提交按钮,一个检查和应用。我正在尝试单击检查按钮,但遇到了一些麻烦,因为它找不到标识符为“检查”的按钮。

我基本上是在复制 Jaunt 教程 #15 上所做的事情,http://jaunt-api.com/jaunt-tutorial.htm 也尝试过按钮的值,但没有运气

代码:

html:

0 投票
1 回答
430 浏览

exception - 短途旅行中的ResponseException

这是错误 消息: UserAgent.sendGET; 响应错误

请求网址:https ://www.linkedin.com/directory/topics-c/

响应:requestURL:https ://www.linkedin.com/directory/topics-c/

状态:999

这是我的代码

尝试 { 文档文档 = userAgent.visit(link);

0 投票
3 回答
454 浏览

java - 使用java设置屏幕抓取表单的值后如何调用post方法

背景:我有一个网页(.aspx),其中有几个下拉列表。列表值是根据先前下拉列表的选择使用 Ajax 调用填充的。选择所有下拉列表的值后,我们可以单击下载按钮,数据将根据下载的数据进行下载,我们需要执行一些其他操作。

我已经做了什么:我可以通过正确调用 ajax 来设置下拉数据,但是发送一个 post 请求是个问题。这是代码片段/伪代码。

随意使用任何工具和 java

0 投票
1 回答
912 浏览

java - 如何使用 Jaunt 库从网站上抓取数据?

我想从这个网站获得标题:http: //feeds.foxnews.com/foxnews/latest

像这个例子:

它将显示如下文本:

“成功拦截五角大楼确认击落洲际弹道导弹型目标美国成功进行导弹拦截试验,五角大楼说”

这是我的代码。我用过 jaunt 库。

我不知道为什么它只显示文字“foxnew.com”

0 投票
0 回答
398 浏览

java - 使用 Jaunt 库时出现 ClassNotFoundException 和 NoClassDefFoundError?

我正在使用 Jaunt 库开发一个网络爬虫。我目前在 linux 终端上遇到运行时错误:

在跑步的时候:

我的 .jar 文件的目录如下所示:

我的类路径如下所示:

有人可以帮我吗?谢谢!

0 投票
1 回答
137 浏览

java - Jaunt Java getText() 返回正确的文本但有很多“?”

标题说明了一切,我也试过删除它们

(因为文本在那里,但不是“aldo”而是“al?do”,它似乎也有一个随机模式)

(String).replace("?", ""),但没有成功。

我也使用了这个,结合了 UTF_8、UTF_16 和 ISO-8859,但没有成功。

我得到的一个例子:

会不会是网站注意到了无头浏览器并试图“欺骗”其内容?我该如何克服呢?

0 投票
1 回答
80 浏览

java - 如何获取动态加载网页的InnerHTML?

我是 java 新手,使用 jaunt1.3.8 库进行网络抓取。我正在尝试获取网页的 InnerHTML:https ://www.justdial.com/Pune/Cake-Shops/nct-10070075 。

该网站不会向我们显示完整的搜索结果列表。当我们到达页面底部时,它将再次加载。

滚动 10 次后它将停止加载。

我想使用 jaunt1.3.8 库来废弃这个动态加载网页的数据,但我不知道该怎么做。

0 投票
3 回答
359 浏览

java - Jaunt Webcrawler 上的 Java Android Studio 空指针异常

我正在尝试从网站运行简单的 Jaunt 示例,但出现 Null Pointer Exception 错误。我不确定该怎么做,因为在 Android Studio 中使用 Jaunt 的支持很少。这是我的代码:

}

这是我运行它时遇到的错误:

错误出现在 userAgent.visit 行。

这是我得到代码的地方:http: //jaunt-api.com/jaunt-tutorial.htm

0 投票
1 回答
487 浏览

java - Jaunt 超链接用 %3F 和 %3D 替换值

我目前正在使用为 Java 提供的 Jaunt api 从网站检索超链接。代码如下:

问题是当我访问以下网站并将其打印到控制台时?我将 = 符号转换为 %3F 和 %3D。

https://www.bloomberg.com/research/stocks/private/snapshot.asp?privcapId=7991464

如果问题是基本的,我很抱歉,但我在网上找不到任何关于该问题的信息。你们认为这可能是编码问题吗?总而言之,如果可能的话,我想将 %3F 和 %3D 转换为原始形式。

如果您需要更多信息,请告诉我。