问题标签 [jaunt-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1437 浏览

java - 使用 java 和 jaunt-api 登录网页时出现问题

所以我正在尝试使用 Jaunt 登录网页。首先要提到的是网页是 .aspx 并且提交按钮有一个选项onclick="javascript:WebForm_DoP...",据我所知 Jaunt 不支持 Javascript 对吧?万一我错了,我正在使用的代码是 Jaunt 示例中的代码:

所有名称和值都是正确的,并且用户和密码有效,因为我可以使用 Web 浏览器登录。执行代码后,在输出中我得到以下信息:

消息:UserAgent.sendPOST;Connection error requestUrl: http://webpagehere.com/default.aspx [posting __VIEWSTATE=%2FwEPDwUJLTk5MDc0NjQ2ZBgBBR5fX0NvbnRyb2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WAgURTG9naW4xJFJlbWVtYmVyTWUFF0xvZ2luMSRMb2dpbkltYWdlQnV0dG9upWcarODJIwpeMt8HCmfaBn6iMWI%3D&__VIEWSTATEGENERATOR=CA0B0334&Login1%24UserName=USER&Login1%24Password=PASSWORD&Login1%24LoginButton=GO] response: [none]

表格 div 是这样的:

有什么想法可能是我的问题吗?如果 Jaunt 不允许我进行此登录,有人可以向我推荐一个用于网络抓取和交互的库吗?谢谢!

0 投票
1 回答
590 浏览

java - Jaunt-api cookie 问题

我正在尝试使用 jaunt-api 登录 yahoo 邮件,但出现“cookie 未启用问题”。我是 jaunt-api 的新手,所以请帮助我。我正在使用以下代码。

0 投票
1 回答
717 浏览

html - Jaunt - 检查是否有特定元素

我正在使用 Nutch 抓取网站,目前正在编写一个插件。Jaunt 1.0.0.1 用于解析 HTML。例如,我有一排

哪个得到和错误,当在页面上时 no <div class=info_books_item>。目前我正在查看 Jaunt JavaDocs,但不知道如何检查,是否有这样的元素。

0 投票
1 回答
1028 浏览

java - Jaunt webcrawler - 无法访问 Google 搜索结果的下一页

我想从谷歌返回更多的搜索结果,而不仅仅是第一页。所以第二个for-loop基本上应该返回下一页的结果,但事实并非如此。知道为什么吗?

0 投票
2 回答
1289 浏览

java - 使用 Java 和 Jaunt API 填写具有复杂名称(输入标记中的点符号)的 HTML 表单

- 嘿伙计,

我正在构建一个 Java 工具,尝试input使用 Java 和Jaunt API.

HTML代码是这样的:

用于填写“正常”输入字段reference(有效)的 Java 代码如下所示:

不幸的是,我无法填写searchprofile.surname名称中使用点符号的字段

这是我尝试过的示例(没有成功):

对于这些命令中的每一个,我都会收到 NotFoundException 并且不知道我是否可以使用 Jaunt 执行此操作。

在这方面提供任何帮助将不胜感激。

提前致谢

编辑 - 有没有办法searchprofile.surname使用 JSoup 到达带点符号的输入字段?

HTML 允许在 -Attribute 中使用点name,但 Jaunt 接受abc.name吗?

0 投票
0 回答
261 浏览

java - 收到此错误:任务“:app:transformClassesWithDexForDebug”执行失败

我正在使用 Jaunt 在我的应用程序中解析网站。 项目文件列表

但它总是给我这个错误

com.android.ide.common.process.ProcessException: org.gradle.process.internal.ExecException: Process 'command 'C:\Program Files\Java\jdk1.8.0_40\bin\java.exe'' 完成非零退出值 1

这是我的毕业文件:

这是 Hello world 应用程序(默认应用程序)。除了 Jaunt lib,我没有添加任何东西。

我尝试添加 multiDexEnabled true, javaMaxHeapSize "4g" 但它不起作用。所以请建议我该怎么做?

0 投票
1 回答
124 浏览

java - 使用 Jsoup 解析器提取 HTML 数据

从以下 HTML 中,以给定格式提取数据的最佳方法是什么。

预期输出:

ITEM_NAME:蒂卡沙拉

ITEM_DESCRIPTION : 羽衣甘蓝、葵花芽、藜麦、鳄梨、葡萄番茄、紫花苜蓿豆芽、胡萝卜和黄瓜,可选择调味料。

项目价格:9.95 美元

ITEM_IMG:/yelp_images/s3-media4.fl.yelpcdn.com/bphoto/1P50jjYUA4ofx5hF85wm5Q/ms.jpg

我尝试了各种使用 Jsoup 和 Jaunt 的方法。仍然无法弄清楚。

0 投票
1 回答
126 浏览

web-scraping - Jaunt Webcrawler API 没有正确处理相对 URL

我实现了一个爬虫,它执行以下操作:

它正在抓取的页面是

https://www.mercadoribeirao.com.br

我得到所有链接,如:

在第一页中,它会正确获取链接,例如:

但是当它访问子页面时,url 连接不正确:

也许是因为短途试图自动完成相对链接以在 url 末尾而不是在基本页面上连接链接。

这些创建的新链接由于某种原因是正确的,然后总是有新的链接要访问,这种情况会无限期地发生,并且这个过程永远不会结束。

有没有什么办法可以解决这个问题?

0 投票
0 回答
472 浏览

java - 寻找 Jaunt Element 不起作用?

我正在尝试从 YouTube 中获取特定元素(视频的标题)。

HTML: http: //pastebin.com/cjr2SgNd

重要的 HTML 部分:

我想找到这个:title="Latest Agar.io PvP - Create Your Own Server!"

但是,我收到此错误: http: //pastebin.com/G7x9FZaa

我正在使用 Jaunt 来获得标题。代码:

0 投票
1 回答
159 浏览

javascript - 无法从网页获取表单

我正在尝试从以下位置获取登录表单:

https://www.etoro.com/login

当我在 Chrome 中检查时,我可以看到该元素,但是当我在 Java 中使用 jaunt api 时,我无法获取表单。

我在 HTML 方面几乎没有经验,所以任何方向都会很棒!

这是我的第一篇文章,所以如果我没有正确完成某些事情,请告诉我。

非常感谢你!