问题标签 [jaunt-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 使用 java 和 jaunt-api 登录网页时出现问题
所以我正在尝试使用 Jaunt 登录网页。首先要提到的是网页是 .aspx 并且提交按钮有一个选项onclick="javascript:WebForm_DoP..."
,据我所知 Jaunt 不支持 Javascript 对吧?万一我错了,我正在使用的代码是 Jaunt 示例中的代码:
所有名称和值都是正确的,并且用户和密码有效,因为我可以使用 Web 浏览器登录。执行代码后,在输出中我得到以下信息:
消息:UserAgent.sendPOST;Connection error requestUrl: http://webpagehere.com/default.aspx [posting __VIEWSTATE=%2FwEPDwUJLTk5MDc0NjQ2ZBgBBR5fX0NvbnRyb2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WAgURTG9naW4xJFJlbWVtYmVyTWUFF0xvZ2luMSRMb2dpbkltYWdlQnV0dG9upWcarODJIwpeMt8HCmfaBn6iMWI%3D&__VIEWSTATEGENERATOR=CA0B0334&Login1%24UserName=USER&Login1%24Password=PASSWORD&Login1%24LoginButton=GO] response: [none]
表格 div 是这样的:
有什么想法可能是我的问题吗?如果 Jaunt 不允许我进行此登录,有人可以向我推荐一个用于网络抓取和交互的库吗?谢谢!
java - Jaunt-api cookie 问题
我正在尝试使用 jaunt-api 登录 yahoo 邮件,但出现“cookie 未启用问题”。我是 jaunt-api 的新手,所以请帮助我。我正在使用以下代码。
html - Jaunt - 检查是否有特定元素
我正在使用 Nutch 抓取网站,目前正在编写一个插件。Jaunt 1.0.0.1 用于解析 HTML。例如,我有一排
哪个得到和错误,当在页面上时 no <div class=info_books_item>
。目前我正在查看 Jaunt JavaDocs,但不知道如何检查,是否有这样的元素。
java - Jaunt webcrawler - 无法访问 Google 搜索结果的下一页
我想从谷歌返回更多的搜索结果,而不仅仅是第一页。所以第二个for-loop
基本上应该返回下一页的结果,但事实并非如此。知道为什么吗?
java - 使用 Java 和 Jaunt API 填写具有复杂名称(输入标记中的点符号)的 HTML 表单
- 嘿伙计,
我正在构建一个 Java 工具,尝试input
使用 Java 和Jaunt API
.
HTML代码是这样的:
用于填写“正常”输入字段reference
(有效)的 Java 代码如下所示:
不幸的是,我无法填写searchprofile.surname
名称中使用点符号的字段
这是我尝试过的示例(没有成功):
对于这些命令中的每一个,我都会收到 NotFoundException 并且不知道我是否可以使用 Jaunt 执行此操作。
在这方面提供任何帮助将不胜感激。
提前致谢
编辑 - 有没有办法searchprofile.surname
使用 JSoup 到达带点符号的输入字段?
HTML 允许在 -Attribute 中使用点name
,但 Jaunt 接受abc.name
吗?
java - 收到此错误:任务“:app:transformClassesWithDexForDebug”执行失败
我正在使用 Jaunt 在我的应用程序中解析网站。 项目文件列表
但它总是给我这个错误
com.android.ide.common.process.ProcessException: org.gradle.process.internal.ExecException: Process 'command 'C:\Program Files\Java\jdk1.8.0_40\bin\java.exe'' 完成非零退出值 1
这是我的毕业文件:
这是 Hello world 应用程序(默认应用程序)。除了 Jaunt lib,我没有添加任何东西。
我尝试添加 multiDexEnabled true, javaMaxHeapSize "4g" 但它不起作用。所以请建议我该怎么做?
java - 使用 Jsoup 解析器提取 HTML 数据
从以下 HTML 中,以给定格式提取数据的最佳方法是什么。
预期输出:
ITEM_NAME:蒂卡沙拉
ITEM_DESCRIPTION : 羽衣甘蓝、葵花芽、藜麦、鳄梨、葡萄番茄、紫花苜蓿豆芽、胡萝卜和黄瓜,可选择调味料。
项目价格:9.95 美元
ITEM_IMG:/yelp_images/s3-media4.fl.yelpcdn.com/bphoto/1P50jjYUA4ofx5hF85wm5Q/ms.jpg
我尝试了各种使用 Jsoup 和 Jaunt 的方法。仍然无法弄清楚。
web-scraping - Jaunt Webcrawler API 没有正确处理相对 URL
我实现了一个爬虫,它执行以下操作:
它正在抓取的页面是
https://www.mercadoribeirao.com.br
我得到所有链接,如:
在第一页中,它会正确获取链接,例如:
但是当它访问子页面时,url 连接不正确:
也许是因为短途试图自动完成相对链接以在 url 末尾而不是在基本页面上连接链接。
这些创建的新链接由于某种原因是正确的,然后总是有新的链接要访问,这种情况会无限期地发生,并且这个过程永远不会结束。
有没有什么办法可以解决这个问题?
java - 寻找 Jaunt Element 不起作用?
我正在尝试从 YouTube 中获取特定元素(视频的标题)。
HTML: http: //pastebin.com/cjr2SgNd
重要的 HTML 部分:
我想找到这个:title="Latest Agar.io PvP - Create Your Own Server!"
但是,我收到此错误: http: //pastebin.com/G7x9FZaa
我正在使用 Jaunt 来获得标题。代码:
javascript - 无法从网页获取表单
我正在尝试从以下位置获取登录表单:
当我在 Chrome 中检查时,我可以看到该元素,但是当我在 Java 中使用 jaunt api 时,我无法获取表单。
我在 HTML 方面几乎没有经验,所以任何方向都会很棒!
这是我的第一篇文章,所以如果我没有正确完成某些事情,请告诉我。
非常感谢你!