问题标签 [robobrowser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1842 浏览

python - 使用 RoboBrowser 在 OKCupid 上提交表单

我正在尝试编写执行以下操作的python代码:

1) 登录 OKCupid

2) 转到用户问题页面

3) 回答一个未回答的问题。

我正在使用 RoboBrowser 来执行此操作。我可以执行步骤 1)、2) 并且可以获得我想要提交的问题的形式,但是一旦我提交(使用 RoboBrowser 的提交)它似乎并没有通过 OKCupid(因为问题不是在我的个人资料上注册为已回答)。

这是我的代码。请注意,My_RoboBrowser 只允许我将 False 传递给 RoboBrowser.open 作为验证参数。

另外,如果当我在 IPython 笔记本中查看表单对象 Form 时它会有所帮助,它会说:

在提交之前和

后。

最后,如果有帮助,以下是我试图回答的一种形式的代码(通过检查元素获得)

0 投票
1 回答
943 浏览

python - RoboBrowser TypeError:“NoneType”对象不可调用

所以我使用的是使用bs4的 robobrowser。当我尝试从字符串中剥离标签时,我得到了下面描述的错误。如果我注释掉,i.strip("</b>")那么我可以轻松地打印带有标签的字符串列表。可能的欺骗:TypeError:'NoneType'对象不可调用,BeautifulSoup

错误:

0 投票
1 回答
3147 浏览

javascript - Python - 请求/RoboBrowser - ASPX POST JavaScript

我正在移植一个 bash 脚本,该脚本使用 curl 并将代码中的有效负载发布到 URL 并且可以正常工作。基本问题是,使用 robobrowser,我在使用页面表单发布时遇到了麻烦。

浏览网站:

  • 登录到 /SubLogin.aspx
  • 成功登录重定向 /OptionsSummary.aspx
  • GET /FindMe.aspx 带参数
  • POST /FindMe.aspx 按钮“电话列表”(然后页面应加载“电话列表”表,其中包含“工作”项)
  • 选择“工作”项会执行到 /PhoneLists.aspx 的 POST(这应该会加载一个包含用户列表的“工作”表。

我已经能够成功地对站点进行身份验证并使用 RoboBrowser 和 Requests+bs4 执行 GET,但是我对 POST 回到页面本身感到困惑。

使用 RoboBrowser (liboncall.py)

登录网站并显示 URL 以验证我们在:

打开“/FindMe.aspx”:

最初,“/FindMe.aspx”将加载一个表单和一个按钮“电话列表”,( FindMeControl:btnPhoneLists)。

删除不需要的表格字段,填写表格并提交:

验证该页面已更新并具有列表项“工作”:

获取“PhoneLists.aspx”表单,删除不需要的字段,填写并提交。

查看帖子以查看是否已加载用户列表。在这种情况下,它没有加载用户列表。

如果成功,上面将返回:

连同表中的以下项目,( PhoneListsControl_phoneListDetail):

在这次冒险中,我发现 Robobrowser 没有包含所有必需的表单数据,以使“PhoneLists.aspx”的帖子按预期工作,('__EVENTTARGET':'PhoneListsControl$MasterDataControl$masterList$_ctl0$SelectButton'__EVENTARGUMENT)。设置参数然后执行submit_form(form_find_b)也不会达到预期的结果。我想知道add_field()fromrobobrowser.forms.form是否可以工作,但我不明白如何正确使用它,(如果它完全按照我的意愿使用。例如,将 the__EVENTTARGET__EVENTARGUMENThidden 输入字段添加到表单中)。

还有什么我遗漏的或者 RoboBrowser/Requests 不支持这种类型的帖子吗?表单是否需要 javascript 来执行,如此处提到mechanize?

0 投票
2 回答
2725 浏览

python - 使用 python (robobrowser) 下载图像和 pdf

我正在使用 robobrowser 登录到受密码保护的网站。我能够下载 html 代码并对其进行编辑。但是,当我使用以下方法时:

但是,输出不是有效的 pdf 文件。当我尝试下载图像时也会发生同样的情况。我浏览了文档,但还没有找到任何东西。对此的替代方案似乎是机械化的。但是,没有对此的 python 3 支持。

如果有帮助或指点,我将不胜感激。此外,如果 robobrowser 无法处理此问题,任何其他替代方案都会有很大帮助。

0 投票
1 回答
2265 浏览

python - robobrowser 登录到没有 id 或类的表单

我在登录网站时遇到问题:

我如何在没有 id 和班级的情况下获得此表格,我尝试使用

也许有人知道该怎么做。我检查了 robobrowser 的文档,但什么也没有,每个示例都带有 id 或 class ... Thx

0 投票
1 回答
578 浏览

python - RoboBrowser 搜索表单

我想搜索表格但收到错误'NoneType' object has no attribute

我的python代码是:

0 投票
1 回答
2485 浏览

python - robobrowser 选择更改值

我正在尝试将<select>框的值从 10 更改为 500。这是 HTML:

表单中没有'500'列出选项,但如果您更改浏览器中的 HTML,Web 服务器将接受它。

我在 Python 中的代码不起作用:

我收到错误:“NoneType”对象不可下标

当我删除它时:它有效。

Sortzahl = browser.get_form(id='count')
formSortzahl['count'].value = '100'

0 投票
1 回答
1892 浏览

python - 如何使用 robobrowser 登录 facebook?

这是我的代码:

我的错误:

requests.exceptions.ConnectionError: ('Connection aborted.', ResponseNotReady('Request-sent',))

0 投票
1 回答
1657 浏览

python - Python RoboBrowser 自动搜索功能

这段代码有什么问题?它适用于duckduckgo.com,但不适用于谷歌、维基百科或雅虎。是的,我正在根据特定网站更改 ID。

我每次都收到以下错误(duckduckgo.com 除外)

为什么我在NoneType这里收到错误?我知道这个变量之前没有定义,但也没有用 Duckduckgo 定义。请帮忙。

0 投票
1 回答
378 浏览

python - 为什么我的 CSS 选择器不起作用?

为什么这段代码不起作用?它应该选择包含歌词但不包含歌词的“div.col-xs-12.col-lg-8.text-center”的第 6 个 div 标签。顺便说一句,添加了舞台的东西以使编程更容易简单地说,CSS选择器是这样 body > div.container.main-page > div > div.col-xs-12.col-lg-8.text-center > div:nth-of-type(6) 的:网站是这样的:http ://www.azlyrics.com/lyrics/queen/bohemianrhapsody.html


我可以轻松访问div class="col-xs-12 col-lg-8 text-center"并显示代码。问题是我如何选择里面的第 6 个 div div class="col-xs-12 col-lg-8 text-center"。我在div class="col-xs-12 col-lg-8 text-center"下面显示 's 代码: