问题标签 [robobrowser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
590 浏览

python - 如何在 Robobrowser 中删除 AttributeError

我正在尝试登录我的大学 ID 并使用robobrowser. 当我尝试打印仪表板的内容时,我得到了这个回溯。

这是我的代码。

这是源代码。

有什么帮助吗?

0 投票
0 回答
147 浏览

python - 如何使用 robobrowser 勾选复选框

1我试图在我从大学图书馆发行的书上打勾type error

这是我的代码。

这是源代码。

和我得到的回溯。

任何帮助..

0 投票
1 回答
1666 浏览

javascript - Python:如何从 HTML 页面获取隐藏的 html 内容

我正在尝试制作一个程序,可以重新发行我使用 robobrowser 从图书馆拿走的书,因为我应该这样做

1) 登录我的 ID
2) 勾选相应书籍的复选框
3) 点击提交

在我登录并打印页面的响应之后,它确实打印了页面的源代码,除了所有勾选框和书籍名称都存在的表单的源代码..

它也应该显示表单的源代码,即

但它只是打印

和我的代码..

整个td 标签都不见了,我不认为这是因为robobrowser我也在通过会话,那么为什么会发生
任何帮助?

0 投票
0 回答
361 浏览

python - 使用 RoboBrowser 提交表单的问题

我在 pythonista 上使用 RoboBrowser,似乎无法正确提交此登录表单。每当我使用正确的登录信息提交它时,都会返回相同的页面。唯一的区别是凭据现在位于登录表单中。在此先感谢您的帮助!

0 投票
0 回答
369 浏览

javascript - 如何点击一个JS按钮

我正在尝试robobrower通过单击名为的按钮来提交表单,Renew该按钮更新了我在复选框中选中标记的所有书籍,现在我要做的就是单击“更新”按钮,我已经尝试过通过做提交它browser.submit_form(box)。但我不确定它是否正在工作,因为我听说它Robobrowser不支持JS..这是我的代码。

这是按钮的源代码。

0 投票
1 回答
861 浏览

python - 如何使用 Robobrowser 或 Request 提交 Web 表单

我不是 Python 专家,但发现它在许多领域都非常有用。在提交表单和检索输出的上下文中,我在两个不同的场合开始使用 Robobrowser 和 Requests 时遇到了问题。我想做的事; 使用网络检查器向 westjet.com 提交旅行日期 我看到“起点事件”和“目的地事件” 我需要在我的案例中提交机场代码 YYZ 和 POP 以及日期。有人可以帮我理解这些库,这样我就知道如何完成这个以及正确的解释,谢谢。

0 投票
0 回答
101 浏览

python-2.7 - RoboBrowser 的内存使用量永远增长?

[编辑以简化示例/更好地隔离问题]

对同一个URLRoboBrowser进行多次后续访问会导致内存随着每次访问而增长,即使您每次都重新初始化并覆盖原始RoboBrowser实例也是如此。这违背了我对 Python 中内存管理如何工作的直觉,我想了解原因。

为了证明这一点,这里有一个脚本的内存配置文件,该脚本访问https://news.ycombinator.com/ask并获取所有 div(我故意重复此操作,以便内存配置文件更完整):

这是一个按我预期工作的不同脚本:

为什么在抓取时分配的内存会不断堆积?我应该研究什么才能更好地理解这个问题?

我正在通过python -m memory_profiler mem_test.py使用 Python 2.7.6运行来生成抓取内存配置文件

完整脚本mem_test.py

导入时间 从 robobrowser.browser 导入 memory_profiler 导入 RoboBrowser

0 投票
1 回答
139 浏览

html - 如何增加浏览器响应

我有一个程序,它使用 RoboBrowser 向网站发送大量请求并获得答案,但现在我需要将这些答案过滤到只有那些没有此字符串“Case Status Not Available”的答案我试图使用 beautifulsoup,但它返回错误。

这是到目前为止的代码:

返回的错误是:

0 投票
1 回答
303 浏览

python - 使用 RoboBrowser/BeautifulSoup 返回多个匹配项

我正在尝试使用 find/find_all-method 获得多个正则表达式匹配,但无法使其正常工作。

一段 HTML 代码可以是:

然后在代码中我正在尝试以下内容:

输出如下:

我期待的是:

\xa 会破坏它吗?或者您不能在一个正则表达式中返回多个匹配项?真不知道怎么解决。我总是可以将返回值存储在一个字符串中,并使用拆分或正则表达式再次解析它,但我更愿意直接使用 find 或 find_all 获取它。

0 投票
1 回答
409 浏览

python - RoboBrowser:如何模拟 asp.net 图片点击发起的 POST

问题:给定一个 aspx.net 页面,其提交是通过图像点击与提交按钮,我如何模拟被点击的图像以发布表单。

背景:我需要针对网站运行一些计划任务(我无法更改代码)。使用 RoboBrowser,我可以登录该站点并通常浏览页面。但是,我有一种情况,用户可以选择通过单击两个图像之一来打开/关闭某些东西。该表单有一个隐藏的提交按钮,可以自动注销用户(不知道为什么),所以我不能使用 browser.submit_form。我已经在 fiddler 中捕获了在图像点击时产生的流量,并且需要在代码中对其进行模拟,但我并不完全确定最好的方法。

系统:Python 3.4、RoboBrowser、基于旧 aspx.net 技术的网站

单击图像的HTML(注意,RainSwitch 仅验证是否进行了选择)

在 Fiddler 上看到的POST

一般想法

  • 感觉就像我应该能够以与用户相同的方式单击图像,但是 browser.follow_link 给了我一个类型错误,该对象不可下标。我假设是因为图像没有 a=href。
  • 我的下一个想法是,bro​​wser.open(url, method='post', data=data)我可以为数据制定大部分字段,但这是很多工作,我觉得因为这是一个常见的操作所以有必须是一种更简单的方法(我什至不确定它是否会起作用。)
  • 我不一定需要您为我编写代码,只要让我走上正轨即可。

谢谢,

史蒂夫·J