问题标签 [robobrowser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 python 中使用 Requests 库进行抓取时管理会话
我在抓取页面时无法创建和保持新会话。我正在使用 Requests 库在脚本中启动会话,然后将值解析为 Web 表单。但是,它正在返回“您的会话已超时”页面。
这是我的来源:
我要搜索的网址是https://www.searchiqs.com/NYALB/SearchAdvancedMP.aspx
我正在寻找名为“Andrew”的第 1 方名称。我已将包含此搜索框的表单元素标识为“Rctl00$ContentPlaceHolder1$txtName”。操作 url 是 SearchResultsMP.aspx。
当我从浏览器执行此操作时,它会给出结果的第一页。当我在终端中执行此操作时,它会给我会话过期页面。有任何想法吗?
python - 如何知道登录是否成功?
我正在使用 roboBrowser 登录网站,这是代码
我在这里看到表单提交成功。我怎么知道登录是否成功,因为它没有像 requests.get 那样返回任何成功的响应代码,<Response 200>
但在这种情况下它不会返回任何东西。所以,我怎么知道登录成功与否。
python - 如何找到具有指定文本字符串的评论
我正在使用 robobrowser 来解析一些 html 内容。我有一个 BeautifulSoup 里面。如何在里面找到带有指定字符串的评论
事实上,如果我知道 ANY_ID,我需要获取 TEXT_1 谢谢
python - 如何找到具有特定父元素的元素?
我有一些 HTML,例如:
我需要找到以 cl1 作为父级的 cl2 类的任何项目,所以我需要获取text_1而不是text_2。在简单的 css 中应该是这样的:
但我使用robobrowser和BeautifulSoup,当我尝试
它说css选择器是错误的。
python - PTVS - robobrowser 给出 Beautifulsoup 错误
我是 python 的新手,这是一个来自不同解决方案的简单代码,它通常应该可以工作,但我收到来自 Beautifulsoup 的错误(屏幕下方),未提供标记。
我正在使用 PTVS 和 python 3.5。
Python代码:
python-2.7 - 为什么robobrowser登录后不返回页面源?
我正在尝试使用 robobrowser 在网站中自动化登录过程。这是代码:
现在,登录表单采用 Firefox 调试所看到的以下输入:
__EVENTTARGET, __EVENTARGUMENT, __VIEWSTATE, __VIEWSTATEGENERATOR, __EVENTVALIDATION, 用户名, 密码, btnlogin, txtUsername, txtemailid,
__VIEWSTATEGENERATOR 、 __EVENTVALIDATION 、 __VIEWSTATE 的值不会改变。
该代码返回登录页面的 HTML,而我希望登录后页面的 HTML。
这是登录页面的 HTML:
python-2.7 - python RoboBrowser单击单选按钮
我一直在尝试修复下面的代码一段时间,由于某种原因,代码的每个部分都可以工作,除了必须单击单选按钮的部分,它显示“ValueError:在字段中找不到选项 1”但是有一个选项是 1,它是 0 或 1。我曾经玩过 mechanize 我知道我大部分时间在做什么,但是有人可以帮忙吗?求求你了,谢谢你
python - robobrowser 使用登录抓取页面
我正在尝试抓取一个页面,但我必须通过登录页面,由于某种原因我无法做到这一点。任何帮助表示赞赏,因为我的想法不多了......
我没有收到任何错误。也接受使用其他 python 库的解决方案!
python - Python robobrowser get_form 没有得到整个表单
我正在使用 robobrowser 自动搜索网站。我需要填写两个表单输入,但 robobrowser.get_form 只接收第一个输入。关于如何获取完整表单并为第二个输入赋值的任何想法?
HTML:
Python脚本: