问题标签 [mechanize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 机械化和谷歌应用引擎
有人设法将mechanize与 Google App Engine 应用程序一起使用吗?
python - python 和 mechanize.open()
我有一些使用机械化和受密码保护的站点的代码。我可以很好地登录并获得我期望的结果。但是,一旦我登录,我不想“点击”链接,我想遍历 URL 列表。不幸的是,每个 .open() 调用都只是重定向到登录页面,如果我已经注销或尝试使用不同的浏览器登录,这是我所期望的行为。这让我相信这是某种 cookie 处理,但我不知所措。
javascript - 如何单击在 href 中包含 javascript:__doPostBack 的链接?
我正在使用模块'mechanize'在python中编写屏幕刮板脚本,我想在href中有javascript:__doPostBack的链接上使用mechanize.click_link()方法。我相信我试图解析的页面正在使用 AJAX。
注意:mech 是 mechanize.Browser()
单击链接后,我想检索页面源。
ruby - 有没有办法在没有运行浏览器的情况下测试 Comet 应用程序?
我正在尝试连接到使用 Comet 并且对 Javascript 和 Comet 非常依赖的应用程序。我已经尽我所能参加 Firebug,HTTP Header 检查,并试图通过使用 Ruby Mechanize 编写一些东西来查看网络上的内容。
然而,由于我没有客户端运行时,我的方法是模拟来回的 HTTP 请求(使用 Ruby Mechanize 来实现)。我正在查看日志并将它们与 LiveHTTPHeader 输出进行比较,它非常相似,但服务器没有响应(我无权访问服务器端代码)。
有没有可以提供帮助的工具?有没有人尝试过使用 Rhino 之类的东西来模拟 DOM 和 Javascript 运行时,或者这只是为了痛苦?
ruby-on-rails - 机械化设置字段重名
我正在使用 mechanize 并且在一个表单上遇到问题...该表单有两个同名的选择框。
如何选择第二个?
IE。NumNights 第二次出现。
我在文档中发现了这样的内容:
但这不起作用:
python - 使用 mechanize 访问需要 SSL 的站点
我需要访问一个站点 (https://*),该站点需要我在 Firefox 中安装两个证书才能成功访问它。一个我可以导出为 .p12 文件(客户端证书),一个是 .crt 文件(CA 证书)。如果我尝试在没有这些证书的情况下访问此站点,我会收到“握手失败错误”。
如何在 Python 中访问该站点?我正在考虑使用机械化。谢谢。
python - 如何在 Python ClientForm 对象中搜索 XPath?
我有一个表单,由 Python 机械化浏览器返回并通过 forms() 方法获得。如何在表单节点内,即在 HTML 表单节点的后代节点中执行 XPath 搜索?TIA
更新:如何保存表单的html代码?
python - 如何使用机械化 cookie 获取 http 页面?
有一个 Python 机械化对象,其表单几乎所有值都已设置,但尚未提交。现在我想使用 mechanize 实例中的 cookie 获取另一个页面,但不重置页面、表单等,例如,使值保持设置(我只需要获取另一个页面的正文字符串,仅此而已)。那么有没有办法:
- 告诉 mechanize 不要重置页面(也许,通过
UserAgentBase
)? - 使用mechanize
urllib2
的饼干罐?注意:urllib2.HTTPCookieProcessor(self.br._ua_handlers["_cookies"].cookiejar)
不起作用 - 任何其他方式将cookie传递给
urllib
?
python - 如何修复此类 ClientForm 错误?
from mechanize import Browser br = Browser() page = br.open(' http://wow.interzet.ru/news.php?readmore=23 ') br.form = br.forms().next() print br .form 给我以下错误:
我该如何解决?
编辑:
我已经这样修好了。可以吗?如果不是,如何取而代之?
python - 如何修复 Python Mechanize 中的编码?
这是示例代码:
问题是服务器返回不正确的编码(windows-cp1251)。如何在机械化中手动设置当前页面的编码?
错误: