问题标签 [mechanize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby - ruby mechanize:如何读取下载的二进制 csv 文件
我不太熟悉将 ruby 与二进制数据一起使用。我正在使用 mechanize 将大量 csv 文件下载到我的本地磁盘。然后我需要在这些文件中搜索特定的字符串。
我在 mechanize 中使用 save_as 方法来保存文件(将文件保存为二进制文件)。文件的内容类型(根据机械化)是:
从这里开始,我不确定如何读取文件。我已经尝试将它作为 ruby 中的普通文件读取,但我只是得到二进制数据。我也尝试过使用标准的 unix 工具(字符串/grep)来尝试搜索,但没有任何运气。
当我对其中一个文件运行“文件”命令时,我得到:
我可以用 cat 或 vi 很好地查看数据。使用 vi 我还可以看到一些控制字符。
我也尝试了 csv 和 fastercsv ruby 库,但我得到了“IllegalFormatError”异常。我也尝试过这个解决方案,但没有任何运气。
任何帮助将不胜感激。谢谢。
c# - C# 中的 WebBrowsing - 库、工具等 - Perl 中的任何类似 Mechanize 的东西?
正在寻找类似于 Mechanize for .NET 的东西...
如果你不知道 Mechanize 是什么.. http://search.cpan.org/dist/WWW-Mechanize/
我将在这里维护一个建议列表。用于浏览/发布/屏幕抓取的任何内容(WebRequest 和 WebBrowser Control 除外)。
解析
- HTMLAgilityPack - http://www.codeplex.com/htmlagilitypack
网络应用测试
WatiN - Web 应用程序测试框架 (.NET) - http://watin.sourceforge.net/
测试设计画布的艺术 - 花钱
工具
- 火狐的萤火虫
- IE 的 Internet Explorer 开发人员工具栏
- Chrome 也有一个
笔记
WatiN 与我正在寻找的内容很接近,只是它会打开一个浏览器,这既烦人又令人敬畏。取决于你在做什么。
ruby - 如何使用 mechanize (ruby) 登录 vBulletin 3.6
html 如下所示,或者您可以在这里找到它http://www.vbulletin.org/forum/index.php
我下面的代码不起作用。在我看来,我必须提交一些隐藏字段。有谁知道
- 如何提交隐藏字段?
- 如果我需要提交名称和值或只是其中之一?
- 如何登录vBulleting v3.6
一些文本在文本下方显示为代码
ruby - 如何测试使用 mechanize 的 ruby 应用程序
我写了一个小程序,使用 Mechanize 来遍历一个站点。
我想为它编写测试,但不希望它在我每次运行测试时实际登录网站。我想模拟互联网,这样当它进入某个站点时,它只会返回存储的结果。
这是一个小例子,假设我的代码的目的是从谷歌主页中提取链接,所以我编写了一个测试来确保我的代码找到的第一个链接有文本“图片”。我可能会写这样的东西:
如何模拟 google.com 以便我可以测试 my_code_to_find_links 而无需实际访问互联网的所有开销?
谢谢-乔什
python - 调用 b.form.submit() 后,我可以让我的 mechanize.Browser 实例留在同一页面上吗?
在 Python 的 mechanize.Browser 模块中,当您提交表单时,浏览器实例会转到该页面。对于这个请求,我不想要那个;我希望它只停留在它当前所在的页面上,并在另一个对象中给我响应(用于循环目的)。有谁知道快速做到这一点?
编辑:嗯,所以我有这种使用 ClientForm.HTMLForm.click() 的方法,它返回一个 urllib2 请求,但我需要 mechanize 的 cookiejar 中的 cookie 用于我的 urllib2.urlopen 请求。mechanize 中是否有一种方法可以让我像 urllib2 一样发送请求,但会导入 cookie?
ruby - 机械化和重定向(红宝石)
我认为机械化默认遵循重定向......我的脚本在重定向页面结束。我该如何处理?
重定向页面html
python - 使用 getControl 控制 name 变量以外的对象
我正在使用我在上一个问题中推荐的 Zope 测试浏览器。我面临的问题是我可以使用 getControl 函数来控制不同的对象,例如:密码、用户名等。
我正在尝试提交页面以进入下一页,但提交按钮没有“名称”变量,只有一个“id”变量。“提交”的写法如下:
其他对象写为:
我无权更改此设置。我用来控制“密码”对象的 python zope 代码是:
提交按钮没有“名称”,所以我写了:
这会打印出“id”无效的错误:
有什么方法可以控制“提交”中的其他值之一。
谢谢你的帮助。
python - 使用 easy_install 安装 mechanize
我刚刚下载了easy_install,但是我在安装mechanize 时遇到了问题,我是否应该随时解决站点包。在下面的第一次尝试中,我遇到了一个错误。在下面的第二次尝试中,我没有找到命令,这很奇怪,因为我确定它已下载。
ruby - 无法使用字符串“post”但“POST”识别表单。html 包含“帖子”
不起作用的代码:
login_form = page.form_with(:method => 'post')
和有效的代码:
login_form = page.form_with(:method => 'POST')
我通过检查了表单对象puts page.forms.inspect
并得到了
html源码:
这是错误还是预期行为?