问题标签 [mechanize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1449 浏览

ruby - ruby mechanize:如何读取下载的二进制 csv 文件

我不太熟悉将 ruby​​ 与二进制数据一起使用。我正在使用 mechanize 将大量 csv 文件下载到我的本地磁盘。然后我需要在这些文件中搜索特定的字符串。

我在 mechanize 中使用 save_as 方法来保存文件(将文件保存为二进制文件)。文件的内容类型(根据机械化)是:

从这里开始,我不确定如何读取文件。我已经尝试将它作为 ruby​​ 中的普通文件读取,但我只是得到二进制数据。我也尝试过使用标准的 unix 工具(字符串/grep)来尝试搜索,但没有任何运气。

当我对其中一个文件运行“文件”命令时,我得到:

我可以用 cat 或 vi 很好地查看数据。使用 vi 我还可以看到一些控制字符。

我也尝试了 csv 和 fastercsv ruby​​ 库,但我得到了“IllegalFormatError”异常。我也尝试过这个解决方案,但没有任何运气。

任何帮助将不胜感激。谢谢。

0 投票
7 回答
5510 浏览

c# - C# 中的 WebBrowsing - 库、工具等 - Perl 中的任何类似 Mechanize 的东西?

正在寻找类似于 Mechanize for .NET 的东西...

如果你不知道 Mechanize 是什么.. http://search.cpan.org/dist/WWW-Mechanize/

我将在这里维护一个建议列表。用于浏览/发布/屏幕抓取的任何内容(WebRequest 和 WebBrowser Control 除外)。

解析

网络应用测试

工具

  • 火狐的萤火虫
  • IE 的 Internet Explorer 开发人员工具栏
  • Chrome 也有一个

笔记

WatiN 与我正在寻找的内容很接近,只是它会打开一个浏览器,这既烦人又令人敬畏。取决于你在做什么。

0 投票
1 回答
1317 浏览

ruby - 如何使用 mechanize (ruby) 登录 vBulletin 3.6

html 如下所示,或者您可以在这里找到它http://www.vbulletin.org/forum/index.php

我下面的代码不起作用。在我看来,我必须提交一些隐藏字段。有谁知道

  • 如何提交隐藏字段?
  • 如果我需要提交名称和值或只是其中之一?
  • 如何登录vBulleting v3.6

一些文本在文本下方显示为代码

0 投票
4 回答
3664 浏览

ruby - 如何测试使用 mechanize 的 ruby​​ 应用程序

我写了一个小程序,使用 Mechanize 来遍历一个站点。

我想为它编写测试,但不希望它在我每次运行测试时实际登录网站。我想模拟互联网,这样当它进入某个站点时,它只会返回存储的结果。

这是一个小例子,假设我的代码的目的是从谷歌主页中提取链接,所以我编写了一个测试来确保我的代码找到的第一个链接有文本“图片”。我可能会写这样的东西:

如何模拟 google.com 以便我可以测试 my_code_to_find_links 而无需实际访问互联网的所有开销?

谢谢-乔什

0 投票
1 回答
1064 浏览

python - 调用 b.form.submit() 后,我可以让我的 mechanize.Browser 实例留在同一页面上吗?

在 Python 的 mechanize.Browser 模块中,当您提交表单时,浏览器实例会转到该页面。对于这个请求,我不想要那个;我希望它只停留在它当前所在的页面上,并在另一个对象中给我响应(用于循环目的)。有谁知道快速做到这一点?

编辑:嗯,所以我有这种使用 ClientForm.HTMLForm.click() 的方法,它返回一个 urllib2 请求,但我需要 mechanize 的 cookiejar 中的 cookie 用于我的 urllib2.urlopen 请求。mechanize 中是否有一种方法可以让我像 urllib2 一样发送请求,但会导入 cookie?

0 投票
1 回答
2529 浏览

python - 带有机械化的自定义身份验证处理程序

我想将python-ntlm与 mechanize.Browser() 一起使用

这是我用于 urlopen 的代码

按要求追溯

0 投票
2 回答
7784 浏览

ruby - 机械化和重定向(红宝石)

我认为机械化默认遵循重定向......我的脚本在重定向页面结束。我该如何处理?

重定向页面html

0 投票
1 回答
826 浏览

python - 使用 getControl 控制 name 变量以外的对象

我正在使用我在上一个问题中推荐的 Zope 测试浏览器。我面临的问题是我可以使用 getControl 函数来控制不同的对象,例如:密码、用户名等。

我正在尝试提交页面以进入下一页,但提交按钮没有“名称”变量,只有一个“id”变量。“提交”的写法如下:

其他对象写为:

我无权更改此设置。我用来控制“密码”对象的 python zope 代码是:

提交按钮没有“名称”,所以我写了:

这会打印出“id”无效的错误:

有什么方法可以控制“提交”中的其他值之一。

谢谢你的帮助。

0 投票
4 回答
16051 浏览

python - 使用 easy_install 安装 mechanize

我刚刚下载了easy_install,但是我在安装mechanize 时遇到了问题,我是否应该随时解决站点包。在下面的第一次尝试中,我遇到了一个错误。在下面的第二次尝试中,我没有找到命令,这很奇怪,因为我确定它已下载。

0 投票
1 回答
122 浏览

ruby - 无法使用字符串“post”但“POST”识别表单。html 包含“帖子”

不起作用的代码:

login_form = page.form_with(:method => 'post')

和有效的代码:

login_form = page.form_with(:method => 'POST')

我通过检查了表单对象puts page.forms.inspect并得到了

html源码:

这是错误还是预期行为?