ruby - 我可以使用 Mechanize 下载扩展名为 .docx 和 .xlsx,.txt 的文件吗？

Question

我浏览了文档Mechanize。以下仅供.pdf参考。

require 'mechanize'

agent = Mechanize.new
agent.pluggable_parser.pdf = Mechanize::FileSaver
agent.get 'http://example.com/foo.pdf'

score 2 · Accepted Answer

文件类型无关紧要；任何可以通过网络访问的文件都可以通过 mechanize 获得，它是一个与 Mechanize 进行自动化交互的工具。
该文件将存储在程序运行的目录中。使用Mechanize::Download而不是Mechanize::FileSaver指定文件应下载到的位置。此处的示例代码：https ://stackoverflow.com/a/9105153/429758 （在文件名中指定完整路径）
Mechanize 在下载时不使用浏览器。For all intents and purposes, Mechanize acts like a web browser with no user interface通过http://ruby.about.com/od/tasks/a/The-Mechanize-2-0-Handbook.htm

请查看 mechanize 文档上的示例页面以获取有关如何使用 mechanize 的更多示例。

score 2 · Accepted Answer

像这样保存文件可能更简单：

File.open('myfname.pdf', 'wb'){|f| f << agent.get('http://example.com/foo.pdf').body}

2 回答 2