2

我正在尝试从使用 CDN 进行分发的网站下载文件。下载页面上的 URL 都以 file.pdf 结尾,但在浏览器中单击链接会导致下载具有描述性文件名的文件(例如“invoice1234.pdf”)。显然,解析 URL 以获取文件名会导致每个文件都被命名为 file.pdf - 我想使用通过浏览器下载时使用的相同文件名。我的代码看起来像这样:

  filename = File.basename(download.href)
  agent.pluggable_parser.default = Mechanize::Download
  agent.get(mov_download_link.href).save("#{path}/#{filename}")
  agent.pluggable_parser.default = Mechanize::File

任何想法,将不胜感激!

4

1 回答 1

2

该文件名可能位于如下所示的标头中:

{'content-disposition' => 'filename="invoice1234.pdf"'}

如果是这样:

f = agent.get(mov_download_link.href)
filename = f.header['content-disposition'][/"(.*)"/, 1]
f.save("#{path}/#{filename}")
于 2012-12-11T04:52:12.157 回答