0

我在特定的 url 有一个 wmv 文件,我想使用 Python 抓取并保存为文件。我的脚本使用 urllib2 来验证和读取字节并将它们以块的形式保存在本地。但是,一旦我打开文件,没有视频播放器可以识别它。当我从浏览器手动下载 wmv 时,该文件可以正常播放,但奇怪的是最终比我最终使用 Python 的文件小了大约 500kb。这是怎么回事?是否有我需要以某种方式排除的标题信息?

4

3 回答 3

0

据我了解,urllib 在 HTTP 级别工作,应该正确删除后续块中的标头。我查看了 read() 返回的数据,它都是字节。

于 2011-02-03T15:32:08.373 回答
0

服务器发回的传输编码是什么?我敢打赌它会发回 Transfer-Encoding: chunked,它最终会出现在您的数据中。

http://en.wikipedia.org/wiki/Chunked_transfer_encoding

于 2011-02-03T06:40:40.657 回答
0

我在 Windows 机器上使用模式 'w' 编写文件。写入二进制数据应使用模式 'wb' 完成,否则 EOL 将不正确。

于 2011-02-04T16:15:28.720 回答