3

我正在使用 Python 中的 OpenSubtitle API 创建一个用于下载电影字幕的软件。

API 实现 XML-RPC 协议。根据API 文档,要从站点数据库下载字幕,使用以下方法:

array DownloadSubtitles( $token, array($IDSubtitleFile, $IDSubtitleFile,...) )

它的输出是:

[data] => Array
    (
        [0] => Array
            (
                [idsubtitlefile] => 10
                [data] => MQ0KMDA6MDA6MzgsMzAwIC0tPiAwMDowMDo0MSwwMDA...
            )
        [1] => Array
            (
                [idsubtitlefile] => 20
                [data] => MQ0KMDA6MDA6MjYsMjgzIC0tPiAwMD...
            )

其中 [idsubtitlefile] 是 subtitle_id 而 [data] 是 base64 和 gzip 形式的字幕字节。

我面临的问题是,每当我下载字幕时:

idsubtitlefile='513de0ea27d63b9d631d769a492d72dc'
token='a1t49trievitmjda4ija7dif44'
xmlrpclib.DownloadSubtitles(token,[(idsubtitlefile)] )

我得到这样的结果:

[{'data': 'H4sIAAAAAAAAAwMAAAAAAAAAAAA=',\      
   'idsubtitlefile':'513de0ea27d63b9d631d769a492d72dc'}] 

这里,data值应该是base64编码的二进制字幕数据,但是这么少的数据怎么可能是字幕。

我认为必须以某种方式从服务器上分块下载数据,或者我可能遗漏了一些东西。

4

1 回答 1

3

只是为了稍微放大@Martijn 的评论 - 响应确实是一个空文件,您可以使用如下代码进行验证:

>>> raw = 'H4sIAAAAAAAAAwMAAAAAAAAAAAA='
>>> import base64
>>> decoded = base64.b64decode(raw)
>>> import zlib
>>> decompressed_data=zlib.decompress(decoded, 16+zlib.MAX_WBITS)
>>> print decompressed_data

>>> len(decompressed_data)
0

根据 API 文档,没有什么可以表明您需要做更多的事情。你能用一个已知有字幕的例子重试吗?你在检查错误吗? http://trac.opensubtitles.org/projects/opensubtitles/wiki/XmlRpcStatusCode

编辑:这里列出了一些开源 Python API 用户以防万一他们有帮助: http ://trac.opensubtitles.org/projects/opensubtitles/wiki/ProgramsUsingAPI

于 2014-01-12T13:10:57.997 回答