5

首先,如果这是一个太愚蠢的问题,我很抱歉......这是我第一次尝试使用该脚本中涉及的任何技术(Python、驱动器 api、oauth 2.0 等)。我发誓在发布问题之前我已经搜索并尝试了大约一周。呵呵呵呵

我正在尝试使用 google-api-python-client 上传一个仅在 Linux Debian 终端上的大文件(3.5GiB)。我在上传小文件方面取得了一些成功,但是当我尝试上传大文件时,上传会在 HTTP 401 错误(未经授权)开始后大约 1~2 小时停止。我一直在寻找如何获得新的访问令牌,但收效甚微。

到目前为止,这是我的(更新的)代码:

#!/usr/bin/python

import httplib2
import pprint
import time

from apiclient.discovery import build
from apiclient.http import MediaFileUpload
from apiclient import errors
from oauth2client.client import OAuth2WebServerFlow

# Copy your credentials from the APIs Console
CLIENT_ID = 'myclientid'
CLIENT_SECRET = 'myclientsecret'

# Check https://developers.google.com/drive/scopes for all available scopes
OAUTH_SCOPE = 'https://www.googleapis.com/auth/drive'

# Redirect URI for installed apps
REDIRECT_URI = 'urn:ietf:wg:oauth:2.0:oob'

# Run through the OAuth flow and retrieve credentials
flow = OAuth2WebServerFlow(CLIENT_ID, CLIENT_SECRET, OAUTH_SCOPE, REDIRECT_URI)
authorize_url = flow.step1_get_authorize_url()
print 'Go to the following link in your browser: ' + authorize_url
code = raw_input('Enter verification code: ').strip()
credentials = flow.step2_exchange(code)

# Create an httplib2.Http object and authorize it with our credentials
http = httplib2.Http()
http = credentials.authorize(http)

drive_service = build('drive', 'v2', http=http)

# Insert a file
media_body = MediaFileUpload('bigfile.zip', mimetype='application/octet-stream', chunksize=1024*256, resumable=True)
body = {
    'title': 'bigfile.zip',
    'description': 'Big File',
    'mimeType': 'application/octet-stream'
}

retries = 0
request = drive_service.files().insert(body=body, media_body=media_body)
response = None
while response is None:
    try:
            print http.request.credentials.access_token
            status, response = request.next_chunk()
            if status:
                    print "Uploaded %.2f%%" % (status.progress() * 100)
                    retries = 0
    except errors.HttpError, e:
            if e.resp.status == 404:
                    print "Error 404! Aborting."
                    exit()
            else:   
                    if retries > 10:
                            print "Retries limit exceeded! Aborting."
                            exit()
                    else:   
                            retries += 1
                            time.sleep(2**retries)
                            print "Error (%d)... retrying." % e.resp.status
                            continue
print "Upload Complete!"

经过一番挖掘,我发现授权的http对象在收到401后会自动刷新访问令牌。虽然它确实改变了访问令牌,但仍然没有按预期继续上传......见下面的输出:

ya29.AHES6ZTo_-0oDqwn3JnU2uCR2bRjpRGP0CSQSMHGr6KvgEE
Uploaded 2.28%
ya29.AHES6ZTo_-0oDqwn3JnU2uCR2bRjpRGP0CSQSMHGr6KvgEE
Uploaded 2.29%
ya29.AHES6ZTo_-0oDqwn3JnU2uCR2bRjpRGP0CSQSMHGr6KvgEE
Uploaded 2.29%
ya29.AHES6ZTo_-0oDqwn3JnU2uCR2bRjpRGP0CSQSMHGr6KvgEE
Uploaded 2.30%
ya29.AHES6ZTo_-0oDqwn3JnU2uCR2bRjpRGP0CSQSMHGr6KvgEE
Error (401)... retrying.
ya29.AHES6ZQqp3_qbWsTk4yVDdHnlwc_7GvPZiFIReDnhIIiHao
Error (401)... retrying.
ya29.AHES6ZSqx90ZOUKqDEP4AAfWCVgXZYT2vJAiLwKDRu87JOs
Error (401)... retrying.
ya29.AHES6ZTp0RZ6U5K5UdDom0gq3XHnyVS-2sVU9hILOrG4o3Y
Error (401)... retrying.
ya29.AHES6ZSR-IOiwJ_p_Dm-OnCanVIVhCZLs7H_pYLMGIap8W0
Error (401)... retrying.
ya29.AHES6ZRnmM-YIZj4S8gvYBgC1M8oYy4Hv5VlcwRqgnZCOCE
Error (401)... retrying.
ya29.AHES6ZSF7Q7C3WQYuPAWrxvqbTRsipaVKhv_TfrD_gef1DE
Error (401)... retrying.
ya29.AHES6ZTsGzwIIprpPhCrqmoS3UkPsRzst5YHqL-zXJmz6Ak
Error (401)... retrying.
ya29.AHES6ZSS_1ZBiQJvZG_7t5uW3alsy1piGe4-u2YDnwycVrI
Error (401)... retrying.
ya29.AHES6ZTLFbBS8mSFWQ9zK8cgbX8RPeLghPxkfiKY54hBB-0
Error (401)... retrying.
ya29.AHES6ZQBeMWY50z6fWXvaCcd5_AJr_AYOuL2aiNKpK-mmyU
Error (401)... retrying.
ya29.AHES6ZTs2mYYSEyOqI_Ms4itKDx36t39Oc5RNZHkV4Dq49c
Retries limit exceeded! Aborting.

我正在使用安装了 Python 2.5.2 的 debian lenny,大约一周前通过 pip install 安装了 ssl 和 google-api-python-client。

提前感谢您的帮助。

编辑:显然,问题不在于 api。我尝试了上面相同的代码,但是有两个小文件,它们之间有 1h (system.sleep())。输出是:

ya29.AHES6ZRUssiLfuhqCP9Cu7C7LuhRV2rYzPldU27wiMJZWb8
Uploaded 66.89%
ya29.AHES6ZRUssiLfuhqCP9Cu7C7LuhRV2rYzPldU27wiMJZWb8
Upload 1 Complete!
ya29.AHES6ZRUssiLfuhqCP9Cu7C7LuhRV2rYzPldU27wiMJZWb8
Uploaded 57.62%
ya29.AHES6ZQd3o1ciwXpNFImH3CK0-dJAtQba_oeIO9DDbIq154
Upload 2 Complete!

对于第二次上传,成功使用了新的访问令牌。那么,也许可恢复会话会在一段时间后到期,或者仅对该特定访问令牌有效?

4

2 回答 2

4

在 google-api-python-client 项目上提出了一个问题,根据 google 的Joe Gregorio 的说法,问题出在后端:

“这是后端的问题,而不是 API 或您的代码的问题。正如您推断的那样,如果上传时间过长,access_token 将过期,此时无法继续可恢复的上传。有工作正在进行中立即修复此问题,一旦问题在服务器端得到修复,我将更新此错误。”

于 2013-01-14T15:02:02.260 回答
0

我认为问题是在 1-2 小时限制后,您对远程数据库的访问令牌过期;切断与远程服务器的连接。我认为您可以做的是查看您的主机 API 手册...他们应该在其中包含有关“刷新令牌”的内容(他们为您提供了另一个访问令牌,请注意,某些主机仅允许您在每个会话中使用一个刷新令牌),如果他们被允许无限量,您可以使用计时器和 AJAX 的组合来继续要求更多的访问令牌。

如果没有,那么您将对另一个授权令牌发出 AJAX 请求,并每小时将其交换为另一个访问令牌。这听起来像是一个非常严格的过程,但我认为这是你的令牌不断过期的唯一方法。

另外,您是否尝试过其他上传方法?如果你说上面的脚本运行了 1-2 个小时,它只上传了 1.44% 的文件,完全上传可能需要 100 多个小时(对于只有 3 Gig 来说太长了)。

于 2013-01-11T21:08:31.393 回答