我正在寻找一种简单的方法来保存源自已发布的 Google 表格文档的 csv 文件?由于它已发布,因此可以通过直接链接访问(在下面的示例中特意修改)。
启动链接后,我所有的浏览器都会提示我保存 csv 文件。
两者都不:
DOC_URL = 'https://docs.google.com/spreadsheet/ccc?key=0AoOWveO-dNo5dFNrWThhYmdYW9UT1lQQkE&output=csv'
f = urllib.request.urlopen(DOC_URL)
cont = f.read(SIZE)
f.close()
cont = str(cont, 'utf-8')
print(cont)
,也不:
req = urllib.request.Request(DOC_URL)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1284.0 Safari/537.13')
f = urllib.request.urlopen(req)
print(f.read().decode('utf-8'))
打印除 html 内容之外的任何内容。
(在阅读了另一篇文章后尝试了第二个版本:Download google docs public spreadsheet to csv with python。)
知道我做错了什么吗?我已经退出了我的 Google 帐户,如果这值得的话,但这适用于我尝试过的任何浏览器。据我了解,Google Docs API 还没有移植到 Python 3 上,并且考虑到我个人使用的小项目的“玩具”规模,从一开始就使用它甚至没有太大意义,如果我可以绕过它。
在第二次尝试中,我离开了“用户代理”,因为我在想可能被认为来自脚本的请求(b/c 不存在标识信息)可能会被忽略,但这并没有什么不同。