0

所以我想我已经尽职尽责,似乎找不到任何正确的东西。

我正在尝试从 git 服务器解析文本文件(url 以 .txt 结尾)并且我尝试使用 urllib 和 urllib2。当我执行以下操作时:

response2 = urllib.urlopen(url2)
data2 = response2.read()

我得到的是html输出。我想要纯文本。我知道我可以使用一些外部库(汤很漂亮),但我真的想保持简单。似乎我应该能够获得此页面(表示文本文件)的原始(复制粘贴样式)输出,而不是 HTML。我也不想从服务器下载它。

在此先感谢代码之神!

编辑:

我现在意识到我实际上也遇到了 git 的身份验证问题,所以这看起来不仅仅是一个简单的 HTML 到文本的交易。我想我会寻找另一种方式。

4

1 回答 1

0

你必须看看urllib.urlretrieve

urlretrieve方法允许您将文件本地存储到指定的路径/文件名。

因此,您的代码应如下所示

filename, headers = urllib.urlretrieve(url)
data = open(filename).read()
于 2013-11-03T02:54:44.003 回答