34

我正在尝试使用 Python 的 ftplib 读取文件而不编写它们。大致相当于:

def get_page(url):
    try:
        return urllib.urlopen(url).read()
    except:
        return ""

但使用 FTP。

我试过:

def get_page(path):
    try:
        ftp = FTP('ftp.site.com', 'anonymous', 'passwd')
        return ftp.retrbinary('RETR '+path, open('page').read())
    except:
        return ''

但这不起作用。文档中唯一的示例涉及使用该ftp.retrbinary('RETR README', open('README', 'wb').write)格式编写文件。是否可以在不先写入的情况下读取 ftp 文件?

4

1 回答 1

62

好吧,答案摆在您面前:该FTP.retrbinary方法接受作为第二个参数的对函数的引用,该函数在从 FTP 连接检索文件内容时调用。

这是一个简单的例子:

#!/usr/bin/env python
from ftplib import FTP

def writeFunc(s):
  print "Read: " + s

ftp = FTP('ftp.kernel.org') 
ftp.login()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', writeFunc)

您应该实现writeFunc它实际上将读取的数据附加到内部变量,就像这样,它使用可调用对象:

#!/usr/bin/env python
from ftplib import FTP

class Reader:
  def __init__(self):
    self.data = ""
  def __call__(self,s):
     self.data += s

ftp = FTP('ftp.kernel.org') 
ftp.login()
r = Reader()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r)

print r.data

更新:我意识到 Python 标准库中有一个用于此类事情的模块BytesIO

#!/usr/bin/env python
from ftplib import FTP
from io import BytesIO

ftp = FTP('ftp.kernel.org') 
ftp.login()
r = BytesIO()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r.write)

print r.getvalue()
于 2012-06-26T14:17:35.377 回答