5

我正在使用 ftplib 在 Python 中下载文件,直到最近一切似乎都运行良好。我正在下载这样的文件:

ftpSession = ftplib.FTP(host,username,password)
ftpSession.cwd('rlmfiles')
ftpFileList = filter(lambda x: 'PEDI' in x, ftpSession.nlst())
ftpFileList.sort() 
for f in ftpFileList:
    tempFile = open(os.path.join(localDirectory,f),'wb')
    ftpSession.retrbinary('RETR '+f,tempFile.write)
    tempFile.close()
ftpSession.quit()
sys.exit(0)

直到最近,它还在下载我需要的文件,正如预期的那样。但是,现在,我正在下载的文件已损坏,并且仅包含一长串垃圾 ASCII。我知道我要从中提取它们的不是发布到 FTP 上的文件,因为我还有一个 Perl 脚本可以从同一个 FTP 成功执行此操作。

如果是任何附加信息,以下是调试器在下载文件时在命令提示符中显示的内容:

在此处输入图像描述

retrbinary()有没有人在使用Python 的 ftplib时遇到过文件内容损坏的问题?

我真的很困惑/沮丧,没有遇到任何与这里可能存在的腐败有关的事情。任何帮助表示赞赏。

4

1 回答 1

2

我昨天在尝试下载文本文件时遇到了这个问题。不确定这是否是您正在做的事情,但既然您说它里面有 ASCII 垃圾,我假设您在文本编辑器中打开它,因为它应该是文本。

如果是这种情况,则问题在于该文件是一个文本文件,而您正试图以二进制模式下载它。

您要做的是以 ASCII 传输模式检索文件。

tempFile = open(os.path.join(localDirectory,f),'w')  # Changed 'wb' to 'w'
ftpSession.retrlines('RETR '+f,tempFile.write)       # Changed retrbinary to retrlines

不幸的是,这会从文件中删除所有换行符。呸!

因此,您需要再次添加剥离的换行符:

tempFile = open(os.path.join(localDirectory,f),'w')
textLines = []
ftpSession.retrlines('RETR '+f,textLines.append)
tempFile.write('\n'.join(textLines))

这应该可行,但它看起来并不像它可以的那样好。所以一点清理工作会让我们:

temporaryFile   = open(os.path.join(localDirectory, currentFile), 'w')
textLines       = []
retrieveCommand = 'RETR '

ftpSession.retrlines(retrieveCommand + currentFile, textLines.append)
temporaryFile.write('\n'.join(textLines))
于 2016-09-22T21:51:57.460 回答