3

我正在使用 python 加密一些文件,但是我在逐块读取文件时遇到问题。

它有时不会返回最后一个块的所有数据。

当文件长度为 307200 字节时,我没有问题。当它的长度为 279363 字节时,我会这样做。

我在 2 个文件上运行了这段代码(分别为 307200 和 279363 字节大)

chunksize = 65536
w = open(filename + '.' + str(cs) + '.split', 'wb')
tdata = f.read(307200)
w.write(tdata)
w.close

infile.open(filename + '.' + str(cs) + '.split', 'rb')

while True:
    chunk = infile.read(chunksize)
    print "Chunk length: " + str(len(chunk))
    if len(chunk) == 0:
        break
    elif len(chunk) % 16 != 0:
        chunk += ' ' * (16 - len(chunk) % 16)

我得到了这个:

文件 1 (307200):
块长度:65536
块长度:65536
块长度:65536
块长度:65536
块长度:45056
块长度:0

文件 2 (279363):
块长度:65536
块长度:65536
块长度:65536
块长度:65536
块长度:16384
块长度:0

如您所见,第一个文件的所有块大小的总和是正确的,第二个文件的总和是错误的。我不知道为什么。

我的 Python 版本是 2.6.5
(在 Ubuntu 10.04.2 LTS 上运行)

*编辑:我自己的愚蠢错误。我在阅读我刚刚编写的文件之前使用w.close而不是,这导致了问题。w.close()

4

3 回答 3

4

你在 Windows 上运行吗?如果是这样,您可能需要以二进制模式打开文件

infile = open('somefile','rb')
于 2011-04-13T15:26:18.307 回答
1

我现在觉得自己很愚蠢,但我很高兴没有其他人注意到同样的问题。

我在调用 w.close,而不是 w.close()

于 2011-06-22T22:27:37.683 回答
0

这很奇怪。

您是否从名为“filename”的文件中创建了第二个文件作为第一个文件并将307200替换为279363

顺便说一句,文件名的扩展名很奇怪:'.split'

.

我建议您运行此代码:

from os.path import getsize

chunksize = 65536

for x in xrange(279363,307201):
    w = open(filename + '.' + str(cs) + '.split', 'wb')
    tdata = f.read(x)
    w.write(tdata)
    w.close

    siz = getsize(filename + '.' + str(cs) + '.split')
    if siz!=x:
        print 'file has not the right size'
        print 'x=='+str(x)+'   size of created file : '+str(siz)

    infile.open(filename + '.' + str(cs) + '.split', 'rb')

    li = []
    while True:
        chunk = infile.read(chunksize)
        li.append(str(len(chunk)))
        if len(chunk) == 0:
            break

    if sum(li)==x:
        print 'good at '+str(x)
        break

也试试

from os import fsync

chunksize = 65536 
w = open(filename + '.' + str(cs) + '.split', 'wb') 
tdata = f.read(307200) 
w.write(tdata)
w.flush()
fsync(w.fileno())
w.close 
于 2011-04-13T17:38:20.537 回答