0

我使用 wget 下载了在过去半小时内发生更改的 ZIP 文件。Zip 文件有一个 csv 文件。Zip 文件可能有新的 csv 文件/修改了我已经下载的文件/未修改特定文件。我需要从 zip 文件中选择这些修改后的文件/新文件并加载到数据库。如果您有任何建议,请告诉我吗?

4

1 回答 1

1

您可以获取存档成员的 CRC 并通过 CRC 进行比较

import zipfile
z = zipfile.ZipFile('d:\\temp\\debug.zip')
for member_info in z.infolist():
    print member_info.orig_filename, member_info.CRC

输出示例(名称,CRC):

 tfr/products/tests/11/data/1000sites 1458294800
 tfr/products/tests/11/data/100sites 1275729396
 tfr/products/tests/11/data/list_of_2.txt 677585194
 tfr/products/tests/11/data/list_of_1.txt 0
于 2012-10-24T14:20:58.840 回答