1

基本上,我在这里要做的是读取特定范围的数据(例如,10,000 个值),看看它是否包含我正在寻找的匹配项。如果它不包含该匹配项,那么它会抛出这些值并取下一个 10,000。

例如,如果我有 MD5 哈希“fac2a47adace059aff113283a03f6760”(其值为堆栈),我将从 CSV 文件中加载 10,000 个值并检查该行中的 MD5 哈希是否与我给定的哈希匹配。如果是,那么我打印出该行逗号后面的值,如果不是,则将这 10,000 个值从内存中抛出,然后取出 10,000 个值,直到我得到一个值。

对此的道歉有点不清楚......我想不出一种清晰的解释方式。我目前的处理方法是通过 JSON 将包含所有字符组合(最多 5 个)的字典转储到文本文件中,然后将其加载回内存中进行搜索,这不适用于 5 个字符(引发 MemoryError) .

提前感谢您的帮助,如果您需要澄清,请告诉我!

4

1 回答 1

1

假设匹配行看起来像'fac2a47adace059aff113283a03f6760,stack',你基本上想要这样做:

for row in csv.reader(csvfile):
    if row[0] == "fac2a47adace059aff113283a03f6760":
        print row[1]
        break

如果您的哈希不在第一列或您的预哈希值不在第二列,请将 [0] 和 [1] 调整为正确的索引。

于 2013-02-03T02:17:09.137 回答