基本上,我在这里要做的是读取特定范围的数据(例如,10,000 个值),看看它是否包含我正在寻找的匹配项。如果它不包含该匹配项,那么它会抛出这些值并取下一个 10,000。
例如,如果我有 MD5 哈希“fac2a47adace059aff113283a03f6760”(其值为堆栈),我将从 CSV 文件中加载 10,000 个值并检查该行中的 MD5 哈希是否与我给定的哈希匹配。如果是,那么我打印出该行逗号后面的值,如果不是,则将这 10,000 个值从内存中抛出,然后取出 10,000 个值,直到我得到一个值。
对此的道歉有点不清楚......我想不出一种清晰的解释方式。我目前的处理方法是通过 JSON 将包含所有字符组合(最多 5 个)的字典转储到文本文件中,然后将其加载回内存中进行搜索,这不适用于 5 个字符(引发 MemoryError) .
提前感谢您的帮助,如果您需要澄清,请告诉我!