我有一个包含 800 个元素的列表,我在大约 50k 个文件中查找,每个文件大约 50 行。(这些是带有非通用名称的 xml 标签 - 搜索很简单,所以我没有使用 Beautiful soup。)
每次找到一个时,都会缩短 800 个元素的列表。
遍历文件,
我首先检查每一行是否有关系(检查“spot”、“rover”、“fido”等的行)还是一次检查一个元素的所有行(例如,检查文件中的所有行是否有“spot”,然后检查所有行是否有“rover”等...)?
或者这一切都是低效的?(这是使用python。)我在想:
for line in somefile:
for element in somelist:
if re.search(element, line):
....
或者:
for element in somelist:
for line in somefile:
if re.search(element, line):
....