我必须循环使用 200 万行的大文件,看起来像这样
P61981 1433G_HUMAN
P61982 1433G_MOUSE
Q5RC20 1433G_PONAB
P61983 1433G_RAT
P68253 1433G_SHEEP
目前我有以下函数,它获取列表中的每个条目,如果这个大文件中的条目 - 它占用了发生的行,但它很慢(~10分钟)。可能由于循环方案,您能建议优化吗?
up = "database.txt"
def mplist(somelist):
newlist = []
with open(up) as U:
for row in U:
for i in somelist:
if i in row:
newlist.append(row)
return newlist
的例子somelist
somelist = [
'P68250',
'P31946',
'Q4R572',
'Q9CQV8',
'A4K2U9',
'P35213',
'P68251'
]