我正在尝试编写一个 python 代码来匹配 python 中两个列表中的内容。
一个制表符分隔的文件如下所示:
COPB2
KLMND7
BLCA8
如果你愿意的话,另一个文件 2 有一长串看起来相似的“名字”。文件中应该有一些相同的匹配项,我已成功识别并写入新文件。问题是当“名称”之一的末尾有其他字符时。例如,COPB2
从上面应该匹配COPB2A
file2,但它不匹配。同样KLMND7
应该匹配KLMND79
。我应该使用正则表达式吗?把它们变成字符串?任何想法都有帮助,谢谢!
在下面看到的第一个响应之后,我到目前为止所做的工作:
with open(in_file1, "r") as names:
for line in names:
file1_list = [i.strip() for i in line.split()]
file1_str = str(file1_list)
with open(in_file2, "r") as symbols:
for line in symbols:
items = line.split("\t")
items = str(items)
matches = items.startswith(file1_str)
print matches
False
当我知道应该有一些匹配时,此代码会返回。