我有一个 CSV 文件中的字符串列表,以及另一个我想搜索这些字符串的文本文件。CSV 文件只有我感兴趣的字符串,但文本文件有一堆其他文本散布在感兴趣的字符串中(我感兴趣的字符串是蛋白质数据库的 ID 号)。解决这个问题的最简单方法是什么?我想检查文本文件中是否存在 CSV 文件中的每个字符串。我在一所顶尖大学的研究实验室工作,所以你将帮助前沿研究!
谢谢 :)
我有一个 CSV 文件中的字符串列表,以及另一个我想搜索这些字符串的文本文件。CSV 文件只有我感兴趣的字符串,但文本文件有一堆其他文本散布在感兴趣的字符串中(我感兴趣的字符串是蛋白质数据库的 ID 号)。解决这个问题的最简单方法是什么?我想检查文本文件中是否存在 CSV 文件中的每个字符串。我在一所顶尖大学的研究实验室工作,所以你将帮助前沿研究!
谢谢 :)
我会为此使用 Python。要打印匹配的行,您可以这样做:
import csv
with open("strings.csv") as csvfile:
reader = csv.reader(csvfile)
searchstrings = {row[0] for row in reader} # Construct a set of keywords
with open("text.txt") as txtfile:
for number, line in enumerate(txtfile):
for needle in searchstrings:
if needle in line:
print("Line {0}: {1}".format(number, line.strip()))
break # only necessary if there are several matches per line