1

我有一个 CSV 文件中的字符串列表,以及另一个我想搜索这些字符串的文本文件。CSV 文件只有我感兴趣的字符串,但文本文件有一堆其他文本散布在感兴趣的字符串中(我感兴趣的字符串是蛋白质数据库的 ID 号)。解决这个问题的最简单方法是什么?我想检查文本文件中是否存在 CSV 文件中的每个字符串。我在一所顶尖大学的研究实验室工作,所以你将帮助前沿研究!

谢谢 :)

4

1 回答 1

1

我会为此使用 Python。要打印匹配的行,您可以这样做:

import csv
with open("strings.csv") as csvfile: 
    reader = csv.reader(csvfile)
    searchstrings = {row[0] for row in reader}   # Construct a set of keywords
with open("text.txt") as txtfile:
    for number, line in enumerate(txtfile):
        for needle in searchstrings:
            if needle in line: 
                print("Line {0}: {1}".format(number, line.strip()))
                break   # only necessary if there are several matches per line
于 2013-04-22T05:51:16.940 回答