我是 python 新手,目前正在寻找一种方法来计算多个 CSV 文件中的关键字。这些文件的一般结构如下:
PDB ID NDB ID Structure Title Citation Title Abstract
1ARJ 1ARJ ARG-bound TAR Structure of Solution structure of Arginine
RNA some complex RNA RNA complex.
我想获得一些指导,了解如何编写导入多个 csv 文件或循环输入这些文件的代码,然后返回关键字在记录中出现的次数以及哪个字段包含命中的值。我看过一些关于 csv 导入模块的教程,但我不知道如何使用它。
import csv
my_list = mRNA
words = {}
for items in my_list:
for item in items.split(', '):
words.setdefault(item, 0)
words[item] += 1
with open('mrna.csv', 'w') as fopen:
writer = csv.writer(fopen)
for word, count in words.items():
writer.writerow([word, count])