0

我是 python 新手,目前正在寻找一种方法来计算多个 CSV 文件中的关键字。这些文件的一般结构如下:

PDB ID  NDB ID  Structure Title  Citation Title     Abstract
1ARJ    1ARJ    ARG-bound TAR    Structure of       Solution structure of Arginine  
                RNA              some complex RNA   RNA complex.

我想获得一些指导,了解如何编写导入多个 csv 文件或循环输入这些文件的代码,然后返回关键字在记录中出现的次数以及哪个字段包含命中的值。我看过一些关于 csv 导入模块的教程,但我不知道如何使用它。

import csv
my_list = mRNA


words = {}
for items in my_list:
    for item in items.split(', '):
        words.setdefault(item, 0)
        words[item] += 1

with open('mrna.csv', 'w') as fopen:
    writer = csv.writer(fopen)
    for word, count in words.items():
        writer.writerow([word, count])
4

1 回答 1

0

在哪里mRNA定义?也许您应该重新阅读csv 模块示例并尝试从头开始,尝试从 CSV 文件中输出数据,然后再尝试计算关键字。

于 2013-07-15T18:35:24.190 回答