我有一个Genbank
包含许多序列的文件。我在 TSV 中有第二个文本文件,其中包含这些序列的名称以及有关它们的一些其他信息,我将其作为 pandas 数据框读取。我使用 .sample 函数从该数据中随机选择一个名称,并为其分配了变量n_name
,如下面的代码块所示。
n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]
n_name
等于genbank
文件中的轨迹名称,并且大小写准确。我正在尝试解析genbank
文件并提取具有locus = n_name
. 该genbank
文件名为all.gb
. 我有:
from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):
但我不太确定下一行或 2 应该是什么,按轨迹解析?有任何想法吗?