1

我是 Python 的新用户,我尝试导入 genbank 和 fasta 格式文件。在他们的文档中,他们提供了一个示例来说明我们如何将数据集导入 Python。具体来说,他们在第 16 页的 Biopython 教程和食谱中提供了以下示例:

from  Bio  import  SeqIO

for  seq_record  in  SeqIO.parse("ls_orchid.gbk",  "genbank"):
    print  seq_record.id
    print  repr(seq_record.seq)
    print  len(seq_record)

现在,他们在第 14 页提到 Biopython 源代码包含这个文件,这是真的。但是,python如何通过Bio import SeqIO知道文件到底在哪里呢?请注意,我在安装 biopython 及其组件后尝试了上面的代码,但它从来没有工作过?

另外,我可以指定 genbank 文件的路径并以某种方式打开它!

谢谢

4

3 回答 3

1

您似乎需要将 ls_orchid.gbk 文件保存在与 python 脚本相同的目录中,否则您需要指定文件的完整路径。您也可以从 NCBI 下载任何 genbank 文件并将其添加到目录中,或指定其位置

for seq_record in SeqIO.parse("~/File Location/File Name", "genbank")

于 2013-04-07T00:18:34.747 回答
1

根据http://biopython.org/DIST/docs/tutorial/Tutorial.html#htoc10

您需要将文件复制到本地目录

最初编写本教程时,该搜索只给了我们 94 个命中,我们将其保存为 FASTA 格式的文本文件和 GenBank 格式的文本文件(文件 ls_orchid.fasta 和 ls_orchid.gbk,也包含在 docs 下的 Biopython 源代码中/教程/示例/)。

如果您今天运行搜索,您将获得数百个结果!按照教程进行操作时,如果您想查看相同的基因列表,只需下载上述两个文件或从 Biopython 源代码中的 docs/examples/ 复制它们即可。在第 2.5 节中,我们将了解如何在 Python 中进行这样的搜索。

于 2012-02-12T19:07:42.747 回答
-1

我将 Genbank 和 FASTA 放在 C:\Python27 我可以解析各种其他文件格式,例如 Newick、PhyloXML 等 U 应联系开发人员以获取更多信息

于 2012-04-15T21:32:43.590 回答