问题标签 [ncbi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
308 浏览

python - 使用python根据关键字获取蛋白质FASTA序列

我想用 python 2.7 从 Entrez 收集蛋白质 FASTA 序列。我正在寻找任何具有关键字的蛋白质:名称中的“终止酶”和“大”。到目前为止,我得到了这段代码:

然而,它可以让我从各种生物体中获得几个终止酶,而我只需要形成噬菌体的终止酶(特别是病毒 [taxid 10239],宿主细菌。我已经设法从我感兴趣的病毒的 NCBI 获得了 nuccore 登录 ID,但是我不知道如何结合这两个信息。id文件如下所示:

我是否需要访问每个 ID 的每个 gb 文件并在其中搜索我想要的蛋白质?

0 投票
0 回答
642 浏览

blast - PSIPRED,如何安装并使其工作?

我正在尝试设置 PSIPRED 以运行二级结构预测,但 README.md 文件不够详细,无法让像我这样的初学者设置和运行 PSIPRED。我正在尝试将它与 BLAST+ 一起使用。

我使用的是 Linux Ubuntu 17.04 操作系统,以下是我尝试设置 PSIPRED 的步骤。似乎缺少我不确定如何安装或找到它们所在位置的程序以及缺少的命令:

我怎样才能让 PSIPRED 工作?我做错了什么?我在哪里可以获得使 PSIPRED 工作所需的所有外部程序?我错过了什么?

0 投票
1 回答
465 浏览

python - ete3:如何从分类 id 中获取分类等级名称?

我想用它来转换一堆标识符,但我需要确切地知道为每个分类代码分配了哪个分类等级。下面显示的是一个有意义的转换示例,但我不知道如何标记一些分类调用。基本分类等级是:(域、界、门、类、目、科、属和种) https://en.wikipedia.org/wiki/Taxonomic_rank

在大多数情况下,这很容易,但如果有细菌的亚种和菌株,这可能会让人感到困惑。

如何让 ete3 指定谱系 ID 在分类等级中对应的等级?

0 投票
1 回答
1684 浏览

command-line - Blast+ 本地配置:如何配置 nt 和 nr 数据库?

我正在我的 mac (os sierra) 上配置 Blast+,并且在配置我也在本地下载的 nr 和 nt 数据库时遇到了问题。我在这里尝试按照NCBI 的说明进行操作,并且正在关注配置和示例执行步骤。

他们说要更改我的 .bash_profile 以使其显示:

这很好用,他们说“类似地”为 BLASTDB 配置路径,但配置到我的数据库所在的文件,所以我这样做了:

它指定了我从他们的 FTP 解压缩 nt tar 文件时得到的确切文件夹。使用此路径,如果我运行命令...

然后它成功运行并且我得到了结果,但我担心这些只是针对整个 nt.00 数据库文件的 nt.00 部分进行检查,特别是因为如果我在 Web Blast 上运行我的 test_query.fa 序列,我得到不同的结果。

此外,他们的说明说路径只需要指向包含整个数据库文件夹 nt.00 的文件夹,来自我解压缩的 tar - 而不是特定的 nt.00 本身 - 在我的情况下就是“blastdb/”(与“blastdb/nt.00/”相反,后者包含 nt.00.nhd、nt.00.nal等)。这是有道理的,因为当我工作时,我希望能够通过在我的命令上更改 -db 标志来对 nt 数据库进行 blastn 以及对 nr 数据库进行blastp 等,并且拥有它们应该没有问题都在这个文件夹里吧?但是,如果我必须指定 BLASTDB 的路径并在末尾添加 nt.00 DB,我怎么能在同一个文件夹 (blastdb/) 中使用 nr.00? 本质上,我想按照说明进行操作,并且只需:

然后根据我想使用的数据库,我可以在我的命令上的 -db 标志之后这么说。但是当我像上面那样制作路径时,它给了我这个错误:

我已经尝试从上面运行相同的blastn命令并将“nt”换成“nt.00”,并尝试了这些命令,BLASTDB的路径以“blastdb/”和“blastdb/nt”结尾,当然还有“ blastdb/nt.00",这是唯一一个没有错误运行的。

这是我读到的另一个线程的示例,其中 OP 担心他的执行没有检查整个 nt.00 文件夹,但这与我的问题不同。

谢谢你的帮助!

0 投票
1 回答
268 浏览

python-3.x - 获取给定 taxID 下的 NCBI taxID

有点类似于这个线程:

如何从出租车中获取分类等级名称?

我有一个属的taxID,我想提取该属下的所有taxID 或登录号。任何人都可以建议吗?

0 投票
1 回答
530 浏览

python - 多个序列上的 Bio.Blast (NCBIWWW) 失败并停止

我正在尝试通过 BLAST 解析几十个序列,在 Python 2.7 中使用 Bio.Blast 和 NCBIWWW。一个或几个序列没有问题,但 NCBIWWW.qblast() 总是在大约 5-7 次迭代 BLAST 搜索后停止。重要的是,程序不会因错误而崩溃和退出——它只是停止,并永远冻结。我必须手动退出应用程序。这也不是 Internet 连接的问题 - 没有错误表明这一点。

我不知道出了什么问题。我的代码中是否存在阻止多次 BLAST 搜索的错误,或者是否有用于此目的的替代算法?

我的代码:

0 投票
2 回答
2252 浏览

api - 下载 PMC 和 PubMed 数据库中的所有全文文章

根据 NCBI 帮助台回答的问题之一,我们不能“批量下载” PubMed Central。但是,我是否可以使用“NCBI E-utilities”通过Efetch下载 PMC 数据库中的所有全文论文,或者至少在 Entrez Programming Utilities 中使用 Esearch 找到所有相应的PMCid ?如果是,那么如何?如果不能使用E-utilities,有没有其他方法可以下载所有全文文章?

0 投票
1 回答
39 浏览

python - 从字典列表的组合中提取值

eutils形式 NCBI 为特定请求返回以下对象。从中我想提取值245540。我怎样才能做到这一点?

0 投票
0 回答
156 浏览

bioinformatics - 如何仅对 TrEMBL 进行 BLAST

我正在使用 BioPython 进行命令行 BLAST。我需要搜索 TrEMBL,但我无法找到如何做到这一点。我知道我可以选择 db="nr",这很有效,但我只想搜索 TrEMBL,它构成 nr 序列的子集。另外,我需要能够在线进行,而不是远程进行!

编辑:如果有人遇到同样的问题:经过大量实验,我设法完成这项工作的唯一方法是下载 NCBI BLAST+ 并在独立准备好的库上进行远程搜索。如有疑问,请与我联系。

0 投票
1 回答
389 浏览

c++ - ncbi C++ 异常(在函数 GetSeqEntry() 中)

windows10上的NCBI

我在命令行输入如下命令,想要获取pssm:

但我得到了 C++ 异常:

1.sequence.txt:

我在第 649 行搜索 GetSeqEntry()

我怎么解决这个问题?