问题标签 [blast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2612 浏览

python - Biopython本地BLAST数据库错误

我正在尝试使用 Biopython 的 NcbiblastxCommandline 工具使用“nr”数据库在本地运行 blastx,但我总是收到有关蛋白质数据库搜索路径的以下错误:

我不确定如何更改路径以指向我下载的 nr 数据库,但我认为我正确地指出了它,因为我可以从命令行运行此代码而没有任何问题:

如我所料,上面的命令行代码创建了爆炸结果的 xml 文件。

任何使用 Biopython NCBI 命令行工具解决此问题的帮助将不胜感激!

0 投票
0 回答
494 浏览

blast - 我在 blast 上安装了一个,并且正在使用本地微生物数据库来运行 BLAST 搜索。“blastn”工作

我已经在我的 Linux 机器上安装了 BLAST+ 以及微生物数据库的本地副本。“blastn”适用于类似的查询

但是,blastp 失败,例如

BLAST 数据库错误:在搜索路径 [..../databases] 中找不到蛋白质数据库 [16SMicrobial] 的别名或索引文件

我的数据库目录有这些文件-

16SMicrobial.nhr 16SMicrobial.nnd 16SMicrobial.nog 16SMicrobial.nsi 16SMicrobial.nin 16SMicrobial.nni 16SMicrobial.nsd 16SMicrobial.nsq

我的.ncbirc文件有

请问有什么问题吗?

0 投票
1 回答
1088 浏览

python - 从blastx输出文件中提取特定条目,写入新文件

我创建了一个脚本,可以在 XML 格式的 Blastx 输出文件中成功搜索关键字(由用户指定)。现在,我需要将对齐标题中包含关键字的那些记录(查询、命中、分数、evalue 等)写入新文件。

我为每个查询标题、命中标题、电子值和对齐长度创建了单独的列表,但似乎无法将它们写入新文件。

  • 问题 #1:如果 Python 出错,并且其中一个列表缺少值……怎么办?然后所有其他列表将提供有关查询的错误信息(“线滑点”,如果您愿意的话......)。

  • 问题 #2:即使 Python 没有错误,并且所有列表的长度相同,我如何将它们写入文件,以便每个列表中的第一项相互关联(因此,项目 #10 来自每个列表也关联?)我应该创建一个字典吗?

  • 问题#3:字典只有一个键值,如果我的查询有几个不同的命中怎么办?不确定它是否会被覆盖或跳过,或者它是否会出错。有什么建议么?我当前的脚本:

    /li>
0 投票
1 回答
309 浏览

python - 使用 Biopython 在线运行 BLAST 的语法错误

我正在尝试构建一个脚本,以按照 Biopython 教程和食谱(第 7 章)将焦磷酸测序的 fasta 文件与核苷酸 GenBank 数据库进行比较。

在进程运行时,提示符会显示以下消息:

而且我不知道问题是什么,或者如何解决它。我的脚本中可能有后来的错误。但现在,我不能继续用它来唤醒。

0 投票
1 回答
204 浏览

biopython - Biopython 找不到文件

我正在尝试从 Python 提示符运行 qblast,在导入我需要的所有库后,Python 找不到我的文件:

我试图写下文件的所有路径(“/Users/imac ...”)并将文件移动到 Python 和 Biopython 文件夹,我得到了相同的消息。

我必须在哪里保存我的文件?我究竟做错了什么?

0 投票
2 回答
555 浏览

php - 未找到文件,但文件存在

我正在一个服务器上工作,用户应该能够对数据库运行蛋白质序列,它使用一个名为 blastall 的可执行文件。服务器生成一个可执行文件,然后它应该使用批处理运行该可执行文件。但是,它似乎没有运行。这是生成可执行文件的示例(cmd.sh):

末尾的疯狂数字是根据作业提交时间自动生成的作业 ID。有两个问题,我试图一次解决一个。第一个问题是,当手动执行(我只是运行 ./cmd.sh)时,我收到以下错误:

但这对我来说真的没有意义,因为指定的目录实际上包含blastall。它具有完整的 rwx 权限,并且沿途的每个目录都具有适当的权限。

工具中的 blast.php 文件如下所示:

当然在它上面有变量声明,do_blast 函数看起来像这样(再次在它上面声明变量和一个 cd 以便目录工作):

知道可能导致此问题的原因是什么吗?我认为这可能是因为我正在运行它并且它是由 apache 创建的,但是所有用户都允许使用 rwx。如果需要,我可以包含更多信息,但我现在选择不包含,因为编写 PHP 的原始人将所有内容拆分为大量小文件,因此很难确定问题的确切位置。非常感谢任何想法(如果不是完整的解决方案)。

编辑:找到解决方案。事实证明,blastall 可执行文件是在不同的 linux 系统上编译的。切换到不同的可执行文件,它运行完美。

0 投票
2 回答
92 浏览

database - 使 Blast 搜索花费更长的时间

我指的是这个链接:http ://www.ncbi.nlm.nih.gov/books/NBK52637/ ,尝试在单机上进行爆炸搜索。我从 NCBI 网站下载了 blast 应用程序和 refseq_rna blast 数据库。爆炸搜索只需几秒钟即可获得结果。我想问是否有任何方法可以使爆炸搜索花费更多时间来搜索爆炸数据库上的匹配序列?

0 投票
1 回答
136 浏览

xml - 我有一个来自 BLAST 的 XML 输出文件,如何在 PDB 数据库中找到匹配项?

我有一个爆炸输出 XML 文件,我想找到一种通过 RSCB 蛋白质数据库运行文件内容的方法,以便在我的输出文件和使用 Python 的 PDB 中的任何内容之间找到某种同源性。

我对所有这一切还是陌生的,并且很难开始这个。提前致谢!

0 投票
1 回答
1416 浏览

bash - 使用 bash 以科学计数法读取数字

作为新鱼基因组注释管道的一部分,需要比较来自 BLAST 的 e 值,以查看它们是否低于某个阈值。

为了获得正确的语义,我首先评估了爆炸输出中的其他列之一,它可以像这样正常工作:

然后 $4 是 BLAST 输出中的一列,其中包含整个数值(命中长度或其他内容)

但是,当我尝试将脚本更改为使用 e 值时,科学记数法等的解释存在一些问题......

我想要的是这样的:

其中 $11 指向每个命中的 e 值。

这可以在bash中以一种不繁琐的方式完成吗?

0 投票
1 回答
1893 浏览

python - 使用 NcbiblastxCommandline 自定义爆炸数据库

这是我第一次在 biopython 中使用 blast,我遇到了问题。

我从一个包含 20 个序列的 fasta 文件创建了一个自定义爆炸数据库,使用:

os.system('makeblastdb -in newtest.fasta -dbtype nucl -out newtest.db')

这确实在我当前工作的当前目录中生成了几个文件(newtest.db.nhr、newtest.db.nin、newtest.db.nsq):(/home/User/Documents/python/fasta-files

现在我正在尝试使用以下命令在 biopython 中查询这个数据库:

但我收到了这个错误:

所以我尝试复制从/home/User/Documents/python/fasta-filesto生成的文件,/usr/share/ncbi/blastdb但它说我没有权限。

*编辑*

当我使用时:os.system("blastn -db newtest.db -query "fastafile.fas" + " -out test.txt") 它可以正常工作,生成输出文件。但不是相反**

所以我被困在这里,我不知道如何解决这个问题。

任何帮助,将不胜感激