问题标签 [blast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1896 浏览

database - Blast+: blastdbcmd - 错误信息

我想将 16S Microbial 数据库格式转换为 fasta 格式。我使用 Blast+ 程序(2.2.27+ 版本的 Window)。我可以安装这个程序,我知道我必须使用 blastdbcmd 命令。问题是我不知道如何正确编写命令,而且我有一条错误消息: No alias or index file found nucleotide database 16SMicrobial in search path C:users\Debora\blast-2.2.27+ ; C:users\Debora\blast-2.2.27+\db\16SMicrobial

16S 微生物文件在 db 文件中。16S 微生物已解压缩和解压缩。

我试图编辑环境变量,我打算编辑用户和系统变量,但我真的不明白我必须写什么。所以,我怀疑数据库在错误的地方,但我不知道如何更正。

我希望有人可以帮助我!!!!

谢谢大家!!!

0 投票
1 回答
3739 浏览

python - 使用 NCBIXML 仅解析 BLAST 输出中的前 3 个命中

我修改了如下的一段代码来解析来自 BLAST XML 输出的所需信息。

该代码允许我解析 E 值被截断的命中。但是,我希望仅解析 BLAST XML 输出中的最佳命中或前 3 个命中,因为 BLAST 输出文件的大小很大。

解析每个命中结果将花费大量时间来处理,实际上我不希望所有命中结果。

有人可以帮我吗?

0 投票
0 回答
264 浏览

python - 将桌面移植到 Web 应用程序(生物信息学)

我想将我为 Windows 操作系统编写的一些生物信息学程序移植到 Web 应用程序中。我正在使用一些生物信息学软件包,例如 BLAST、Bowtie 或 Primer3。这些外部工具通常采用用户提供的文件,对其进行处理并创建一个我解析和显示的输出文件。此外,这些工具使用由用户创建和重用的特定数据库。

到目前为止,我将工具创建的数据库(该文件也由用户提供)和输出结果保存在安装了我的软件的 PC 上。现在,我不知道如何在 Web 服务器上处理这样的设置。我无法保存来自世界各地的用户创建的所有数据库,但同时每次都重新创建一个数据库非常讨厌(例如人类基因组数据库是 2.7 GB 并且需要一些时间来创建它)当用户回来了(我猜一个用户每个工具创建了大约 5-10 个数据库;我有 3 个工具:1 MB - 50 GB)。

如何使用 Web 应用程序解决这个问题?

编辑 为了让事情更清楚,我实际上只想知道是否有更复杂的方法来重用用户创建的数据。我正在考虑临时存储这些文件以进行会话。没有可能要求收费,因为这些工具非常具体,我没有很多用户。此外,大多数用户都是亲密的同事。经过多年与不同操作系统的斗争,调试和维护我的程序,我终于放弃了(我在私人时间这样做),这太费时了(另外我对 Linux、Android 和 IOS 有一些要求)。

谢谢

0 投票
1 回答
1617 浏览

linux - 解释多线程程序的 Linux 时间命令结果 (%CPU > 100)

我想在我的服务器上对 BLAST 运行时间进行基准测试,所以我启动了该time命令。服务器有 16 个 CPU,我正在运行 BLAST 16 线程。在我进行分析时,可能还有其他应用程序并行运行。

输出如下:

将用户时间解释为 CPU 运行我的应用程序所花费的秒数,我得到的时间超过了总时间。我见过有人告诉我应该用 %CPU 来划分时间,但是我只得到了 3 分钟,这对于 BLAST 和我放入其中的大小的输入是不现实的。

我需要的信息是用户时间,但我不知道如何解释它。

对结果的解释有什么建议吗?

0 投票
1 回答
243 浏览

bash - for 循环在我的脚本中不起作用

我在 bash 中编写了一个运行 blastx 的脚本。

然后我会将 4 个作业提交到 barrine 服务器。我应该获得的是包含以下内容的 4 个工作:

但我在脚本中得到的只是:

有人可以帮我解决问题吗?如果我在我的脚本之外使用 for 循环可以正常工作。

感谢帮助

0 投票
1 回答
359 浏览

parsing - 按命中位置对 rps-blast 结果排序

我从 biopython 开始,我有一个关于解析结果的问题。我使用了一个教程来参与其中,这是我使用的代码:

得到的部分结果是:

我想要做的是按命中位置(Hsp_hit-from)对结果进行排序,如下所示:

我的 rps-blast 输入文件是 *.xml 文件。有什么建议继续吗?

谢谢!

0 投票
0 回答
961 浏览

python - 为什么我在两台具有相同规格的不同机器上运行相同的程序得到不同的输出

我有一个使用 bio-python 和 blast 的 python 程序,它接受命令行。我在 Centos 5.3 final 上运行这个程序。问题是我在两台不同的机器上拥有这个,我知道相同的应用程序和相同的操作系统,但是在其中一个运行命令后,我得到类似“a.data”的输出文件,这是不正确的并且在另一个我得到三个文件作为“a.data.bak”、“a.data.dat”和“a.data.dir”,这是正确的输出。

您是否知道这里发生了什么以及为什么我从同一台机器上的相同代码中得到不同的输出。

0 投票
1 回答
4562 浏览

html - HTML 电子邮件爆炸的最大宽度是多少?

我制作了几乎所有电子邮件(gmail、yahoo、aol、outlook 等)都应该支持的 html 电子邮件爆炸。我总是将宽度设置650px为 html 电子邮件爆炸,但现在我将其设置为990px. 我需要知道这是否会成为问题,或者可以用于 html 电子邮件。

“@sawa 工作 12 小时,然后在早上 7 点问一个问题,没有睡眠语法聪明”

0 投票
1 回答
1181 浏览

bioinformatics - 从blast数据库名称中获取fasta源文件

我目前正在编写一个使用-outfmt 10Blast 选项的库,它为您提供 CSV 而不是人类可读的格式。

问题是,我想访问 db 源文件,以便在处理后提取一些序列。我知道如何做到这一点的唯一方法是使用删除-outfmt 10并运行两次爆炸。然后我解析人类可读的输出,以显示以下内容:

但是,只有title在创建数据库时未指定时才有效makeblastdb。无论如何,stitleofoutfmt 10似乎是 fasta 标题行。我不能只查找数据库名称然后查找 a .fna, .fas, .faa,因为您可以将数据库命名为与源文件不同的名称。

是否有另一种方法可以从爆炸数据库名称中提取 fasta 源文件?outfmt我在选项列表中没有看到一个。还是我今天瞎了?

0 投票
4 回答
1491 浏览

blast - 本地 BLAST Swissprot 数据库错误

我正在尝试在我的机器 (Mac) 上运行独立的 ncbi-blast-2.2.28+,但在使用 SwissProt 数据库运行 blastp 时收到此错误消息:

这是我所做的:

1)从ncbi服务器下载“ncbi-blast-2.2.28+-universal-macosx.tar.gz”并解压

2)将文件夹的bin内容移动到我的$PATH目录“/Users/me/bin”

3)在“/Users/me/bin”中,我创建了一个“db”文件夹,以及包含以下路径的“.ncbirc”文件:

4)我下载了SwissProt数据库并在“/Users/me/bin/db/”中获得了以下文件:

然后,当我从任何工作目录(我的查询文件所在的位置)运行 blastp 时,使用以下命令:

我收到以下错误消息:

当我在其他线程上阅读时,我还尝试在命令行中提及 db 所在的整个路径,并从文件名中删除 .pal 扩展名。但还是不行。

谁能看到我做错了什么?!!!!