问题标签 [blast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
266 浏览

r - R 错误中带有 strsplit 的 for 循环

我想在这篇文章的开头说我是 R 和生物信息学编码的新手,我非常感谢这个知识渊博的社区提供的一些意见。我对下面发布的代码的目标是生成饼图,显示 BLAST 结果中每种蛋白质的氨基酸丰度。我从 UniProt 上传了一个 csv 文件,将其转换为矩阵,并写出下面的代码。我不断收到错误消息:在 AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) 中:要替换的项目数不是替换长度的倍数。第 8 列是包含氨基酸序列的输出列。提前致谢!

0 投票
1 回答
331 浏览

blast - 教程:Blast+ 结果文件解析为 fasta 文件

我是这个论坛的新手,也是计算分析的新手,我第一次使用独立的 NCBI Blast+ (blastp),我的结果文件格式如下:

查询= Y

长度=6

主题= X

长度=739

分数 = 15.4 位 (28),期望 = 0.044,方法:基于组合的统计。同一性 = 5/6 (83%),正数 = 6/6 (100%),差距 = 0/6 (0%)

查询 1 DDDIPF 6 D+DIPF Sbjct 244 DNDIPF 250

但我想对所有命中进行多次比对,为此,我需要以以下禁食格式提取序列:

主题= X

第 244 章

是否有任何工具有助于从爆炸结果文件或工具/教程中直接进行多重比对以提取 fasta 格式的序列以进一步处理。谢谢。

0 投票
3 回答
900 浏览

biopython - 通过 Biopython NCBIWWW 爆炸。在哪里可以找到完整的数据库列表?

我正在使用模块 Biopython 模块 NCBIWWW 在线爆破一些序列。我想将我的序列与可用的不同数据库进行对比,但是我找不到它们的完整列表。

这是一个使用“blastn”算法对核苷酸集合数据库进行简单查询的示例。

如您所见,数据库 Nucleotide 集合被指定为“nt”。例如,如果我想查询 Human GRCh37/hg19 数据库,我应该用什么替换“nt”?如果我想查询其他物种/构建?是否有任何完整的列表可供我在http://blast.ncbi.nlm.nih.gov找到所有可用数据库的简称?

谢谢!

0 投票
1 回答
57 浏览

python - 用单独文件中的完整注释替换爆炸报告中的 accession_id

我有一个带有以下格式注释的文件:

和一个制表符分隔的爆炸报告,第二列中只有加入 ID:

当匹配时,我想用注释文件中的整行替换爆炸报告中的 accession_id。这是我的尝试,如您所见,我使用非常基本的 python。如果您给我一个更复杂的解决方案,我将不胜感激。谢谢您的帮助。

林努

0 投票
1 回答
2028 浏览

php - 如何在浏览器中显示系统命令的输出,就像在终端中一样

我使用 php shell_exec 运行 BLAST 命令(生物序列比对工具)并在浏览器中输出结果。但是,我无法像在终端中运行相同命令时显示的那样格式化结果。我尝试使用 passthru() 和 exec() 等方法。这两个都不行!就我而言,输出格式很重要,因为小空间会导致错误(下面给出了一部分)。谁能告诉我如何 在浏览器中显示结果,就像在命令终端中一样

我的部分输出看起来像,

0 投票
1 回答
138 浏览

python - 错误:函数 Input_stream::Input_stream(const string&, bool) 第 63 行。打开文件时出错 @HWI-M02942_file1.fasta

我正在编写一个 Python 脚本,通过自动使用 BLAST 程序 DIAMOND 来执行 BLAST。该脚本在 Ubuntu 14.04 的终端中执行命令。

我的 Python 脚本是:

在将正确的文件路径和文件名分配给变量后,该脚本创建要执行的命令。

当我尝试运行此脚本时,出现以下错误:

我确信这些命令是正确的,因为当我在终端中分别执行第 20 行中打印的命令时,没有错误并且 BLAST 应用程序的输出是正确的。

为什么在执行此 Python 脚本中的命令而不是在终端中单独执行命令时会出现此错误,以及如何解决此错误?

0 投票
2 回答
973 浏览

linux - Perl System() 中的嵌套引号

我正在尝试修改 perl 脚本。这是我要修改的部分:

原来的:

我正在尝试用以下内容替换系统(“tblastn .....”):

这用 GNU parallel 替换了普通的 tblastx 程序,它通过管道传输 tblastx 命令。在 bash 中运行上述命令(用实际文件替换临时输入)可以完美运行,但是当 perl 脚本尝试执行它时,错误日志(对于 tblastx)说它在 sseqids 之后过早终止。如果您在 bash 中运行没有转义字符的相同命令,则会发生相同的错误。

因此,我假设错误是由于“7 ssequids sstart ...”周围的单引号没有被正确解析。我不确定如何在 perl 中正确地做嵌套引号。我认为我做对了,因为它通过 bash 而不是通过 perl 脚本工作。我查看了很多 perl 文档,所有内容都说转义字符 \ 应该与引号或双引号一起使用。但是对于我的例子来说它不起作用。

有人可以提供关于为什么没有处理报价的输入吗?

0 投票
1 回答
432 浏览

bioinformatics - BLAST: blastpgp not producing an output file, unsure if using database flag correctly

Question 1:

I'm running the following:

where protein.fasta is a fasta file containing a single protein sequence. This produces no output and the -o file is empty.

Question 2:

I was able to successfully use:

to create database files. However, this produced multiple files, .phr, .pin, .psd, .psi, .psq. Which one of these should I pass with the -d flag to use my own database?

Thank you!

0 投票
2 回答
840 浏览

biopython - BlastP 使用 NCBIWWW 的输出不是我所期望的

我正在尝试使用 NCBIWWW 获得特定蛋白质的 blastP 结果。问题是返回的不是我识别为对齐数据的,我得到的是这个(这是源代码中'Blast_record'的内容);我正在使用从“BioPython 教程和食谱”中获得的代码,我已经在它和互联网上搜索了错误的来源,但我找不到它。我的源代码是这样的;

结果文件是:

现在,如果我使用 BlastN 和上面使用的蛋白质的核苷酸序列进行搜索,我会得到所有匹配的序列、它们的 E 值和分数等。那么为什么在使用 BlastP 时不是这种情况呢?

我对 Python 和 Biopython 都很陌生,对于我的生活,我无法弄清楚我做错了什么。

0 投票
1 回答
925 浏览

python - TypeError: 'str' object is not callable - 填充数据库时

我必须编写一个脚本,自动为我做一个 BLAST,而不是自动填充数据库。在脚本尝试填充数据库之前,一切都很顺利。然后我收到以下错误:

我知道填充数据库出了问题,但我不知道我能解决什么以及如何解决它。你能帮我么?这是我的代码: