“blast”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

266 浏览

r - R 错误中带有 strsplit 的 for 循环

我想在这篇文章的开头说我是 R 和生物信息学编码的新手，我非常感谢这个知识渊博的社区提供的一些意见。我对下面发布的代码的目标是生成饼图，显示 BLAST 结果中每种蛋白质的氨基酸丰度。我从 UniProt 上传了一个 csv 文件，将其转换为矩阵，并写出下面的代码。我不断收到错误消息：在 AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) 中：要替换的项目数不是替换长度的倍数。第 8 列是包含氨基酸序列的输出列。提前致谢！

r sequence graphic blast

2014-12-02T08:48:33.810

0 投票

1 回答

331 浏览

blast - 教程：Blast+ 结果文件解析为 fasta 文件

我是这个论坛的新手，也是计算分析的新手，我第一次使用独立的 NCBI Blast+ (blastp)，我的结果文件格式如下：

查询= Y

长度=6

主题= X

长度=739

分数 = 15.4 位 (28)，期望 = 0.044，方法：基于组合的统计。同一性 = 5/6 (83%)，正数 = 6/6 (100%)，差距 = 0/6 (0%)

查询 1 DDDIPF 6 D+DIPF Sbjct 244 DNDIPF 250

但我想对所有命中进行多次比对，为此，我需要以以下禁食格式提取序列：

主题= X

第 244 章

是否有任何工具有助于从爆炸结果文件或工具/教程中直接进行多重比对以提取 fasta 格式的序列以进一步处理。谢谢。

blast ncbi

2014-12-27T08:37:58.473

0 投票

3 回答

900 浏览

biopython - 通过 Biopython NCBIWWW 爆炸。在哪里可以找到完整的数据库列表？

我正在使用模块 Biopython 模块 NCBIWWW 在线爆破一些序列。我想将我的序列与可用的不同数据库进行对比，但是我找不到它们的完整列表。

这是一个使用“blastn”算法对核苷酸集合数据库进行简单查询的示例。

如您所见，数据库 Nucleotide 集合被指定为“nt”。例如，如果我想查询 Human GRCh37/hg19 数据库，我应该用什么替换“nt”？如果我想查询其他物种/构建？是否有任何完整的列表可供我在http://blast.ncbi.nlm.nih.gov找到所有可用数据库的简称？

谢谢！

biopython blast ncbi

2015-02-06T11:39:01.147

0 投票

1 回答

57 浏览

python - 用单独文件中的完整注释替换爆炸报告中的 accession_id

我有一个带有以下格式注释的文件：

和一个制表符分隔的爆炸报告，第二列中只有加入 ID：

当匹配时，我想用注释文件中的整行替换爆炸报告中的 accession_id。这是我的尝试，如您所见，我使用非常基本的 python。如果您给我一个更复杂的解决方案，我将不胜感激。谢谢您的帮助。

林努

python replace annotations blast

2015-02-09T16:28:29.857

0 投票

1 回答

2028 浏览

php - 如何在浏览器中显示系统命令的输出，就像在终端中一样

我使用 php shell_exec 运行 BLAST 命令（生物序列比对工具）并在浏览器中输出结果。但是，我无法像在终端中运行相同命令时显示的那样格式化结果。我尝试使用 passthru() 和 exec() 等方法。这两个都不行！就我而言，输出格式很重要，因为小空间会导致错误（下面给出了一部分）。谁能告诉我如何 在浏览器中显示结果，就像在命令终端中一样。

我的部分输出看起来像，

php blast

2015-03-18T08:32:25.947

0 投票

1 回答

138 浏览

python - 错误：函数 Input_stream::Input_stream(const string&, bool) 第 63 行。打开文件时出错 @HWI-M02942_file1.fasta

我正在编写一个 Python 脚本，通过自动使用 BLAST 程序 DIAMOND 来执行 BLAST。该脚本在 Ubuntu 14.04 的终端中执行命令。

我的 Python 脚本是：

在将正确的文件路径和文件名分配给变量后，该脚本创建要执行的命令。

当我尝试运行此脚本时，出现以下错误：

我确信这些命令是正确的，因为当我在终端中分别执行第 20 行中打印的命令时，没有错误并且 BLAST 应用程序的输出是正确的。

为什么在执行此 Python 脚本中的命令而不是在终端中单独执行命令时会出现此错误，以及如何解决此错误？

python bioinformatics blast

2015-04-22T12:38:39.030

0 投票

2 回答

973 浏览

linux - Perl System() 中的嵌套引号

我正在尝试修改 perl 脚本。这是我要修改的部分：

原来的：

我正在尝试用以下内容替换系统（“tblastn .....”）：

这用 GNU parallel 替换了普通的 tblastx 程序，它通过管道传输 tblastx 命令。在 bash 中运行上述命令（用实际文件替换临时输入）可以完美运行，但是当 perl 脚本尝试执行它时，错误日志（对于 tblastx）说它在 sseqids 之后过早终止。如果您在 bash 中运行没有转义字符的相同命令，则会发生相同的错误。

因此，我假设错误是由于“7 ssequids sstart ...”周围的单引号没有被正确解析。我不确定如何在 perl 中正确地做嵌套引号。我认为我做对了，因为它通过 bash 而不是通过 perl 脚本工作。我查看了很多 perl 文档，所有内容都说转义字符 \ 应该与引号或双引号一起使用。但是对于我的例子来说它不起作用。

有人可以提供关于为什么没有处理报价的输入吗？

linux bash perl bioinformatics blast

2015-05-06T04:59:40.627

0 投票

1 回答

432 浏览

bioinformatics - BLAST: blastpgp not producing an output file, unsure if using database flag correctly

Question 1:

I'm running the following:

where protein.fasta is a fasta file containing a single protein sequence. This produces no output and the -o file is empty.

Question 2:

I was able to successfully use:

to create database files. However, this produced multiple files, .phr, .pin, .psd, .psi, .psq. Which one of these should I pass with the -d flag to use my own database?

Thank you!

bioinformatics blast protein-database

2015-05-19T00:41:43.403

0 投票

2 回答

840 浏览

biopython - BlastP 使用 NCBIWWW 的输出不是我所期望的

我正在尝试使用 NCBIWWW 获得特定蛋白质的 blastP 结果。问题是返回的不是我识别为对齐数据的，我得到的是这个（这是源代码中'Blast_record'的内容）；我正在使用从“BioPython 教程和食谱”中获得的代码，我已经在它和互联网上搜索了错误的来源，但我找不到它。我的源代码是这样的；

结果文件是：

现在，如果我使用 BlastN 和上面使用的蛋白质的核苷酸序列进行搜索，我会得到所有匹配的序列、它们的 E 值和分数等。那么为什么在使用 BlastP 时不是这种情况呢？

我对 Python 和 Biopython 都很陌生，对于我的生活，我无法弄清楚我做错了什么。

biopython blast

2015-05-26T11:19:41.667

0 投票

1 回答

925 浏览

python - TypeError: 'str' object is not callable - 填充数据库时

我必须编写一个脚本，自动为我做一个 BLAST，而不是自动填充数据库。在脚本尝试填充数据库之前，一切都很顺利。然后我收到以下错误：

我知道填充数据库出了问题，但我不知道我能解决什么以及如何解决它。你能帮我么？这是我的代码：

python mysql database biopython blast

2015-06-09T12:51:53.617

问题标签 [blast]

Reference