问题标签 [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R 错误中带有 strsplit 的 for 循环
我想在这篇文章的开头说我是 R 和生物信息学编码的新手,我非常感谢这个知识渊博的社区提供的一些意见。我对下面发布的代码的目标是生成饼图,显示 BLAST 结果中每种蛋白质的氨基酸丰度。我从 UniProt 上传了一个 csv 文件,将其转换为矩阵,并写出下面的代码。我不断收到错误消息:在 AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) 中:要替换的项目数不是替换长度的倍数。第 8 列是包含氨基酸序列的输出列。提前致谢!
blast - 教程:Blast+ 结果文件解析为 fasta 文件
我是这个论坛的新手,也是计算分析的新手,我第一次使用独立的 NCBI Blast+ (blastp),我的结果文件格式如下:
查询= Y
长度=6
主题= X
长度=739
分数 = 15.4 位 (28),期望 = 0.044,方法:基于组合的统计。同一性 = 5/6 (83%),正数 = 6/6 (100%),差距 = 0/6 (0%)
查询 1 DDDIPF 6 D+DIPF Sbjct 244 DNDIPF 250
但我想对所有命中进行多次比对,为此,我需要以以下禁食格式提取序列:
主题= X
第 244 章
是否有任何工具有助于从爆炸结果文件或工具/教程中直接进行多重比对以提取 fasta 格式的序列以进一步处理。谢谢。
biopython - 通过 Biopython NCBIWWW 爆炸。在哪里可以找到完整的数据库列表?
我正在使用模块 Biopython 模块 NCBIWWW 在线爆破一些序列。我想将我的序列与可用的不同数据库进行对比,但是我找不到它们的完整列表。
这是一个使用“blastn”算法对核苷酸集合数据库进行简单查询的示例。
如您所见,数据库 Nucleotide 集合被指定为“nt”。例如,如果我想查询 Human GRCh37/hg19 数据库,我应该用什么替换“nt”?如果我想查询其他物种/构建?是否有任何完整的列表可供我在http://blast.ncbi.nlm.nih.gov找到所有可用数据库的简称?
谢谢!
python - 用单独文件中的完整注释替换爆炸报告中的 accession_id
我有一个带有以下格式注释的文件:
和一个制表符分隔的爆炸报告,第二列中只有加入 ID:
当匹配时,我想用注释文件中的整行替换爆炸报告中的 accession_id。这是我的尝试,如您所见,我使用非常基本的 python。如果您给我一个更复杂的解决方案,我将不胜感激。谢谢您的帮助。
林努
php - 如何在浏览器中显示系统命令的输出,就像在终端中一样
我使用 php shell_exec 运行 BLAST 命令(生物序列比对工具)并在浏览器中输出结果。但是,我无法像在终端中运行相同命令时显示的那样格式化结果。我尝试使用 passthru() 和 exec() 等方法。这两个都不行!就我而言,输出格式很重要,因为小空间会导致错误(下面给出了一部分)。谁能告诉我如何 在浏览器中显示结果,就像在命令终端中一样。
我的部分输出看起来像,
python - 错误:函数 Input_stream::Input_stream(const string&, bool) 第 63 行。打开文件时出错 @HWI-M02942_file1.fasta
我正在编写一个 Python 脚本,通过自动使用 BLAST 程序 DIAMOND 来执行 BLAST。该脚本在 Ubuntu 14.04 的终端中执行命令。
我的 Python 脚本是:
在将正确的文件路径和文件名分配给变量后,该脚本创建要执行的命令。
当我尝试运行此脚本时,出现以下错误:
我确信这些命令是正确的,因为当我在终端中分别执行第 20 行中打印的命令时,没有错误并且 BLAST 应用程序的输出是正确的。
为什么在执行此 Python 脚本中的命令而不是在终端中单独执行命令时会出现此错误,以及如何解决此错误?
linux - Perl System() 中的嵌套引号
我正在尝试修改 perl 脚本。这是我要修改的部分:
原来的:
我正在尝试用以下内容替换系统(“tblastn .....”):
这用 GNU parallel 替换了普通的 tblastx 程序,它通过管道传输 tblastx 命令。在 bash 中运行上述命令(用实际文件替换临时输入)可以完美运行,但是当 perl 脚本尝试执行它时,错误日志(对于 tblastx)说它在 sseqids 之后过早终止。如果您在 bash 中运行没有转义字符的相同命令,则会发生相同的错误。
因此,我假设错误是由于“7 ssequids sstart ...”周围的单引号没有被正确解析。我不确定如何在 perl 中正确地做嵌套引号。我认为我做对了,因为它通过 bash 而不是通过 perl 脚本工作。我查看了很多 perl 文档,所有内容都说转义字符 \ 应该与引号或双引号一起使用。但是对于我的例子来说它不起作用。
有人可以提供关于为什么没有处理报价的输入吗?
bioinformatics - BLAST: blastpgp not producing an output file, unsure if using database flag correctly
Question 1:
I'm running the following:
where protein.fasta is a fasta file containing a single protein sequence. This produces no output and the -o file is empty.
Question 2:
I was able to successfully use:
to create database files. However, this produced multiple files, .phr, .pin, .psd, .psi, .psq. Which one of these should I pass with the -d flag to use my own database?
Thank you!
biopython - BlastP 使用 NCBIWWW 的输出不是我所期望的
我正在尝试使用 NCBIWWW 获得特定蛋白质的 blastP 结果。问题是返回的不是我识别为对齐数据的,我得到的是这个(这是源代码中'Blast_record'的内容);我正在使用从“BioPython 教程和食谱”中获得的代码,我已经在它和互联网上搜索了错误的来源,但我找不到它。我的源代码是这样的;
结果文件是:
现在,如果我使用 BlastN 和上面使用的蛋白质的核苷酸序列进行搜索,我会得到所有匹配的序列、它们的 E 值和分数等。那么为什么在使用 BlastP 时不是这种情况呢?
我对 Python 和 Biopython 都很陌生,对于我的生活,我无法弄清楚我做错了什么。
python - TypeError: 'str' object is not callable - 填充数据库时
我必须编写一个脚本,自动为我做一个 BLAST,而不是自动填充数据库。在脚本尝试填充数据库之前,一切都很顺利。然后我收到以下错误:
我知道填充数据库出了问题,但我不知道我能解决什么以及如何解决它。你能帮我么?这是我的代码: