问题标签 [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 使用 NCBI c++ 工具包有问题
我正在尝试实现一个小程序来进行爆炸并在没有浏览器的情况下获得结果。ncbi c++ 工具包看起来就像我正在寻找的东西,但是,我遇到了一些使用它的问题。
我的环境是带有 MSVC 2010 c++ 编译器和 QT 框架的 windows,我已经按照以下说明下载、配置和构建工具包。
http://www.ncbi.nlm.nih.gov/books/NBK7167/
我在下面的目录中有所有库(.*lib 文件):
ncbi_cxx--12_0_0\compilers\msvc1000_prj\dll\lib\ReleaseDLL
以下是 ncbi 提供的示例,我正在尝试做类似的事情。 http://www.ncbi.nlm.nih.gov/IEB/ToolBox/CPP_DOC/lxr/source/src/sample/app/blast/remote_blast_demo.cpp
一切就绪后,我创建了一个项目(使用 Qt Creator)并尝试使用该工具包。但是,当我包含任何头文件时会出现问题,例如
在包含ncbi库时,我不知道如何解决编译器错误。错误信息如下:
'ncbi::CUtf8::AsUTF8' 重新定义默认参数:参数 2(ncbistr.hpp 第 2861 行)
'ncbi::CStringUTF8 ncbi::CUtf8::AsUTF8(const ncbi::TCharUCS2*,ncbi::SIZE_TYPE)' : 成员函数已经定义或声明(ncbistr.hpp line 2861)
'ncbi::CUtf8::AsUTF8' :缺少参数 2 的默认参数(ncbistr.hpp 第 2861 行)
我花了几天时间研究如何使用这个工具包,如果有人能给我一些想法,我将不胜感激。
顺便说一句,在项目文件中,我确实包含路径和库。
perl - 如何在 NCBI 独立 BLAST 中获取状态更新?
例如,我正在使用远程 (NCBI) 服务器为数千个 EST 序列运行独立的 Blast+。我没有收到任何状态消息,例如 100 个序列中的 15 个正在运行。是否有可能获得任何这样的状态消息?或任何其他方式使用perl脚本一个接一个地发送序列?
非常感谢!
indexing - 爆炸数据库索引错误
运行 tblastn 时收到以下错误消息
tblastn -query ~/seq.fa -out ~/seq.out -db ~/blast/ncbi-blast-2.2.29+/db/nr -num_alignments 20000 BLAST 数据库错误:找不到核苷酸数据库的别名或索引文件 [ ~/blast/ncbi-blast-2.2.29+/db/nr] 在搜索路径 [~/blast/ncbi-blast-2.2.29+/bin::/directory/path/to/blast/databases:]
在 /db 中,所有从 00 到 16 的 nr 文件都有扩展名为 phd、phi、phr、pin、pnd、pni、pgo、ppd、ppi、psd、psi 和 psq 的 nr 文件,即 nr.00.phr等等
如果索引文件是 db 文件夹中的这些文件之一,为什么 blast 找不到它们?
nr 是否包含代表性基因组,因为这是我想要使用的?
微生物数据库怎么样?
非常感谢
python - 使用 python 以 CSV 格式提取 BLAST 输出列
我在 excel 中有一个 csv 文件,其中包含 BLAST 搜索的输出,格式如下:
我已将其作为 csv 导入 python 使用
我现在想要做的是将数据列提取为列表。我的总体目标是计算所有具有超过 98% 身份的匹配项(第三列)。
问题是,由于这不是典型的 csv 格式,因此顶部没有标题,因此我无法根据其标题提取列。我在想是否可以将第三列提取为列表,然后我可以在 python 中使用普通列表工具来提取我想要的数字,但我从未使用过 pythons csv 模块,我正在努力寻找合适的命令。SO上的其他问题类似,但不涉及我没有标题和空单元格的具体情况。如果您能帮助我,我将不胜感激!
python - BioPython 提交多个在线爆料
是否可以同时向 Bio.Blast.NCBIWWW 模块提交多个序列?我试图创建一个运行我的爆炸的函数并让其中几个使用多处理运行,但我认为 NCBI 服务器会在一段时间后启动我并且连接停止工作。
python-2.7 - Biopython blastn 命令在脚本中不起作用,但在命令行中起作用
所以我正在编写一个脚本来运行一个爆炸查询,此时我对变量进行了硬编码(只是为了确保它们没有被弄乱)。这是:
我什么也没得到,输出文件是空白的,没有错误或任何东西。如果我在命令行上使用来自 blastCLine 的 blast 命令,它就可以工作。如果我在 python 环境中使用上面的代码,它可以工作。只是不在我的脚本中工作。
我一直在谷歌搜索并查看大量示例。据我所知,它应该可以工作。我尝试将其更改为 blastx,并且使用 cmd="blastn" 也无济于事。有什么建议么?
python - 使用python读取csv格式的BLAST输出时出现索引错误
为这个冗长的问题道歉,我一直在尝试解决这个错误,但我无法弄清楚我做错了什么!我已经包含了一个数据示例,因此您可以看到我正在使用什么。
我有来自 BLAST 搜索的数据输出,如下所示:
我已将其保存为 csv,如下所示
我设计了一个简短的脚本,它通过百分比标识,如果它高于阈值,则找到 queryID 并将其添加到列表中,然后从列表中删除重复项。
该脚本在大多数情况下都能完美运行,但我经常收到如下所示的错误
但是,如果我更改脚本以便打印line[2]
它,它会按我的预期打印所有身份。你知道可能出了什么问题吗?再次为数据墙道歉。
这部分取自我之前的问题:Extracting BLAST output columns in CSV form with python
bash - 分别爆破多个数据库
我是生物信息学的新手。我正在尝试在 200 多个基因组中查找蛋白质列表(我的查询)。我想分别得到每个基因组的结果。我试图编写一个 bash 脚本,但它不起作用。
我希望它一次只运行 2 个 tblastn 实例。此代码执行 200 多个 tblastn 实例。database_names.txt 包含我的数据库名称和位置。
这是 database_names.txt 的前 3 行
这是错误消息
output - 检测目标区域内或外部的 BLAST 匹配
在那里,我将从目标序列位点取出一段 DNA 序列,用它来对基因组进行爆炸。然后从爆炸结果输出中,我想知道除了匹配目标站点之外,是否还有来自其他区域的匹配序列。如何从 BLAST 输出中知道?基因组位点有什么指标吗?谢谢
c - 使用 echo 和 system 在 C 中运行软件
我正在尝试运行一个名为 BLASTP 的生物程序,它接收两个字符串(代码中的 fasta_GWIDD 和 fasta_UNIPROT)并比较它们。我遇到的问题是在代码中使用了 echo/system。谁能建议我错过了什么?
错误是: