问题标签 [biopython]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
429 浏览

python - BioPython:使用 Entrez.esummary/Entrez.read 跳过错误的 GID

对不起,奇怪的标题。

我正在使用 eSearch 和 eSummary 从

入藏号 --> gID --> TaxID

假设“accessions”是一个包含 20 个入藏号的列表(我一次做 20 个,因为这是 NCBI 允许的最大值)。

我愿意:

这给了我来自这 20 个入藏号的 20 个对应的 GID。

其次是:

这给了我这个错误,因为 gids 中的一个 GID 已从 NCBI 中删除:

我可以尝试:,除了:除了会跳过其他 19 个没问题的 GID。

我的问题是:

如何使用 Entrez.read 一次读取 20 条记录并跳过丢失的记录而不牺牲其他 20 条记录?我可以一次做一个,但这会非常慢(我有 300,000 个登录号,而 NCBI 只允许您每秒进行 3 次查询,但实际上它更像是每秒 1 次查询)。

0 投票
2 回答
8331 浏览

bioinformatics - 使用 BioPython 运行 BLAST 查询

我想

  1. BLAST 几个序列
  2. 从每个查询中检索前 100 个左右的命中
  3. 汇集下载的序列
  4. 删除重复项

我如何在 BioPython 中做到这一点?

0 投票
2 回答
7178 浏览

python - BioPython:从 Blast 输出文件中提取序列 ID

我有一个 XML 格式的 BLAST 输出文件。它是 22 个查询序列,每个序列报告了 50 个命中。我想提取所有 50x22 的点击量。这是我目前拥有的代码,但它只从第一个查询中提取 50 个命中。

有人对提取所有点击有任何建议吗?我想我必须使用除对齐之外的其他东西。希望这很清楚。谢谢!

乔恩

0 投票
4 回答
2467 浏览

bioinformatics - multiFASTA 文件处理

我很想知道是否有任何生物信息学工具能够处理 multiFASTA 文件,为我提供序列数量、长度、核苷酸/氨基酸含量等信息,并可能自动绘制描述图。也可以使用 R BIOconductor 解决方案或 BioPerl 模块,但我没有找到任何东西。

你能帮助我吗?非常感谢 :-)

0 投票
4 回答
1399 浏览

python - 子进程无法捕获标准输出

我正在尝试使用 fasta 文件输入和与 MuscleCommandline 对齐来生成树

我总是遇到这些问题

0 投票
2 回答
179 浏览

parsing - 使用 Clustal 从每行打印 50 个序列

我有一个多序列比对(Clustal)文件,我想阅读这个文件并以这样一种方式排列序列,使其看起来更清晰、更精确。

我正在使用一个AlignIO对象从 Biopython 执行此操作:

我的输出看起来凌乱且长时间滚动。我想要做的是在每行中只打印 50 个序列并一直持续到对齐文件的末尾。

我希望有这样的输出来自http://www.ebi.ac.uk/Tools/clustalw2/

0 投票
4 回答
4780 浏览

python - 在 Python 中有效地获取基因组序列?

如何使用 Python 有效地获取基因组序列?例如,来自 .fa 文件或其他一些容易获得的格式?我基本上想要一个接口 fetch_seq(chrom, strand, start, end) 它将返回指定链上给定染色体上的序列 [start, end]。

类似地,是否有用于获取 phastCons 分数的编程 python 接口?

谢谢。

0 投票
3 回答
9283 浏览

python - 当我从 Web 运行 CGI 脚本时,为什么 python 找不到某些模块?

我不知道这里可能是什么问题:

我有一些来自 Biopython 的模块,我可以在使用交互式提示符或通过命令行执行 python 脚本时轻松导入这些模块。

问题是,当我尝试在 web 可执行 cgi 脚本中导入相同的 biopython 模块时,我收到“导入错误”

: 没有名为 Bio 的模块

这里有什么想法吗?

0 投票
1 回答
4208 浏览

python - 拉普拉斯平滑到 Biopython

我正在尝试为我的生物信息学项目添加对 Biopython 的朴素贝叶斯代码1的拉普拉斯平滑支持。

我已经阅读了许多关于朴素贝叶斯算法和拉普拉斯平滑的文档,我想我已经有了基本的想法,但是我无法将它与该代码集成(实际上我看不到我将添加 1 -拉普拉斯数的哪一部分)。

我不熟悉 Python,我是一个新手编码器。如果有熟悉 Biopython 的人能给我一些建议,我将不胜感激。

0 投票
1 回答
2529 浏览

python - Phylo BioPython 构建树

我试图用 BioPython、Phylo 模块构建一棵树。
到目前为止我所做的是这张图片:替代文字

每个名称都有一个四位数字,后跟一个 - 和一个数字:这个数字是指表示该序列的次数。这意味着 1578 - 22,该节点应该代表 22 个序列。

序列对齐的文件:文件
与构建树的距离的文件:文件

所以现在我知道如何更改节点的每个大小。每个节点都有不同的大小,这很容易做一个不同值的数组:

但是数组是任意的,我想将正确的节点大小放入正确的节点中,我试过这个:

但是当我使用 if 语句时什么都没有出现。

无论如何要这样做?

我真的很感激!

谢谢大家