问题标签 [biopython]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1221 问题

0 投票

2 回答

429 浏览

python - BioPython：使用 Entrez.esummary/Entrez.read 跳过错误的 GID

对不起，奇怪的标题。

我正在使用 eSearch 和 eSummary 从

入藏号 --> gID --> TaxID

假设“accessions”是一个包含 20 个入藏号的列表（我一次做 20 个，因为这是 NCBI 允许的最大值）。

我愿意：

这给了我来自这 20 个入藏号的 20 个对应的 GID。

其次是：

这给了我这个错误，因为 gids 中的一个 GID 已从 NCBI 中删除：

我可以尝试：，除了：除了会跳过其他 19 个没问题的 GID。

我的问题是：

如何使用 Entrez.read 一次读取 20 条记录并跳过丢失的记录而不牺牲其他 20 条记录？我可以一次做一个，但这会非常慢（我有 300,000 个登录号，而 NCBI 只允许您每秒进行 3 次查询，但实际上它更像是每秒 1 次查询）。

python bioinformatics biopython

2009-10-06T04:15:15.040

0 投票

2 回答

8331 浏览

bioinformatics - 使用 BioPython 运行 BLAST 查询

我想

BLAST 几个序列
从每个查询中检索前 100 个左右的命中
汇集下载的序列
删除重复项

我如何在 BioPython 中做到这一点？

bioinformatics biopython sequences blast

2009-11-03T21:43:14.157

0 投票

2 回答

7178 浏览

python - BioPython：从 Blast 输出文件中提取序列 ID

我有一个 XML 格式的 BLAST 输出文件。它是 22 个查询序列，每个序列报告了 50 个命中。我想提取所有 50x22 的点击量。这是我目前拥有的代码，但它只从第一个查询中提取 50 个命中。

有人对提取所有点击有任何建议吗？我想我必须使用除对齐之外的其他东西。希望这很清楚。谢谢！

乔恩

python xml-parsing biopython xmlblaster

2009-11-05T23:47:19.053

0 投票

4 回答

2467 浏览

bioinformatics - multiFASTA 文件处理

我很想知道是否有任何生物信息学工具能够处理 multiFASTA 文件，为我提供序列数量、长度、核苷酸/氨基酸含量等信息，并可能自动绘制描述图。也可以使用 R BIOconductor 解决方案或 BioPerl 模块，但我没有找到任何东西。

你能帮助我吗？非常感谢：-）

bioinformatics biopython fasta bioconductor bioperl

2009-11-24T10:55:23.473

0 投票

4 回答

1399 浏览

python - 子进程无法捕获标准输出

我正在尝试使用 fasta 文件输入和与 MuscleCommandline 对齐来生成树

我总是遇到这些问题

python subprocess biopython

2010-05-18T11:21:35.397

0 投票

2 回答

179 浏览

parsing - 使用 Clustal 从每行打印 50 个序列

我有一个多序列比对（Clustal）文件，我想阅读这个文件并以这样一种方式排列序列，使其看起来更清晰、更精确。

我正在使用一个AlignIO对象从 Biopython 执行此操作：

我的输出看起来凌乱且长时间滚动。我想要做的是在每行中只打印 50 个序列并一直持续到对齐文件的末尾。

我希望有这样的输出，来自http://www.ebi.ac.uk/Tools/clustalw2/。

parsing biopython clustal

2010-05-22T13:27:51.663

0 投票

4 回答

4780 浏览

python - 在 Python 中有效地获取基因组序列？

如何使用 Python 有效地获取基因组序列？例如，来自 .fa 文件或其他一些容易获得的格式？我基本上想要一个接口 fetch_seq(chrom, strand, start, end) 它将返回指定链上给定染色体上的序列 [start, end]。

类似地，是否有用于获取 phastCons 分数的编程 python 接口？

谢谢。

python bioinformatics biopython

user248237

2010-07-07T03:48:08.910

0 投票

3 回答

9283 浏览

python - 当我从 Web 运行 CGI 脚本时，为什么 python 找不到某些模块？

我不知道这里可能是什么问题：

我有一些来自 Biopython 的模块，我可以在使用交互式提示符或通过命令行执行 python 脚本时轻松导入这些模块。

问题是，当我尝试在 web 可执行 cgi 脚本中导入相同的 biopython 模块时，我收到“导入错误”

: 没有名为 Bio 的模块

这里有什么想法吗？

python cgi bioinformatics biopython

2010-09-24T02:42:13.477

0 投票

1 回答

4208 浏览

python - 拉普拉斯平滑到 Biopython

我正在尝试为我的生物信息学项目添加对 Biopython 的朴素贝叶斯代码1的拉普拉斯平滑支持。

我已经阅读了许多关于朴素贝叶斯算法和拉普拉斯平滑的文档，我想我已经有了基本的想法，但是我无法将它与该代码集成（实际上我看不到我将添加 1 -拉普拉斯数的哪一部分）。

我不熟悉 Python，我是一个新手编码器。如果有熟悉 Biopython 的人能给我一些建议，我将不胜感激。

python machine-learning bayesian biopython

2010-10-25T00:09:12.753

0 投票

1 回答

2529 浏览

python - Phylo BioPython 构建树

我试图用 BioPython、Phylo 模块构建一棵树。
到目前为止我所做的是这张图片：替代文字

每个名称都有一个四位数字，后跟一个 - 和一个数字：这个数字是指表示该序列的次数。这意味着 1578 - 22，该节点应该代表 22 个序列。

序列对齐的文件：文件
与构建树的距离的文件：文件

所以现在我知道如何更改节点的每个大小。每个节点都有不同的大小，这很容易做一个不同值的数组：

但是数组是任意的，我想将正确的节点大小放入正确的节点中，我试过这个：

但是当我使用 if 语句时什么都没有出现。

无论如何要这样做？

我真的很感激！

谢谢大家

python numpy graphviz biopython

2010-10-29T11:36:36.133

1 2 3 4 5 6 7 8 9 10