问题标签 [biopython]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - BioPython:使用 Entrez.esummary/Entrez.read 跳过错误的 GID
对不起,奇怪的标题。
我正在使用 eSearch 和 eSummary 从
入藏号 --> gID --> TaxID
假设“accessions”是一个包含 20 个入藏号的列表(我一次做 20 个,因为这是 NCBI 允许的最大值)。
我愿意:
这给了我来自这 20 个入藏号的 20 个对应的 GID。
其次是:
这给了我这个错误,因为 gids 中的一个 GID 已从 NCBI 中删除:
我可以尝试:,除了:除了会跳过其他 19 个没问题的 GID。
我的问题是:
如何使用 Entrez.read 一次读取 20 条记录并跳过丢失的记录而不牺牲其他 20 条记录?我可以一次做一个,但这会非常慢(我有 300,000 个登录号,而 NCBI 只允许您每秒进行 3 次查询,但实际上它更像是每秒 1 次查询)。
bioinformatics - 使用 BioPython 运行 BLAST 查询
我想
- BLAST 几个序列
- 从每个查询中检索前 100 个左右的命中
- 汇集下载的序列
- 删除重复项
我如何在 BioPython 中做到这一点?
python - BioPython:从 Blast 输出文件中提取序列 ID
我有一个 XML 格式的 BLAST 输出文件。它是 22 个查询序列,每个序列报告了 50 个命中。我想提取所有 50x22 的点击量。这是我目前拥有的代码,但它只从第一个查询中提取 50 个命中。
有人对提取所有点击有任何建议吗?我想我必须使用除对齐之外的其他东西。希望这很清楚。谢谢!
乔恩
bioinformatics - multiFASTA 文件处理
我很想知道是否有任何生物信息学工具能够处理 multiFASTA 文件,为我提供序列数量、长度、核苷酸/氨基酸含量等信息,并可能自动绘制描述图。也可以使用 R BIOconductor 解决方案或 BioPerl 模块,但我没有找到任何东西。
你能帮助我吗?非常感谢 :-)
python - 子进程无法捕获标准输出
我正在尝试使用 fasta 文件输入和与 MuscleCommandline 对齐来生成树
我总是遇到这些问题
parsing - 使用 Clustal 从每行打印 50 个序列
我有一个多序列比对(Clustal)文件,我想阅读这个文件并以这样一种方式排列序列,使其看起来更清晰、更精确。
我正在使用一个AlignIO
对象从 Biopython 执行此操作:
我的输出看起来凌乱且长时间滚动。我想要做的是在每行中只打印 50 个序列并一直持续到对齐文件的末尾。
我希望有这样的输出,来自http://www.ebi.ac.uk/Tools/clustalw2/。
python - 在 Python 中有效地获取基因组序列?
如何使用 Python 有效地获取基因组序列?例如,来自 .fa 文件或其他一些容易获得的格式?我基本上想要一个接口 fetch_seq(chrom, strand, start, end) 它将返回指定链上给定染色体上的序列 [start, end]。
类似地,是否有用于获取 phastCons 分数的编程 python 接口?
谢谢。
python - 当我从 Web 运行 CGI 脚本时,为什么 python 找不到某些模块?
我不知道这里可能是什么问题:
我有一些来自 Biopython 的模块,我可以在使用交互式提示符或通过命令行执行 python 脚本时轻松导入这些模块。
问题是,当我尝试在 web 可执行 cgi 脚本中导入相同的 biopython 模块时,我收到“导入错误”
: 没有名为 Bio 的模块
这里有什么想法吗?
python - 拉普拉斯平滑到 Biopython
我正在尝试为我的生物信息学项目添加对 Biopython 的朴素贝叶斯代码1的拉普拉斯平滑支持。
我已经阅读了许多关于朴素贝叶斯算法和拉普拉斯平滑的文档,我想我已经有了基本的想法,但是我无法将它与该代码集成(实际上我看不到我将添加 1 -拉普拉斯数的哪一部分)。
我不熟悉 Python,我是一个新手编码器。如果有熟悉 Biopython 的人能给我一些建议,我将不胜感激。