“rosalind”的相关标签问题_Stack Overflow中文网

0 投票

3 回答

155 浏览

python - 如何编写字符串算法

给定一个 FASTA 文本文件 (Rosalind_gc.txt)，我应该检查每个 DNA 记录并确定鸟嘌呤-胞嘧啶 (GC) 含量的百分比 (%)。

这方面的例子是：

样本数据集：

样本输出：

罗莎琳德_0808 60.919540

所以基本上遍历每个字符串，计算 G/C 出现的次数，然后将总数除以每个字符串的长度。我的问题是学习如何识别代码中的中断（即 >Rosalind_6404 ）。我想要一个不使用 Biopython 和 biopython 方法的代码示例。

2019-05-30T15:39:59.273

0 投票

1 回答

60 浏览

python-3.x - 我无法理解该名称错误的原因

我正在尝试解决http://rosalind.info/problems/list-view/上的问题，并且有一个名为 IPRB 的问题。简而言之，我们有 3 种不同的生物体 k（纯合子显性）、m（杂合子）和 n （纯合子隐性）。它要求您计算两个随机选择的个体的后代具有显性等位基因的概率。您可以从这里 ( http://rosalind.info/problems/iprb/ ) 检查它。

我的问题是；我用示例输入（2、2、2 表示 k、m、n）编写了一个工作代码，并得到了估计的输出。但是，当输入值彼此不同（即 25、20、18）时，我收到如下错误消息：

回溯（最近一次调用最后）：文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”，第 43 行，在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义

我在网上研究了该代码的原因。似乎此错误与名称定义有关，例如使用后定义或功能外定义等。但是我检查时没有任何名称。简而言之，我不知道如何解决它，我决定在这里问。

我有 3 个变量和一个保存它们的列表。该输入工作正常，但...

例如，当它是这样的：

我得到错误：

回溯（最近一次调用最后）：文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”，第 43 行，在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义

第 43 行在这里：

43 --> pr3 = 浮动（pr31 + pr32 + pr33）

如果您想查看整个内容并进行检查，我也想粘贴我的完整代码。

我希望输出在 0-1 之间，因为它是一个概率，但更重要的是了解导致该错误的原因以及我做错了什么。

python-3.x bioinformatics nameerror rosalind

2019-08-10T16:16:52.740

0 投票

2 回答

757 浏览

python - pandas DataFrame中值的计数频率

拥有这个 pandas.core.frame.DataFrame：

我想得到一个这样的数据框：

基本上，我想要的是逐列计算频繁的列并创建第二个 df，如我所示。

我想这样做是因为最后，我想获得一个共识字符串。应该是这样的 ATGCAACT

任何人都可以帮助我或给我一些建议吗？

python bioinformatics rosalind

2019-12-04T12:53:53.580

0 投票

1 回答

549 浏览

python - Python：Rosalind 共识和简介

我正在尝试解决 Rosalind 上的“共识和简介”挑战。挑战说明如下：

给定：最多 10 个等长（最多 1 kbp）的 FASTA 格式 DNA 字符串的集合。

返回：集合的共识字符串和配置文件矩阵。（如果存在多个可能的共识字符串，那么您可以返回其中任何一个。）

我的代码如下（我从这个网站上的另一个用户那里得到了大部分）。我唯一的问题是一些 DNA 链被分解成多个单独的行，因此它们被作为单独的字符串附加到“allstrings”列表中。我试图弄清楚如何将不包含“>”的每个连续行写为单个字符串。

python string bioinformatics rosalind

2020-04-17T18:43:14.657

0 投票

0 回答

28 浏览

python - 想要在python中的另一个字符串中找到模式（子字符串）开始的位置

输入：

输出：

每次模式（strB）开始时，我都在寻找一种方法来查找字符串（strA）中的起始位置。

python rosalind

2020-07-19T04:13:30.260

0 投票

0 回答

74 浏览

r - 关于最短子字符串实现问题，如何提高 R 代码的速度？

我决定从 R 中的 Rosalind 实现这个问题。它适用于小样本数据集：

但是，当我为真实数据集运行它时需要很长时间（50 个序列，长度约为 1000 个字符）。您能否看看我的代码并给出一些建议，我应该更换什么来提高速度？我只有五分钟的时间来发布答案......这是我写的一些解释。

结果：

我认为主要问题在于for()循环，sapply()以及非常有用的功能，例如str_detect()您认为什么？

样本输入：

r string dataframe sapply rosalind

2020-09-29T07:23:58.097

0 投票

1 回答

53 浏览

python - Rosalind 共识和配置文件问题代码不起作用

这就是问题所在：http ://rosalind.info/problems/cons/

我的代码有什么问题？对于示例输出，它可以工作，但对于较大的数据集则不行。我不知道出了什么问题，我认为是文件读取部分不正确（也许？）

编辑：那里有一些打印功能，但我没有将它们复制到答案框中，因此它们对结果无关紧要

python bioinformatics rosalind

2021-01-03T23:43:01.257

0 投票

2 回答

56 浏览

python - Python 正则表达式查找从上一个匹配项开始的匹配项

我正在寻找python中字符串中所有子字符串的索引。我当前的正则表达式代码找不到在前一场比赛中开始的比赛。

我有一个 string:s = r'GATATATGCATATACTT'和一个 substring t = r'ATAT'。索引 1、3 和 9 处应该有匹配项。使用以下代码仅显示索引 1 和 9 处的匹配项，因为索引 3 在第一个匹配项中。如何让所有匹配项出现？

非常感谢！

python regex genetics rosalind

2021-01-16T16:22:59.963

0 投票

1 回答

98 浏览

python - Python - Rosalind 开放阅读框问题

Rosalind 上有一个开放式阅读框架练习，我从示例任务中获得的结果不同。可以在此处找到练习说明。

我有这个代码：

它返回以下蛋白质序列：

我是否遗漏了什么，或者示例解决方案不正确？

python sequence bioinformatics rosalind

2021-03-01T21:37:45.453

0 投票

0 回答

77 浏览

python - 我无法在 python 中正确使用替换命令

我是平台新手：

我对替换命令的使用有疑问。

这是我的代码和我需要做的事情：问题是我需要用字符串序列替换子字符串。

例如：从：Hitacoworld 到 Hiworld。问题是我从带有字符串和子字符串的字典中分离出来，我不知道如何在没有子字符串部分的情况下获取字符串。我以这种方式使用命令替换：

'string'我的字符串在哪里，是'seqs[element]'我想从字符串中删除的子字符串，但问题是当我看到结果时我没有得到正确的字符串，所以我认为问题在于使用替换，任何提示或我可以使用的东西？Ty提前，我迷路了。

在此处输入图像描述

python replace bioinformatics rosalind

2021-06-26T18:31:09.197

问题标签 [rosalind]

Reference