问题标签 [rosalind]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
155 浏览

python - 如何编写字符串算法

给定一个 FASTA 文本文件 (Rosalind_gc.txt),我应该检查每个 DNA 记录并确定鸟嘌呤-胞嘧啶 (GC) 含量的百分比 (%)。

这方面的例子是:

样本数据集:

样本输出:

罗莎琳德_0808 60.919540

所以基本上遍历每个字符串,计算 G/C 出现的次数,然后将总数除以每个字符串的长度。我的问题是学习如何识别代码中的中断(即 >Rosalind_6404 )。我想要一个不使用 Biopython 和 biopython 方法的代码示例。

0 投票
1 回答
60 浏览

python-3.x - 我无法理解该名称错误的原因

我正在尝试解决http://rosalind.info/problems/list-view/上的问题,并且有一个名为 IPRB 的问题。简而言之,我们有 3 种不同的生物体 k(纯合子显性)、m(杂合子)和 n (纯合子隐性)。它要求您计算两个随机选择的个体的后代具有显性等位基因的概率。您可以从这里 ( http://rosalind.info/problems/iprb/ ) 检查它。

我的问题是;我用示例输入(2、2、2 表示 k、m、n)编写了一个工作代码,并得到了估计的输出。但是,当输入值彼此不同(即 25、20、18)时,我收到如下错误消息:

回溯(最近一次调用最后):文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”,第 43 行,在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义

我在网上研究了该代码的原因。似乎此错误与名称定义有关,例如使用后定义或功能外定义等。但是我检查时没有任何名称。简而言之,我不知道如何解决它,我决定在这里问。

我有 3 个变量和一个保存它们的列表。该输入工作正常,但...

例如,当它是这样的:

我得到错误:

回溯(最近一次调用最后):文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”,第 43 行,在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义

第 43 行在这里:

43 --> pr3 = 浮动(pr31 + pr32 + pr33)

如果您想查看整个内容并进行检查,我也想粘贴我的完整代码。

我希望输出在 0-1 之间,因为它是一个概率,但更重要的是了解导致该错误的原因以及我做错了什么。

0 投票
2 回答
757 浏览

python - pandas DataFrame中值的计数频率

拥有这个 pandas.core.frame.DataFrame:

我想得到一个这样的数据框:

基本上,我想要的是逐列计算频繁的列并创建第二个 df,如我所示。

我想这样做是因为最后,我想获得一个共识字符串。应该是这样的 ATGCAACT

任何人都可以帮助我或给我一些建议吗?

0 投票
1 回答
549 浏览

python - Python:Rosalind 共识和简介

我正在尝试解决 Rosalind 上的“共识和简介”挑战。挑战说明如下:

给定:最多 10 个等长(最多 1 kbp)的 FASTA 格式 DNA 字符串的集合。

返回:集合的共识字符串和配置文件矩阵。(如果存在多个可能的共识字符串,那么您可以返回其中任何一个。)

我的代码如下(我从这个网站上的另一个用户那里得到了大部分)。我唯一的问题是一些 DNA 链被分解成多个单独的行,因此它们被作为单独的字符串附加到“allstrings”列表中。我试图弄清楚如何将不包含“>”的每个连续行写为单个字符串。

0 投票
0 回答
28 浏览

python - 想要在python中的另一个字符串中找到模式(子字符串)开始的位置

输入:

输出:

每次模式(strB)开始时,我都在寻找一种方法来查找字符串(strA)中的起始位置。

0 投票
0 回答
74 浏览

r - 关于最短子字符串实现问题,如何提高 R 代码的速度?

我决定从 R 中的 Rosalind 实现这个问题。它适用于小样本数据集:

但是,当我为真实数据集运行它时需要很长时间(50 个序列,长度约为 1000 个字符)。您能否看看我的代码并给出一些建议,我应该更换什么来提高速度?我只有五分钟的时间来发布答案......这是我写的一些解释。

结果:

我认为主要问题在于for()循环,sapply()以及非常有用的功能,例如str_detect()您认为什么?

样本输入:

0 投票
1 回答
53 浏览

python - Rosalind 共识和配置文件问题代码不起作用

这就是问题所在:http ://rosalind.info/problems/cons/

我的代码有什么问题?对于示例输出,它可以工作,但对于较大的数据集则不行。我不知道出了什么问题,我认为是文件读取部分不正确(也许?)

编辑:那里有一些打印功能,但我没有将它们复制到答案框中,因此它们对结果无关紧要

0 投票
2 回答
56 浏览

python - Python 正则表达式查找从上一个匹配项开始的匹配项

我正在寻找python中字符串中所有子字符串的索引。我当前的正则表达式代码找不到在前一场比赛中开始的比赛。

我有一个 string:s = r'GATATATGCATATACTT'和一个 substring t = r'ATAT'。索引 1、3 和 9 处应该有匹配项。使用以下代码仅显示索引 1 和 9 处的匹配项,因为索引 3 在第一个匹配项中。如何让所有匹配项出现?

非常感谢!

0 投票
1 回答
98 浏览

python - Python - Rosalind 开放阅读框问题

Rosalind 上有一个开放式阅读框架练习,我从示例任务中获得的结果不同。可以在此处找到练习说明。

我有这个代码:

它返回以下蛋白质序列:

我是否遗漏了什么,或者示例解决方案不正确?

0 投票
0 回答
77 浏览

python - 我无法在 python 中正确使用替换命令

我是平台新手:

我对替换命令的使用有疑问。

这是我的代码和我需要做的事情:问题是我需要用字符串序列替换子字符串。

例如:从:Hitacoworld 到 Hiworld。问题是我从带有字符串和子字符串的字典中分离出来,我不知道如何在没有子字符串部分的情况下获取字符串。我以这种方式使用命令替换:

'string'我的字符串在哪里,是'seqs[element]'我想从字符串中删除的子字符串,但问题是当我看到结果时我没有得到正确的字符串,所以我认为问题在于使用替换,任何提示或我可以使用的东西?Ty提前,我迷路了。

在此处输入图像描述