问题标签 [rosalind]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
60 浏览

python - 为什么我在尝试删除时总是收到索引错误,而用字符替换效果很好?

编程 newb/python newb,我的工作要求不高,所以我找到了很多空闲时间来自学如何编码。

我正在处理这个rosalind.info 问题。

到目前为止,这是我的代码:

由于某些原因,

但是,返回一个 IndexError(列表分配超出范围),

将每个第二个列表成员转换为字母“k”。为什么是这样?

仅供参考,我现在要做的是将每个核苷酸放入一个列表中,然后将它们按三个分组,然后在将它们合并到第一个列表成员后删除以下两个列表成员,然后转到下一个密码子。

例如:['A', 'U', 'G'] -> [['AUG'], 'U', 'G'] -> ['AUG'], ['GCC'(下一个密码子) ], ETC...

0 投票
2 回答
759 浏览

python - 具有可变繁殖力的斐波那契凡人兔

我正在尝试修改斐波那契凡人兔子的 python 代码,以便根据兔子的年龄来改变兔子的繁殖力。让我们举个例子。

我的兔子在 3 个月后成熟,在 6 个月后死亡。在 4 个月的繁殖力期间,它们会根据年龄产生不同数量的后代。3个月大的时候生产2对兔子,4个月大的时候生产3对兔子,以此类推,直到第6个月。每对兔子由雌性和雄性组成。最后,我会计算配对的数量而不是个人的数量。从出生到死亡的繁殖力值:

我正在使用的 python 代码(https://github.com/jschendel/Rosalind/blob/master/011_FIBD.py)是:

我不确定如何实现繁殖力的变化。任何帮助表示赞赏!

谢谢你,瓦伦蒂娜

0 投票
1 回答
1294 浏览

c# - 正则表达式 - 在字符串中多次匹配

我正在尝试对“NNTSY”进行正则表达式搜索,以便获得两个匹配项。

  • NNTS
  • NTSY

当我尝试使用 pattern 进行匹配?<NGrlyosylation>N[^P][ST][^P])"时,我只得到一个匹配项,即NNTS.

如何使用 Regex 进行匹配NNTSY,以便找到两个匹配项?

注意:背景信息:可以在这里找到 Rosalind 问题。

这是我的代码。

0 投票
2 回答
421 浏览

ruby - Rosalind:SUBS 失败了给定的案例

我根据这个答案为这个挑战写了一个解决方案。它成功地处理了给出的示例案例,但不是实际案例。

挑战:

给定两个字符串s,并且t,tsif的子字符串,t作为连续的符号集合包含在s(因此,t必须不超过s)。

符号在字符串中的位置是在其左侧找到的符号总数,包括其自身(例如,“AUGCUUCAGAAAGGUCUUACG”中所有出现的 'U' 的位置是 2、5、6、15、17 和 18 )。i位置处的符号s用 表示s[i]

的子串s可以表示为s[j:k],其中jk表示子串在中的开始和结束位置s;例如,如果s = "AUGCUUCAGAAAGGUCUUACG",那么s[2:5] = "UGCU"

子串的位置s[j:k]是它的开始位置j;请注意,如果它作为子字符串出现不止一次,t则会有多个位置(请参阅下面的示例)。ss

鉴于:

两个 DNA 字符串st(每个长度最多 1 kbp)。

返回:

的所有位置t作为 的子字符串s

样本数据集:

样本输出:

对于示例,它有效。当然,您需要手动修剪格式,但这只是几秒钟的工作。

不接受实际数据和我生成的输出。

实际数据集:

实际输出(修整):

代码:

我哪里做错了?它似乎有条不紊。

编辑: 原来问题是环境中的一个小问题。重启后问题无法重现。

0 投票
1 回答
1325 浏览

python-2.7 - 部分摘要算法 (PDP)

我正在尝试实现部分摘要问题,该算法在此 pdf https://cise.ufl.edu/class/cap5515sp10/Ch04_DNA_mapping.pdf第 35-36 页中给出。后面几页有一个例子。

我无法得到正确答案。

我得到的 X 值为 [0, 10, 8, 3, 6] ,然后递归以“Not ok”停止。

可能是我不了解算法还是其他什么?

0 投票
1 回答
63 浏览

rosalind - GC skew 的运行时间太长

我目前正在编写一个分析偏斜差异的脚本。不幸的是,我的问题是当字符串的长度增加时,运行时间变得太长,我似乎无法计算出我的答案。

本质上,这个脚本计算 G 和 C 的数量(对应于 DNA 中的核苷酸),获得每个位置的差异,然后我试图找到最小值的索引。它适用于低长度的文件(即输入字符串),但是当长度变大时 - 即使像 90000+,然后我的脚本运行但无法在合理的时间内(约 4-5 分钟)解决答案。

谁能指出我可以做些什么来让它更快?我考虑过是否最好说,获得差异(diffGtoC),将其设置为最小值,然后重新计算每个差异,直到它看到不同的东西,在此期间我也替换最小值。

但是我对这种方法的担忧是寻找和保留最小值的索引。如果我说,有一个包含值的数组:

[-4,-2,-5,-6,-5,-6]

我可以看到更改最小值(-4 到 -5,然后到 -6)在算法运行时方面会更快,但我如何能够保持 -6 的位置?不确定这是否完全有意义。

0 投票
1 回答
3275 浏览

python - Python:多个共识序列

从 dna 序列列表开始,我必须返回所有可能的共有序列(在每个位置具有最高核苷酸频率的结果序列)序列。如果在某些位置核苷酸具有相同的最高频率,我必须获得具有最高频率的所有可能组合。我还必须返回配置文件矩阵(每个序列的每个核苷酸频率的矩阵)。

到目前为止,这是我的代码(但它只返回一个共识序列):

(如你所见,在位置四,C和G得分相同,这意味着我必须获得两个共识序列)

是否可以修改此代码以获得所有可能的序列,或者您能否解释一下逻辑(伪代码)如何获得正确的结果?

非常感谢您!

0 投票
1 回答
2598 浏览

python - Rosalind 共识和配置文件 python

我正在研究 Rosalind 生物信息学网站 ( http://rosalind.info/problems/cons/ ) 上的“共识 nd Profile”问题。我使用网站上的示例输入尝试了我的代码,并且我的输出与示例输出匹配。但是当我尝试更大的数据集时,网站说我的输出是错误的。有人可以帮我确定我的问题出在哪里吗?谢谢!

样本输入:

我已经提取了 dna 字符串并将它们存储在一个名为 strings 的列表中(我对较大数据集的试验在这一步是正确的,所以我在这里省略了我的代码):

之后我的代码:

对于示例输入,M 看起来像这样:

之后我的代码:

这些代码给出了正确的示例输出:

但是当我尝试更大的数据集时,网站说我的答案是错误的......有人能指出我错在哪里吗?(我是初学者,感谢您的耐心等待!)

0 投票
1 回答
372 浏览

python - Rosalind Profile and Consensus:在 Python 中将长字符串写入一行(格式化)

我正在尝试解决 Rosalind 上的一个问题,在给定 1kb 最多 10 个序列的 FASTA 文件中,我需要提供共有序列和配置文件(所有序列在每个核苷酸上共有多少个碱基) . 在格式化我的回复的上下文中,我的代码适用于小序列(已验证)。

但是,当涉及到大序列时,我在格式化我的回复时遇到了问题。无论长度如何,我期望返回的是:

所有都相互对齐并在各自的行上对齐,或者至少有一些格式允许我将这种格式作为一个单元继续进行,以保持对齐的完整性。

但是当我为一个大序列运行我的代码时,我得到共识序列下面的每个单独的字符串被换行符打破,大概是因为字符串本身太长了。我一直在努力想办法规避这个问题,但我的搜索一直没有结果。我正在考虑一些迭代编写算法,它可以只编写上述期望的全部内容,但可以分块编写任何帮助将不胜感激。为了完整起见,我在下面附上了我的全部代码,并根据需要添加了块注释,尽管主要部分。

缺点(“rosalind_cons.txt”)

0 投票
1 回答
616 浏览

python - Rosalind 共识和简介

我正在尝试从这里解决问题http://rosalind.info/problems/cons/

我的脚本填充计数器列表并输出相等长度的共识字符串。我认为没有发生数学或索引错误并且遇到了问题。我的代码:

感谢您的时间