问题标签 [rosalind]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 为什么我在尝试删除时总是收到索引错误,而用字符替换效果很好?
编程 newb/python newb,我的工作要求不高,所以我找到了很多空闲时间来自学如何编码。
我正在处理这个rosalind.info 问题。
到目前为止,这是我的代码:
由于某些原因,
但是,返回一个 IndexError(列表分配超出范围),
将每个第二个列表成员转换为字母“k”。为什么是这样?
仅供参考,我现在要做的是将每个核苷酸放入一个列表中,然后将它们按三个分组,然后在将它们合并到第一个列表成员后删除以下两个列表成员,然后转到下一个密码子。
例如:['A', 'U', 'G'] -> [['AUG'], 'U', 'G'] -> ['AUG'], ['GCC'(下一个密码子) ], ETC...
python - 具有可变繁殖力的斐波那契凡人兔
我正在尝试修改斐波那契凡人兔子的 python 代码,以便根据兔子的年龄来改变兔子的繁殖力。让我们举个例子。
我的兔子在 3 个月后成熟,在 6 个月后死亡。在 4 个月的繁殖力期间,它们会根据年龄产生不同数量的后代。3个月大的时候生产2对兔子,4个月大的时候生产3对兔子,以此类推,直到第6个月。每对兔子由雌性和雄性组成。最后,我会计算配对的数量而不是个人的数量。从出生到死亡的繁殖力值:
我正在使用的 python 代码(https://github.com/jschendel/Rosalind/blob/master/011_FIBD.py)是:
我不确定如何实现繁殖力的变化。任何帮助表示赞赏!
谢谢你,瓦伦蒂娜
c# - 正则表达式 - 在字符串中多次匹配
我正在尝试对“NNTSY”进行正则表达式搜索,以便获得两个匹配项。
- NNTS
- NTSY
当我尝试使用 pattern 进行匹配?<NGrlyosylation>N[^P][ST][^P])"
时,我只得到一个匹配项,即NNTS
.
如何使用 Regex 进行匹配NNTSY
,以便找到两个匹配项?
注意:背景信息:可以在这里找到 Rosalind 问题。
这是我的代码。
ruby - Rosalind:SUBS 失败了给定的案例
我根据这个答案为这个挑战写了一个解决方案。它成功地处理了给出的示例案例,但不是实际案例。
挑战:
给定两个字符串
s
,并且t
,t
是s
if的子字符串,t
作为连续的符号集合包含在s
(因此,t
必须不超过s
)。符号在字符串中的位置是在其左侧找到的符号总数,包括其自身(例如,“AUGCUUCAGAAAGGUCUUACG”中所有出现的 'U' 的位置是 2、5、6、15、17 和 18 )。
i
位置处的符号s
用 表示s[i]
。的子串
s
可以表示为s[j:k]
,其中j
和k
表示子串在中的开始和结束位置s
;例如,如果s = "AUGCUUCAGAAAGGUCUUACG"
,那么s[2:5] = "UGCU"
。子串的位置
s[j:k]
是它的开始位置j
;请注意,如果它作为子字符串出现不止一次,t
则会有多个位置(请参阅下面的示例)。s
s
鉴于:
两个 DNA 字符串
s
和t
(每个长度最多 1 kbp)。
返回:
的所有位置
t
作为 的子字符串s
。
样本数据集:
样本输出:
对于示例,它有效。当然,您需要手动修剪格式,但这只是几秒钟的工作。
不接受实际数据和我生成的输出。
实际数据集:
实际输出(修整):
代码:
我哪里做错了?它似乎有条不紊。
编辑: 原来问题是环境中的一个小问题。重启后问题无法重现。
python-2.7 - 部分摘要算法 (PDP)
我正在尝试实现部分摘要问题,该算法在此 pdf https://cise.ufl.edu/class/cap5515sp10/Ch04_DNA_mapping.pdf第 35-36 页中给出。后面几页有一个例子。
我无法得到正确答案。
我得到的 X 值为 [0, 10, 8, 3, 6] ,然后递归以“Not ok”停止。
可能是我不了解算法还是其他什么?
rosalind - GC skew 的运行时间太长
我目前正在编写一个分析偏斜差异的脚本。不幸的是,我的问题是当字符串的长度增加时,运行时间变得太长,我似乎无法计算出我的答案。
本质上,这个脚本计算 G 和 C 的数量(对应于 DNA 中的核苷酸),获得每个位置的差异,然后我试图找到最小值的索引。它适用于低长度的文件(即输入字符串),但是当长度变大时 - 即使像 90000+,然后我的脚本运行但无法在合理的时间内(约 4-5 分钟)解决答案。
谁能指出我可以做些什么来让它更快?我考虑过是否最好说,获得差异(diffGtoC),将其设置为最小值,然后重新计算每个差异,直到它看到不同的东西,在此期间我也替换最小值。
但是我对这种方法的担忧是寻找和保留最小值的索引。如果我说,有一个包含值的数组:
[-4,-2,-5,-6,-5,-6]
我可以看到更改最小值(-4 到 -5,然后到 -6)在算法运行时方面会更快,但我如何能够保持 -6 的位置?不确定这是否完全有意义。
python - Python:多个共识序列
从 dna 序列列表开始,我必须返回所有可能的共有序列(在每个位置具有最高核苷酸频率的结果序列)序列。如果在某些位置核苷酸具有相同的最高频率,我必须获得具有最高频率的所有可能组合。我还必须返回配置文件矩阵(每个序列的每个核苷酸频率的矩阵)。
到目前为止,这是我的代码(但它只返回一个共识序列):
(如你所见,在位置四,C和G得分相同,这意味着我必须获得两个共识序列)
是否可以修改此代码以获得所有可能的序列,或者您能否解释一下逻辑(伪代码)如何获得正确的结果?
非常感谢您!
python - Rosalind 共识和配置文件 python
我正在研究 Rosalind 生物信息学网站 ( http://rosalind.info/problems/cons/ ) 上的“共识 nd Profile”问题。我使用网站上的示例输入尝试了我的代码,并且我的输出与示例输出匹配。但是当我尝试更大的数据集时,网站说我的输出是错误的。有人可以帮我确定我的问题出在哪里吗?谢谢!
样本输入:
我已经提取了 dna 字符串并将它们存储在一个名为 strings 的列表中(我对较大数据集的试验在这一步是正确的,所以我在这里省略了我的代码):
之后我的代码:
对于示例输入,M 看起来像这样:
之后我的代码:
这些代码给出了正确的示例输出:
但是当我尝试更大的数据集时,网站说我的答案是错误的......有人能指出我错在哪里吗?(我是初学者,感谢您的耐心等待!)
python - Rosalind Profile and Consensus:在 Python 中将长字符串写入一行(格式化)
我正在尝试解决 Rosalind 上的一个问题,在给定 1kb 最多 10 个序列的 FASTA 文件中,我需要提供共有序列和配置文件(所有序列在每个核苷酸上共有多少个碱基) . 在格式化我的回复的上下文中,我的代码适用于小序列(已验证)。
但是,当涉及到大序列时,我在格式化我的回复时遇到了问题。无论长度如何,我期望返回的是:
所有都相互对齐并在各自的行上对齐,或者至少有一些格式允许我将这种格式作为一个单元继续进行,以保持对齐的完整性。
但是当我为一个大序列运行我的代码时,我得到共识序列下面的每个单独的字符串被换行符打破,大概是因为字符串本身太长了。我一直在努力想办法规避这个问题,但我的搜索一直没有结果。我正在考虑一些迭代编写算法,它可以只编写上述期望的全部内容,但可以分块编写任何帮助将不胜感激。为了完整起见,我在下面附上了我的全部代码,并根据需要添加了块注释,尽管主要部分。
缺点(“rosalind_cons.txt”)
python - Rosalind 共识和简介
我正在尝试从这里解决问题http://rosalind.info/problems/cons/
我的脚本填充计数器列表并输出相等长度的共识字符串。我认为没有发生数学或索引错误并且遇到了问题。我的代码:
感谢您的时间