“rosalind”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

60 浏览

python - 为什么我在尝试删除时总是收到索引错误，而用字符替换效果很好？

编程 newb/python newb，我的工作要求不高，所以我找到了很多空闲时间来自学如何编码。

我正在处理这个rosalind.info 问题。

到目前为止，这是我的代码：

由于某些原因，

但是，返回一个 IndexError（列表分配超出范围），

将每个第二个列表成员转换为字母“k”。为什么是这样？

仅供参考，我现在要做的是将每个核苷酸放入一个列表中，然后将它们按三个分组，然后在将它们合并到第一个列表成员后删除以下两个列表成员，然后转到下一个密码子。

例如：['A', 'U', 'G'] -> [['AUG'], 'U', 'G'] -> ['AUG'], ['GCC'（下一个密码子） ]， ETC...

python rosalind

2016-02-25T19:19:57.473

0 投票

2 回答

759 浏览

python - 具有可变繁殖力的斐波那契凡人兔

我正在尝试修改斐波那契凡人兔子的 python 代码，以便根据兔子的年龄来改变兔子的繁殖力。让我们举个例子。

我的兔子在 3 个月后成熟，在 6 个月后死亡。在 4 个月的繁殖力期间，它们会根据年龄产生不同数量的后代。3个月大的时候生产2对兔子，4个月大的时候生产3对兔子，以此类推，直到第6个月。每对兔子由雌性和雄性组成。最后，我会计算配对的数量而不是个人的数量。从出生到死亡的繁殖力值：

我正在使用的 python 代码（https://github.com/jschendel/Rosalind/blob/master/011_FIBD.py）是：

我不确定如何实现繁殖力的变化。任何帮助表示赞赏！

谢谢你，瓦伦蒂娜

2016-03-10T11:11:48.200

0 投票

1 回答

1294 浏览

c# - 正则表达式 - 在字符串中多次匹配

我正在尝试对“NNTSY”进行正则表达式搜索，以便获得两个匹配项。

NNTS
NTSY

当我尝试使用 pattern 进行匹配?<NGrlyosylation>N[^P][ST][^P])"时，我只得到一个匹配项，即NNTS.

如何使用 Regex 进行匹配NNTSY，以便找到两个匹配项？

注意：背景信息：可以在这里找到 Rosalind 问题。

这是我的代码。

c#regex rosalind

2016-05-22T04:04:14.317

0 投票

2 回答

421 浏览

ruby - Rosalind：SUBS 失败了给定的案例

我根据这个答案为这个挑战写了一个解决方案。它成功地处理了给出的示例案例，但不是实际案例。

挑战：

给定两个字符串s，并且t,t是sif的子字符串，t作为连续的符号集合包含在s（因此，t必须不超过s）。

符号在字符串中的位置是在其左侧找到的符号总数，包括其自身（例如，“AUGCUUCAGAAAGGUCUUACG”中所有出现的 'U' 的位置是 2、5、6、15、17 和 18 ）。i位置处的符号s用表示s[i]。

的子串s可以表示为s[j:k]，其中j和k表示子串在中的开始和结束位置s；例如，如果s = "AUGCUUCAGAAAGGUCUUACG"，那么s[2:5] = "UGCU"。

子串的位置s[j:k]是它的开始位置j；请注意，如果它作为子字符串出现不止一次，t则会有多个位置（请参阅下面的示例）。ss

鉴于：

两个 DNA 字符串s和t（每个长度最多 1 kbp）。

返回：

的所有位置t作为的子字符串s。

样本数据集：

样本输出：

对于示例，它有效。当然，您需要手动修剪格式，但这只是几秒钟的工作。

不接受实际数据和我生成的输出。

实际数据集：

实际输出（修整）：

代码：

我哪里做错了？它似乎有条不紊。

编辑： 原来问题是环境中的一个小问题。重启后问题无法重现。

ruby regex string bioinformatics rosalind

2016-05-23T13:53:10.827

0 投票

1 回答

1325 浏览

python-2.7 - 部分摘要算法 (PDP)

我正在尝试实现部分摘要问题，该算法在此 pdf https://cise.ufl.edu/class/cap5515sp10/Ch04_DNA_mapping.pdf第 35-36 页中给出。后面几页有一个例子。

我无法得到正确答案。

我得到的 X 值为 [0, 10, 8, 3, 6] ，然后递归以“Not ok”停止。

可能是我不了解算法还是其他什么？

python-2.7 bioinformatics rosalind

2016-07-07T19:34:36.207

0 投票

1 回答

63 浏览

rosalind - GC skew 的运行时间太长

我目前正在编写一个分析偏斜差异的脚本。不幸的是，我的问题是当字符串的长度增加时，运行时间变得太长，我似乎无法计算出我的答案。

本质上，这个脚本计算 G 和 C 的数量（对应于 DNA 中的核苷酸），获得每个位置的差异，然后我试图找到最小值的索引。它适用于低长度的文件（即输入字符串），但是当长度变大时 - 即使像 90000+，然后我的脚本运行但无法在合理的时间内（约 4-5 分钟）解决答案。

谁能指出我可以做些什么来让它更快？我考虑过是否最好说，获得差异（diffGtoC），将其设置为最小值，然后重新计算每个差异，直到它看到不同的东西，在此期间我也替换最小值。

但是我对这种方法的担忧是寻找和保留最小值的索引。如果我说，有一个包含值的数组：

[-4,-2,-5,-6,-5,-6]

我可以看到更改最小值（-4 到 -5，然后到 -6）在算法运行时方面会更快，但我如何能够保持 -6 的位置？不确定这是否完全有意义。

rosalind

2016-07-26T06:06:31.190

0 投票

1 回答

3275 浏览

python - Python：多个共识序列

从 dna 序列列表开始，我必须返回所有可能的共有序列（在每个位置具有最高核苷酸频率的结果序列）序列。如果在某些位置核苷酸具有相同的最高频率，我必须获得具有最高频率的所有可能组合。我还必须返回配置文件矩阵（每个序列的每个核苷酸频率的矩阵）。

到目前为止，这是我的代码（但它只返回一个共识序列）：

（如你所见，在位置四，C和G得分相同，这意味着我必须获得两个共识序列）

是否可以修改此代码以获得所有可能的序列，或者您能否解释一下逻辑（伪代码）如何获得正确的结果？

非常感谢您！

python bioinformatics rosalind

2016-07-26T10:01:46.107

0 投票

1 回答

2598 浏览

python - Rosalind 共识和配置文件 python

我正在研究 Rosalind 生物信息学网站 ( http://rosalind.info/problems/cons/ ) 上的“共识 nd Profile”问题。我使用网站上的示例输入尝试了我的代码，并且我的输出与示例输出匹配。但是当我尝试更大的数据集时，网站说我的输出是错误的。有人可以帮我确定我的问题出在哪里吗？谢谢！

样本输入：

我已经提取了 dna 字符串并将它们存储在一个名为 strings 的列表中（我对较大数据集的试验在这一步是正确的，所以我在这里省略了我的代码）：

之后我的代码：

对于示例输入，M 看起来像这样：

之后我的代码：

这些代码给出了正确的示例输出：

但是当我尝试更大的数据集时，网站说我的答案是错误的......有人能指出我错在哪里吗？（我是初学者，感谢您的耐心等待！）

python python-2.7 bioinformatics rosalind

2016-07-26T15:22:39.117

0 投票

1 回答

372 浏览

python - Rosalind Profile and Consensus：在 Python 中将长字符串写入一行（格式化）

我正在尝试解决 Rosalind 上的一个问题，在给定 1kb 最多 10 个序列的 FASTA 文件中，我需要提供共有序列和配置文件（所有序列在每个核苷酸上共有多少个碱基） . 在格式化我的回复的上下文中，我的代码适用于小序列（已验证）。

但是，当涉及到大序列时，我在格式化我的回复时遇到了问题。无论长度如何，我期望返回的是：

所有都相互对齐并在各自的行上对齐，或者至少有一些格式允许我将这种格式作为一个单元继续进行，以保持对齐的完整性。

但是当我为一个大序列运行我的代码时，我得到共识序列下面的每个单独的字符串被换行符打破，大概是因为字符串本身太长了。我一直在努力想办法规避这个问题，但我的搜索一直没有结果。我正在考虑一些迭代编写算法，它可以只编写上述期望的全部内容，但可以分块编写任何帮助将不胜感激。为了完整起见，我在下面附上了我的全部代码，并根据需要添加了块注释，尽管主要部分。

缺点（“rosalind_cons.txt”）

python python-3.x rosalind

2016-08-06T15:16:58.670

0 投票

1 回答

616 浏览

python - Rosalind 共识和简介

我正在尝试从这里解决问题http://rosalind.info/problems/cons/

我的脚本填充计数器列表并输出相等长度的共识字符串。我认为没有发生数学或索引错误并且遇到了问题。我的代码：

感谢您的时间

python bioinformatics consensus rosalind

2016-11-09T20:03:13.200

问题标签 [rosalind]

挑战：

鉴于：

返回：

样本数据集：

样本输出：

实际数据集：

实际输出（修整）：

代码：

Reference