问题标签 [rosalind]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何编写字符串算法
给定一个 FASTA 文本文件 (Rosalind_gc.txt),我应该检查每个 DNA 记录并确定鸟嘌呤-胞嘧啶 (GC) 含量的百分比 (%)。
这方面的例子是:
样本数据集:
样本输出:
罗莎琳德_0808 60.919540
所以基本上遍历每个字符串,计算 G/C 出现的次数,然后将总数除以每个字符串的长度。我的问题是学习如何识别代码中的中断(即 >Rosalind_6404 )。我想要一个不使用 Biopython 和 biopython 方法的代码示例。
python-3.x - 我无法理解该名称错误的原因
我正在尝试解决http://rosalind.info/problems/list-view/上的问题,并且有一个名为 IPRB 的问题。简而言之,我们有 3 种不同的生物体 k(纯合子显性)、m(杂合子)和 n (纯合子隐性)。它要求您计算两个随机选择的个体的后代具有显性等位基因的概率。您可以从这里 ( http://rosalind.info/problems/iprb/ ) 检查它。
我的问题是;我用示例输入(2、2、2 表示 k、m、n)编写了一个工作代码,并得到了估计的输出。但是,当输入值彼此不同(即 25、20、18)时,我收到如下错误消息:
回溯(最近一次调用最后):文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”,第 43 行,在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义
我在网上研究了该代码的原因。似乎此错误与名称定义有关,例如使用后定义或功能外定义等。但是我检查时没有任何名称。简而言之,我不知道如何解决它,我决定在这里问。
我有 3 个变量和一个保存它们的列表。该输入工作正常,但...
例如,当它是这样的:
我得到错误:
回溯(最近一次调用最后):文件“C:/Users/mNm/PycharmProjects/PySummer/venv/Scripts/IPRB.py”,第 43 行,在 pr3 = float(pr31 + pr32 + pr33) NameError: name 'pr31'没有定义
第 43 行在这里:
43 --> pr3 = 浮动(pr31 + pr32 + pr33)
如果您想查看整个内容并进行检查,我也想粘贴我的完整代码。
我希望输出在 0-1 之间,因为它是一个概率,但更重要的是了解导致该错误的原因以及我做错了什么。
python - pandas DataFrame中值的计数频率
拥有这个 pandas.core.frame.DataFrame:
我想得到一个这样的数据框:
基本上,我想要的是逐列计算频繁的列并创建第二个 df,如我所示。
我想这样做是因为最后,我想获得一个共识字符串。应该是这样的 ATGCAACT
任何人都可以帮助我或给我一些建议吗?
python - Python:Rosalind 共识和简介
我正在尝试解决 Rosalind 上的“共识和简介”挑战。挑战说明如下:
给定:最多 10 个等长(最多 1 kbp)的 FASTA 格式 DNA 字符串的集合。
返回:集合的共识字符串和配置文件矩阵。(如果存在多个可能的共识字符串,那么您可以返回其中任何一个。)
我的代码如下(我从这个网站上的另一个用户那里得到了大部分)。我唯一的问题是一些 DNA 链被分解成多个单独的行,因此它们被作为单独的字符串附加到“allstrings”列表中。我试图弄清楚如何将不包含“>”的每个连续行写为单个字符串。
python - 想要在python中的另一个字符串中找到模式(子字符串)开始的位置
输入:
输出:
每次模式(strB)开始时,我都在寻找一种方法来查找字符串(strA)中的起始位置。
r - 关于最短子字符串实现问题,如何提高 R 代码的速度?
我决定从 R 中的 Rosalind 实现这个问题。它适用于小样本数据集:
但是,当我为真实数据集运行它时需要很长时间(50 个序列,长度约为 1000 个字符)。您能否看看我的代码并给出一些建议,我应该更换什么来提高速度?我只有五分钟的时间来发布答案......这是我写的一些解释。
结果:
我认为主要问题在于for()
循环,sapply()
以及非常有用的功能,例如str_detect()
您认为什么?
样本输入:
python - Rosalind 共识和配置文件问题代码不起作用
这就是问题所在:http ://rosalind.info/problems/cons/
我的代码有什么问题?对于示例输出,它可以工作,但对于较大的数据集则不行。我不知道出了什么问题,我认为是文件读取部分不正确(也许?)
编辑:那里有一些打印功能,但我没有将它们复制到答案框中,因此它们对结果无关紧要
python - Python 正则表达式查找从上一个匹配项开始的匹配项
我正在寻找python中字符串中所有子字符串的索引。我当前的正则表达式代码找不到在前一场比赛中开始的比赛。
我有一个 string:s = r'GATATATGCATATACTT'
和一个 substring t = r'ATAT'
。索引 1、3 和 9 处应该有匹配项。使用以下代码仅显示索引 1 和 9 处的匹配项,因为索引 3 在第一个匹配项中。如何让所有匹配项出现?
非常感谢!
python - 我无法在 python 中正确使用替换命令
我是平台新手:
我对替换命令的使用有疑问。
这是我的代码和我需要做的事情:问题是我需要用字符串序列替换子字符串。
例如:从:Hitacoworld 到 Hiworld。问题是我从带有字符串和子字符串的字典中分离出来,我不知道如何在没有子字符串部分的情况下获取字符串。我以这种方式使用命令替换:
'string'
我的字符串在哪里,是'seqs[element]'
我想从字符串中删除的子字符串,但问题是当我看到结果时我没有得到正确的字符串,所以我认为问题在于使用替换,任何提示或我可以使用的东西?Ty提前,我迷路了。