问题标签 [genome]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
699 浏览

c# - 为遗传算法表示二进制基因组的明智方法是什么?

之前的问题掩盖了我的经验不足,并且是基于一个假设。现在我聪明多了。(将 1 和 0 放在一个字符串中?呸!我对这个建议一笑置之!)

那么我的问题是,我应该如何编码我的基因组

在纸面上,它们看起来像这样:

17 位编码(在某些情况下单独,在某些情况下作为组)要测试的参数。

要求是:

  1. 需要可扩展。目前可能有 17 个,但随着选项的添加、删除或范围的修改,这可能会增加/缩小。
  2. 每个位都需要单独翻转,以表示点突变。
  3. 理想情况下,取两个基因组的最后 X% 并将它们转换(表示交叉)应该很容易。
  4. 必须有一种直接的方式以明文形式表示基因组。这里的重点是方便而不是人工翻译。(想想 URL 缩短器。)

有人有什么好主意吗?(如果有用,我正在使用 C#。)

0 投票
1 回答
334 浏览

python - 适用于 Python 的 GBrowse API

GBrowse 是否有 python 接口,例如 perl 中的 Bio::Graphics ?否则,是否有任何 python 模块可用于创建像视图这样的基因组浏览器?

0 投票
1 回答
4015 浏览

database - 我可以使用音乐基因组计划吗?

是否有我可以访问的 API 或数据库,或者它是专有项目?

0 投票
1 回答
329 浏览

artificial-intelligence - 如何确定基因组的特征?

在 AI 中,是否有任何简单和/或非常直观的示例来说明如何将基因组实现到模拟中?

基本上,我在进行一个简单的演练(不是教程,而是总结性质的东西),其中详细说明了如何实现一个基因组,该基因组在总和中改变了“个体”的特征。

这些基因不会是这样的:

  • 大量的
  • 力量
  • 长度,
  • ETC..

而是它们应该是定义上述事物的事物,从模拟居民的实际特征中抽象出基因组。

我对自己想要什么足够清楚吗?

无论如何,如果您尝试过任何更好的方法,并且以像这些性游泳者这样的形式实现进化,那么请务必继续发布!越有趣的灵感越好:)

0 投票
2 回答
353 浏览

algorithm - 使用随机读数查找基因组覆盖率

谢谢你看我的问题。我正在尝试解决这个作业问题。

考虑通过随机读取对基因组进行测序的问题。如果 G 是整个序列的长度,L 是 read 的长度,n 是 reads 的数量,那么覆盖率定义为 nL/G。现在,如果我们希望 50% 的原始长序列被至少一个片段覆盖,我们需要多少覆盖?

我阅读了 Lander-Waterman http://www.genetics.wustl.edu/bio5488/lecture_notes_2005/Lander.htm模型来理解这个概念。但不太明白如何解决这个问题。我想将给定的 50% 视为概率,将 y 视为 1(来自泊松分布的那个)并计算 lambda(即覆盖率)。但我不认为我走在正确的轨道上。我想将 y 视为 1,因为问题说 50% 的原始长序列被至少一个片段覆盖,这意味着这些碱基至少被测序一次。

我可能错了。

请各位高手指导一下。

谢谢你。

0 投票
2 回答
119 浏览

php - 我可以用 php 解析 hg19.2bit 吗?

我知道这可能是 php 的一个不起眼的用途,但我正在研究以一种相当有趣的方式导航人类基因组的想法。

问题是我需要知道我是否可以编写一个 php 脚本来解析免费可用的数据,如果可以,我将如何开始?是否有任何 php 脚本可以做到这一点?

0 投票
1 回答
208 浏览

python - 如何修改GenBank记录的序列?

我想做的是在基因组文件中以小写形式制作 GenBank 记录的所有非推定序列。

到目前为止,我设法获得了 gbk 中蛋白质的开始和结束位置。从那里我执行以下操作:

现在我有了基因组中序列的开始和结束位置。但是如何修改基因组文件呢?gb_record.seq[start:end].lower()或类似的东西没有成功。

当我分配时,当gb_record.seq = gb_record.seq[start:end].lower我替换基因组文件时,它显然出错了。有任何想法吗?

0 投票
2 回答
3580 浏览

download - 我在哪里下载基因表达数据?

我想下载由微阵列实验产生的基因表达数据。我对这个主题不太了解,但据我所知,行通常对应于基因,列对应于样本。理想情况下,我期望一个基因表达数据矩阵。

我一直在互联网上搜索,虽然看起来有很多地方可以下载这些数据,但当我真正下载数据时,我没有得到基因表达矩阵。有人可以让我知道是否有地方或如何以我期望的上述格式下载基因表达数据?

任何帮助表示赞赏。

0 投票
3 回答
179 浏览

python - 在字符串中找到相同的部分

我有一个字符串,例如:abcgdfabc

我想做以下事情:输入:一个字符串,例如:

输出:一个字典(键是“单词”,值是它出现的时间),

words 是 "words" 的最大长度,它应该是贪婪匹配。

我花了很多时间在上面,无法弄清楚。字符串长度超过5000,是一个基因组,我们要搞清楚它的关系,第一次找这样的dict让数据更清晰,求助。

0 投票
2 回答
1363 浏览

r - 如何在 R 中为基因/基因组覆盖制作时间线/瀑布图

我想做一个相对简单的情节(让人想起这样的时间线:http: //www.ats.ucla.edu/stat/sas/code/timeline.gif),但不是x轴上的时间,它将是基因组中的碱基位置。“时间跨度”将是 DNA 序列支架的覆盖距离,显示它们在基因组中的位置、重叠位置和没有覆盖的位置的跨度。这是我正在寻找的粗略模型,显示了 rRNA 的 contig 覆盖,(我省略了,但需要一个 x 轴,显示开始和停止的位置,以及 contig 的标记(彩色线)): http://i.imgur.com/MDABx.png,坐标如下:

我很确定这可以在 R 中完成,可能使用 ggplot2,但由于某种原因我无法弄清楚。