问题标签 [genetics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1057 浏览

r - 为 BRCAPRO 癌症基因风险计算引擎编写 GUI

我认为这是 Stack Overflow 上一个完全独特的问题。首先是一些背景:

我被要求在名为 BRCAPRO (brack-a-pro) 的计算引擎之上编写一个新的 GUI。BRCAPRO 基于名为 BayesMendel 的软件实现了孟德尔计算模型。BRCAPRO 计算被专门从事癌症治疗的医生和外科医生用来向患者展示:

  • 根据他们的遗传和家族史被诊断出患有癌症的可能性。
  • 基于不同治疗形式和/或这些治疗开始年龄的预期寿命变化。

我已经做了足够的研究,知道 BRCAPRO 公式太复杂了,无法在我自己的代码中合理地实现。

现有一个众所周知的(癌症医生)软件包,称为 CancerGene:http ://www8.utsouthwestern.edu/utsw/cda/dept47829/files/65844.html 。这个程序很旧,在 Windows 95 上运行,包括计算引擎,用于我的客户端无法使用的几种癌症。理想情况下,我的客户希望他的应用程序在网络上运行,以便他可以轻松地与其他医生共享信息。

我的任务是使用基于 BRCAPRO 引擎的 CancerGene 应用程序,并且:

  1. 复制 90% 的功能
  2. 删除不必要的功能
  3. 修改报告的输出
  4. 如果可能,使其基于网络

现在我的问题:

有人知道如何针对 BRCAPRO 进行编码吗?我用 Google 搜索了两天,没有发现任何 API 文档或开发信息。维基百科说 BayesMendel 建模软件是用 R 编写的,但我不知道 BRCAPRO 是用什么编写的。我对 R 一无所知。

需要说明的是,我不需要修改 BRCAPRO 的行为或计算引擎。我只需要知道如何输入它,以便它返回数字给我。

-- 编辑以添加更多信息 --

我在上面的链接中下载了 CancerGene 应用程序并安装了它。有少量文档,包括 BRCAPRO 期望接收的数据格式。在不涉及不必要的细节的情况下,BRCAPRO 需要矩阵格式的数据,其中每一列代表一个遗传特征,每一行代表一个家庭成员。现在,我只需要知道从 Web/Windows 表单中收集到该矩阵后如何将其传递给 BRCAPRO 引擎。

希望 Stack Overflow 上有几个医生/开发人员!

KN

0 投票
3 回答
1880 浏览

genetics - 基因工程模拟

有没有人有关于基因工程模拟的任何好的软件/教程来源?也许是关于基因剪接/克隆模拟的开源软件?

谢谢

0 投票
2 回答
79 浏览

ruby - 不知何故没有用 Ruby 分配一个类

在运行时,我的代码经常遇到方法未定义的方法错误mate。据我所知,aPerson不知何故在代码执行的某个时候从裂缝中溜走了,并且设法没有allele分配给它。

代码(免责声明,不是最佳格式):

什么立即看起来不对劲?

0 投票
3 回答
2715 浏览

python - 原生 Python 中的 DNA 序列比对(无 biopython)

我有一个有趣的遗传学问题,我想在原生 Python 中解决(标准库之外没有)。这是为了使该解决方案在任何计算机上都非常易于使用,而无需用户安装额外的模块。

这里是。我从 454 次新一代测序运行中收到了 100,000 条 DNA 序列(最多 20 亿条)。我想修剪四肢以去除两端可能存在的引物,包括正常序列和有义序列。例子:

引物可以出现一次或多次(一个接一个)。正常的感觉总是在左边,而反向在右边。因此,我的目标是找到引物,剪切序列,只保留无引物的部分。为此,我想使用已在本机 Python 中实现的经典对齐算法(即:Smith-Waterman)(即:不是通过 biopython)。我知道这可能需要相当长的时间(最多几个小时)。

注意:这不是直接的“单词”搜索,因为序列和引物中的 DNA 可能由于各种技术原因而“突变”。

你会用什么?

0 投票
1 回答
1708 浏览

sql - SQLite - 是否有 rtree 的替代品来索引轴上的线?

我正在尝试创建一个带有开始和停止的位置数据库:基本上是一维轴上的线。我想有效地查询与给定间隔重叠的所有位置。在传统的表中,查询需要两个不等式,因此不能被索引。您也可以使用 R-Tree 索引,但它们似乎是为多维范围查询而设计的。有没有更有效的方法在轴上存储线?

如果有人好奇,该数据库将存储基因组间隔。这是一个示例表:

这样做的基本方法是:

同样,这真的很慢并且无法被索引。R-Tree 的工作方式如下:

R-Trees 并不适合我们的实现,所以我想知道是否有任何替代方案......

0 投票
2 回答
505 浏览

java - 遗传编程帮助

我需要一些关于 java 项目的指导。我要开发人类遗传(家谱)树。

这是主题:

每个人体细胞包含 23 对染色体,编号从 1 到 22,以及一对性染色体:女性为 XX,男性为 XY。在受精过程中,男性的 22+(X 或 Y)染色体与女性的 22+X 染色体融合。这会在细胞中产生 22 对染色体 +(X 或 Y),从而形成未来的婴儿。父亲遗传的第 23 条染色体(X 或 Y)将决定孩子的性别(XX 代表女孩,XY 代表男孩)。

每条染色体都携带许多基因(编码几乎所有的基因,一种形态学、生理学、行为学的特征)。由于成对的染色体,遗传信息被复制(部分性染色体除外)。基因的每个拷贝称为等位基因。这意味着例如,如果 a 基因负责眼睛的颜色,那么等位基因是蓝色的

由于存在等位基因的组合表达而表达的遗传信息。显性等位基因总是在其承载者的基因组中表达。然而,如果当同一基因的显性等位基因存在时,一个等位基因的信息不表达,则它是隐性等位基因。基因的隐性等位基因的特点是它可以存在于基因组中并在几代人中传播,而不会在其承载者的表型中表达。如果没有显性等位基因,则基因的两个拷贝具有相同的隐性等位基因(纯合隐性),则表示隐性特征。通过使用家谱,可以确定一个基因在一个家庭中的表达。

该程序应该能够执行以下操作:

- 生成依赖于 23 条染色体的简化版本,并允许用户将基因放置在染色体上,然后模拟染色体的复制、有丝分裂、减数分裂和融合,并显示基因在所得细胞上的位置。

- 允许绘制家谱树并推断一个人的家谱上基因表达的概率(或确定性)。

到目前为止,我已经创建了一个 Gene 类和一个 Chromosome 类。接下来,我考虑创建一个类“Parent”,并在其中创建 23 条染色体。但在此之前,我想让男性/女性的第 23 条染色体有所不同。然后模拟复制、交叉、有丝分裂等。我不知道我是否走在正确的轨道上。我也不知道如何指定特定的等位基因/基因是隐性的还是显性的。目前我的班级只是随机行事。我记录

基因.java

染色体.java

我的问题是能够使基因成为隐性或显性基因。例如,当蓝眼睛男性的染色体与棕色女性的染色体配对时,如果男性基因显性,那么孩子将有蓝眼睛而不是棕色,但那个孩子仍然有隐性基因“棕色眼睛”里面的某个地方。

我也想知道我制作的课程是否正确解决了这个问题。我还在考虑制作一个类“Pair_of_chromosome”,例如包含两个染色体变量,并制作一个包含 23 个“Pair_of_chromosome”表的类“Parent”。我不知道这是否是正确的方法。

0 投票
7 回答
459 浏览

programming-languages - 无语法编程语言

这可能是一个非常奇怪的问题,而且确实如此。我对如何用传统方法制作编程语言不太熟悉,所以我想知道,是否有可能设计一种无语法的编程语言?这意味着任何输入都是有效的并执行一定的计算,并且相同的输入总是会做同样的事情。不会出现语法错误(允许出现逻辑和运行时错误,程序可能会崩溃,进行随机计算等)。

我之所以想到这一点,是因为据我所知,遗传学基本上就是这样。

编辑:我认为有一些误解。无语法只是意味着所有输入都将计算,解释器/编译程序将遵循特定的指令集,无论它可能是随机的。

它还必须符合每个输入只有 1 个且只有 1 个输出的事实。有诸如语法错误之类的东西违反了该规则。

编辑 2 许多人对语法部分感到困惑。忘记语法,关注任何输入都会产生唯一输出的事实。

0 投票
1 回答
109 浏览

python - Python 调用多个 URL 并从中提取数据

我正在尝试编写一个可以调用网页的脚本(http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Tree&id=7742&lvl=3&lin=f&keep=1&srchmode=1&unlock ),扫描它,然后拉出每个嵌套分类群中的目、科、属和种。但是,我只想要脊椎动物(整个网站的一小部分),但与各种脊椎动物分类群相关的 URL 没有任何可辨别的模式(即顺序)。有没有办法做到这一点合理?在尝试制定不同的方法来实现这一目标时,我遇到了很多问题。

0 投票
2 回答
114 浏览

r - 使用 R 检索 GWAS 信息

我正在尝试从GWAS 目录中获取特定的疾病相关信息。这可以通过电子表格下载直接从网站上完成。但我想知道是否可以在 R 中以编程方式进行。任何建议将不胜感激。

谢谢。

阿沃克斯

0 投票
1 回答
2225 浏览

batch-file - 如何将 SNP 列表映射到基因?

我一直在寻找这个问题的答案一段时间。起初似乎不难解决,但现在似乎很有挑战性。

我正在寻找一种方法来提交 SNP (rs#) 列表并获取这些标记映射到的基因列表。

到目前为止,我主要有方法将 SNP 映射到疾病、途径等。或者使用基因来获取代表性 SNP 的列表。

另外,我对计算生物学还很陌生,所以我希望有一个不严重依赖编程的解决方案。