问题标签 [bioinformatics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
web-services - 使用 curl 向 reactome.org 发送 SOAP 查询
(注意:这个问题是在Biostar上交叉发布的)
大家好,
我正在尝试使用curl将 RPC 编码的 SOAP 查询发送到Reactome(一个生物途径数据库):
我想调用 http://www.reactome.org:8080/caBIOWebApp/services/caBIOService?wsdl中定义的远程方法queryPathwaysForReferenceIdentifiers
我创建了以下 SOAP/XML 文件:soap.xml
我使用以下命令将其与 curl 一起发送:
但是响应是空的,而我期望得到一个结果。
我的请求中有错误吗?在哪里 ?
非常感谢 !
皮埃尔
matlab - Matlab:具有统一图列高度的 seqlogo
在 Matlab 中,我想制作一个氨基酸序列图谱的seqlogo 图。但不是通过熵来缩放绘图列的高度,而是希望所有列的高度相同。
我正在根据这个问题的答案修改代码,但我想知道是否有 seqlogo 的参数或我错过的其他一些函数会使列高统一。
或者,我是否可以将统计转换应用于序列配置文件以破解所需的输出?(列高度一致,每个字母的高度与其在 seqprofile 中的概率成线性比例)
perl - 从文件读取而不是从 STDIN 读取需要更改什么?
编写此程序以获取核苷酸序列并将其翻译成蛋白质序列。但是程序必须从一个文件中获取所有的核苷酸序列并翻译成蛋白质序列。包含核苷酸序列的文件如下所示:
该程序在一行中接受输入。程序应该读取由多行序列组成的文件,例如有多个序列,并且所有序列都>
以一个文件开头。问题是程序在一行中接受输入。
这是程序:
normalization - 在方差分析之前缩放?
我想进行方差分析以识别差异表达的基因。在寻找差异表达基因之前,我应该使用分位数归一化或中值绝对偏差来缩放数据,还是应该直接对通过 RMA 获得的数据应用方差分析?
非常感谢提前
java - 遗传过程有助于java
我需要一些关于 java 项目的指导。我要开发人类遗传(家谱)树。
这是主题:
每个人体细胞包含 23 对染色体,编号从 1 到 22,以及一对性染色体:女性为 XX,男性为 XY。在受精过程中,男性的 22+(X 或 Y)染色体与女性的 22+X 染色体融合。这会在细胞中产生 22 对染色体 +(X 或 Y),从而形成未来的婴儿。父亲遗传的第 23 条染色体(X 或 Y)将决定孩子的性别(XX 代表女孩,XY 代表男孩)。
每条染色体都携带许多基因(编码几乎所有的基因,一种形态学、生理学、行为学的特征)。由于成对的染色体,遗传信息被复制(部分性染色体除外)。基因的每个拷贝称为等位基因。这意味着例如,如果 a 基因负责眼睛的颜色,那么等位基因是蓝色的。
由于存在等位基因的组合表达而表达的遗传信息。显性等位基因总是在其承载者的基因组中表达。然而,如果当同一基因的显性等位基因存在时,一个等位基因的信息不表达,则它是隐性等位基因。基因的隐性等位基因的特点是它可以存在于基因组中并在几代人中传播,而不会在其承载者的表型中表达。如果没有显性等位基因,则基因的两个拷贝具有相同的隐性等位基因(纯合隐性),则表示隐性特征。通过使用家谱,可以确定一个基因在一个家庭中的表达。
该程序应该能够执行以下操作:
- 生成依赖于 23 条染色体的简化版本,并允许用户将基因放置在染色体上,然后模拟染色体的复制、有丝分裂、减数分裂和融合,并显示基因在生成的细胞上的位置。
- 允许绘制家谱树并推断一个人家谱上基因表达的概率(或确定性)。
到目前为止,我已经创建了一个 Gene 类和一个 Chromosome 类。接下来,我考虑创建一个类“Parent”,并在其中创建 23 条染色体。但在此之前,我想让男性/女性的第 23 条染色体有所不同。然后模拟复制、交叉、有丝分裂等。我不知道我是否走在正确的轨道上。我也不知道如何指定特定的等位基因/基因是隐性的还是显性的。目前我的班级只是随机行事。
基因.java
染色体.java
谢谢
perl - 如何将文件作为输入并忽略换行符
以下是fasta fileA的内容:
现在我需要将 fileA 作为输入,找出 1 和 2 之间以及 1-3 之间存在的不匹配,并找出它们之间的核苷酸变化。到目前为止,我已经编写了一个程序,但它不接受 fileA 作为输入。好心的帮助
我的问题是我需要将 fileA 作为输入,并且序列在每 51 个核苷酸之后包含换行符,我的程序也考虑换行符来找出不匹配。
程序:
scala - Clojure 或 Scala 用于生物信息学/生物统计学/医学研究
我不是专业程序员(我的领域是医学研究),但我在 C/C++ 和各种脚本语言方面相当有能力。不久前,我对 Lisp 很感兴趣,但我一直没有时间认真学习它。在短暂接触R之后,我决定在函数式编程语言上投入更多时间。
我想要 JVM 语言的实用性,因此将范围缩小到 Clojure 和 Scala。据我了解,两者都可以使用已经存在的 Java 库,并且可以将性能关键的代码委托给 Java,有可能表现得相当好。
这些语言在我需要它们的应用程序空间中如何比较?是否有任何生物信息学的现实项目使用这两种方法?
已经存在的代码将是一个重要的优势,良好的文档和相当温和的学习曲线也是如此。另外,两者的并发模型如何相互比较?
任何人有什么显着的优势/劣势?
perl - 机械化基本问题
我正在使用这个网站:http ://bioinfo.uni-plovdiv.bg/microinspector/
从机械转储,我得到
这就是我到目前为止所拥有的。
我不确定下一步该怎么做;我觉得我没有正确设置有机体(这是一个下拉菜单,所以我需要选择),但我认为我没有在代码中正确编写它。
此外,一旦单击表单,它就会转到一个新页面(url 是 POST 吗?)。任何帮助表示赞赏。谢谢你。当我运行上面的代码时,我得到了这个
输入的序列对于任何想尝试的人来说都是这样的
AAACACACTGGGGAATGGAGCAAGACAGTCTTTGAATATCAAACACGCAAGGCAATGAGACTACCCATCATAGATATCGCACCCTATGACATTGGGGGTCCTGATCAAGAATTTGGTGTGGACATTGGCCCTGTTTGCTTTTTATAAGCCAAACTCTCTGAAACCCCAGCAAAACAAAAACCACATCCATGTGTTCATCTTGTTTTAATCTTATCAACCAGTGCAAGTGACCAACTAAATTCCAGTTATTTATTTCCAAACTTTTGGAAAAAGCATAATTTGACAAAAAAAGAATACAATTTTTTGCTGTTTCAACCACCCAATACAGGTCAAATGCTTTTGTTTTATTTTTTTACCAATTCCAACTTCAAAATGTCTCAATGGTGCTATAATAAATAAACGTCAACACTTTTATGATAA
histogram - 变异性分析算法
我使用很多直方图。特别是,这些直方图是沿着人类基因组片段的碱基调用。
x 轴上的每个点都是组成 DNA 的四个含氮碱基(A、C、T、G)之一,y 轴表示碱基能够被“调用”(或被测序仪识别)的次数机器,以便对基因组进行测序,这只是确定基因组中每个碱基的身份)。
这些直方图中的许多显示大致线性下降(当机器无法获得足够的读取深度时),从类似高原的区域下降到 0 或(几乎为 0)。当分数降至零时,意味着测序仪无法确定碱基的身份。如果您以前见过双螺旋,这意味着测序仪无法确定螺旋的一半梯级的标识。基因组的某些区域比其他区域更难表征。具有大量碱基调用的碱基(或 x 个数据点),数量级 >=100,能够被明确识别。例如,如果一个碱基总共有 250 个调用,我们有 248 个 T 调用,1 个 G 调用和 1 个 A 调用,我们将其称为 T。具有 0 个碱基调用的区域是值得关注的,因为那时我们' 我们必须从邻近区域推断低读取区域的身份可能是什么。是否有一种简单的算法可以为这些图分配反映这种趋势的分数?有关示例 histo,请参见 box.net/shared/nbygq2x03u。
perl - 关于 submit() 的机械化问题
我尝试在论坛上四处寻找并搜索答案,但无法弄清楚。在为需要时间进行计算的网页提交表单后,Mechanize 会等待所有计算完成(即使需要一个小时?)。好像这不会发生。我正在遍历一个创建 Mechanize 对象并提交表单并在计算完成后下载输出文件的子例程。但是,我觉得它在没有完成所有这些任务的情况下跳转到循环的下一次迭代,因为有时计算需要很长时间。有没有人有什么建议?谢谢。这是子程序