问题标签 [dna-sequence]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bioinformatics - Biopython 中具有间隙对齐的 PWM
我正在尝试从 Clustalw 多序列比对生成 Biopython 中的位置加权矩阵(PWM)。每次使用间隙对齐时,我都会收到“错误的字母”错误。通过阅读文档,我认为我需要利用 Gapped Alphabet 来处理间隙对齐中的“-”字符。但是当我这样做时,它仍然无法解决错误。有没有人看到这段代码的问题,或者有更好的方法从有间隙的 Clustal 对齐中生成 PWM?
perl - 在gen列表中查找SNP的位置
我有 SNP 数据和基因列表数据。当我与 gen 列表进行比较时,我正在寻找 SNP cotain 在 gen 列表数据中的位置。例如:
SNP数据:
/li>gen列表数据:
/li>结果:在 SNP 的 14185 位置包含在 gen 列表的 16185 位置。
下面是我的代码,但在对数字进行排序时存在一些问题。
如果您能提供一些指示,我将不胜感激。
r - 计算R中两个基因序列之间的百分比差异
我无法在问题或 R 包中找到这个,希望是直截了当的。
取两个假设的基因序列:
我想让 R 代码生成两个序列之间单核苷酸的百分比差异(例如 15%)。
有什么想法吗?提前致谢。
wolfram-mathematica - DNA序列的混沌游戏
我已经尝试过使用mathematica 代码来制作这个地址中发布的DNA 序列的混乱游戏:http: //facstaff.unca.edu/mcmcclur/blog/GeneCGR.html
就像这样:
我拥有的fasta序列只是一个像AACCTTTGATCAAA这样的字母序列,要生成的图形是这样的:
该代码适用于小序列,但是当我想要放置一个巨大的序列时,例如几乎 40Mb 的染色体,该程序需要很多时间并且只显示一个黑色方块,因此无法分析。是否可以改进上述代码,使其显示的正方形更大?顺便说一下,正方形必须只是正方形单位。提前感谢您的帮助
string - 对齐 2 个 DNA 序列并找到互补区域
我试图在列表中找到一些线索,但我找不到,如果我问了一个重复的话题,很抱歉
我是 PERL 初学者,我正在尝试用 PERL 编写一个程序,该程序采用两个 DNA 序列,计算第二个序列的倒数并找到它们之间的最大互补区域,即:
输入:
输出:
我可以毫无问题地找到第二个序列的反面,但是我在 PERL 中的编程技能还很初级。我需要为 foreach 循环使用组合吗?
c# - 按照原始顺序获取 DNA 子串
我想得到长 DNA 序列的子串
例如,给定:
输出是:
我尝试了以下正则表达式模式:
它有效,结果被放在一个列表中,但我不知道如何检索原始序列中出现的每个结果的顺序。即 和 是否TTXX
分别TXG
出现在序列4中的第一个和第二个,但第二个和第一个出现在序列1中;在第二个和第三个结果中,这更难,因为 match-xx 函数调用不提供从相关序列中获取的子字符串的索引。感谢您的见解。
java - 正则表达式:提取 2 个标记之间的 DNA 信息
我正在尝试从文件中提取一些 DNA 信息。由碱基 GCAT 组成的 DNA 数据之前是单词ORIGIN
,之后是//
. 如何编写正则表达式来获取这些标记之间的这些碱基?
我尝试了以下方法,但它不起作用。
样本数据:
python - DNA搜索序列正则表达式中的多个错配
我编写了这个野蛮的脚本来创建字符串的排列,该字符串在字符串中所有可能的位置组合中包含 n(最多 n = 4)$。我最终会.replace('$','(\\w)')
用于 dna 搜索序列中的不匹配。由于我编写脚本的方式,某些排列少于请求的 $ 数量。然后我编写了一个脚本来删除它们,但它似乎并不有效,并且每次我运行删除脚本时,它都会删除更多不需要的排列。在下面粘贴的代码中,您将看到我使用一个包含 4 个不匹配的简单序列来测试该函数。然后我运行一系列删除脚本,计算每次删除了多少表达式……根据我的经验,删除所有通配符 $ 少于 4 个的表达式大约需要 8 次。我对此有几个问题:
是否有用于搜索“n”不匹配的内置函数?甚至在 biopython 中?到目前为止,我已经看到了 Paul_McGuire_regex 函数:
Search for string allowed for one mismatch in any location of the string,
这似乎只会产生 1 个不匹配。我必须承认,我并不完全理解该页面上剩余功能中的所有代码,因为我是一个非常新的编码器。由于我认为这对我来说是一个很好的练习,有没有更好的方法来编写整个脚本?...我可以根据需要多次迭代 Paul_McGuire_regex 函数吗?
最让我困惑的是,为什么删除脚本第一次不能 100% 工作?
感谢您的任何帮助,您可以提供!
python - 寻找 DNA 序列的互补序列
我必须将 DNA 序列的互补序列翻译成氨基酸
- 第一个序列是正常序列,
- 第二个是互补序列,
- 带+1的是我的互补序列对应的氨基酸序列
- 带+2的是与我的互补序列相对应的氨基酸序列,从第二个碱基开始
- +3的那个是对应于我从第三个碱基开始的互补序列的氨基酸序列
我已经尝试了下一个代码来获得我的结果,但是我只得到了一个补充序列。没有分裂。
有人可以帮我得到我的结果吗?
storage - 存储人类基因组需要多少存储空间?
我正在寻找存储单个人类基因组所需的字节存储量(MB、GB、TB 等)。我在维基百科上阅读了几篇关于 DNA、染色体、碱基对、基因的文章,并做了一些粗略的猜测,但在披露任何内容之前,我想看看其他人会如何处理这个问题。
另一个问题是人类 DNA 中有多少原子,但这与本网站无关。
我知道这将是一个近似值,因此我正在寻找能够存储任何人类 DNA 的最小值。