问题标签 [sequence-alignment]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
83 浏览

html - 在屏幕右侧从左到右在 HTML DOM 中写入 2 按钮

我写了我的 DOM 结构,如:

它会显示如下:https ://jsfiddle.net/ospv6vn8/3/

按钮3 按钮4 按钮2 按钮1

但我想像这样渲染它们:

按钮 4 按钮 3 按钮 1 按钮 2

我无法修改我的 DOM 结构,是的,我可以编辑样式以获得所需的外观。

0 投票
2 回答
676 浏览

python - 字符串列表到字符串的对齐索引

我需要一个函数来提供字符串列表最适合与更大字符串对齐的索引。

例如:

给定字符串:

和字符串列表:

可以创建一个函数来产生:



这是我创建的一个脚本来说明这一点:

假设函数按描述工作,这提供以下输出:

0 投票
1 回答
377 浏览

algorithm - 对齐数字序列的算法


,我有两个数字数据序列让我们说:
S1:1,6,4,9,8,7,5 和 S2:6,9,7,5
我想在左两个意义上找到一个序列比对- 左右。
所以我在问我之前使用了 2 种技术我实际上使用了匈牙利算法,但它不是顺序的,所以它没有给出好的结果
我使用了 Needleman-Wunsch 算法的修改版本,但我认为我可能做错了什么我已经挖掘了至少 4 个月的时间来寻找任何可以帮助我的东西,但我只找到了可能有帮助的遗传算法,但我想知道是否存在我可能还没有看到的算法?
所以正式提出我的问题:你将如何调整两个积极的数字(整数或双精度)序列?

0 投票
0 回答
46 浏览

algorithm - 十进制序列和距离的全局对齐方法


,我想对齐两个十进制序列以计算它们之间的距离并能够执行它们的总和,
例如让 S1 和 S2 成为这两个序列:
S1 =[0.568,0.469,0.3658,0.31667]
S2 =[ 0.64918,1.16]
这只是一个随机示例,向您展示我的观点
我目前正在尝试使用Needleman–Wunsch 算法来执行此操作,但很难将其转换为数字,现在我正在尝试使用Levenshtein 距离
但是是否有针对此类问题设计的算法,它仅是数值数据?

0 投票
2 回答
1218 浏览

python - 在两个单独的一维图之间绘制连接点的线

作为标题,我正在研究时间序列对齐,并且需要对齐结果的可视化。

为此,我想绘制连接对齐算法生成的“锚点”的线。

示例中的锚点指定两个时间序列的索引ap之间的一对一“映射” ,即对应于;到; 和到。目标是在两个单独的图之间画线以显示对齐的结果。xyx[0]y[0]x[4]y[9]x[9]y[19]

0 投票
1 回答
693 浏览

bioinformatics - 使用 biopython 重新编号 PDB 文件中的残基

我有一个序列比对:

我正在尝试编写一个代码,根据 PDB 文件中的这种对齐方式对残基重新编号:

原始 pdb:RES ID= 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 ...

新 pdb:RES ID = 18 18 18 19 19 19 19 19 20 20 20 21 21 22 23 24 25 31 31 31 31 32 32 33 34 35 36 ...

如果对齐仅在对齐开始时有间隙,则很容易弄清楚。只计算间隙(“-”)并将间隙总和添加到residual.id =“”“间隙总和”“”

但是,如果序列中间有间隙,我找不到方法。

你有什么建议吗?

0 投票
1 回答
650 浏览

bioinformatics - 调整 MAFFT 命令行算法以更好地解决差距

我一直在尝试使用 MAFFT 命令行工具来识别基因组中的编码区域。我的一般过程是将基因的氨基酸共有序列与目标序列的翻译阅读框对齐。我的方法在很大程度上是成功的。但是,我注意到一些奇怪的对齐方式会阻碍我的注释方法。以下是一个这样的示例(注意 - 我还包含了来自 Pairwise2 Biopython 模块的成对对齐以展示我想要的输出。不幸的是,Pairwise2 的计算时间比 MAFFT 命令行慢了近 20 倍):

我试图通过参考帮助文档(http://mafft.cbrc.jp/al ​​ignment/software/manual/manual.html )来更改 MAFFT 命令行对齐算法。我没有收到任何错误消息,但对齐输出没有改变。我不确定需要进行哪些调整。我相信通过增加间隙扩展惩罚(默认为零),对齐将得到改善。在此论坛上或通过 Google 搜索使用 MAFFT 命令行时,我无法找到许多使用自定义变量的文档示例。非常感谢您的帮助。作为参考,可以在此处找到有关 Pairwise2 对齐参数的文档:http: //biopython.org/DIST/docs/api/Bio.pairwise2-module.html

0 投票
1 回答
291 浏览

optimization - 具有任意空位罚分的序列比对

我想以最佳方式比对两个 DNA 序列,但我有长度为 L 的空位惩罚函数,如果 L 是 3 的倍数,则对于某个常数 a,惩罚是 a * L。如果 L 不是 3 的倍数,那么对于某个常数 b,惩罚是 b * L。

我应该设计一个 O(n * m) 算法,其中 n 和 m 是 DNA 序列的长度,可以找到最佳比对。但棘手的部分是我必须跟踪它正在扩展的间隙的大小。例如,如果我有两个连续的差距并进一步扩大一个差距,我需要将分数更新为L - b (L-1),但我无法制定能很好地处理这种情况的子问题。我考虑过引入一个新参数 L 来“猜测”最终间隙的长度,但这很容易超过 O(n * m)。

有没有办法有效地制定这些子问题?任何关键意见将不胜感激。

0 投票
2 回答
333 浏览

python - biopython 对齐的无限制索引

我第一次使用 biopython。如果这是一个基本问题,请原谅我。

我想输入序列,然后对齐它们,并且能够参考原始序列(未加间隙)和对齐序列(间隙)的索引位置。

我现实世界的例子是烯醇化酶(Uniprot P37869P0A6P9)。底物结合赖氨酸在大肠杆菌中的索引为 392,在枯草芽孢杆菌中为 389。如果对两者进行肌肉对齐,则该赖氨酸在对齐中的索引为 394。我希望能够在 gappend 和 unapped indicies 之间轻松转换。

示例 1:大肠杆菌残基 #392 的对齐索引是多少?(对齐序列中的答案 394)。

示例 2我在 394 的比对中发现了一个保守的残基。它在原始(未加缺口的)序列中的什么位置?(大肠杆菌中的答案 392 和枯草芽孢杆菌中的 389)。

0 投票
1 回答
80 浏览

matlab - 剪辑 3 个具有互相关性的信号(finddelay)

在 Matlab 中,我可以使用 finddelay 剪辑/修剪音频信号对(相同频率),如下所示,以便它们对齐并具有相同的长度:

我想对 3 个或更多信号做同样的事情,到目前为止,我试图为信号对取开始/结束界限,即 d12、d23、d31,然后取起始索引的最大值和最小值相应索引的结束索引。但是,它并没有给我 s1、s2、s3 的平等界限,我从根本上误解了一些东西。有人有什么建议吗?