问题标签 [sequence-alignment]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
811 浏览

python - MuscleCommandline 在 Biopython 中不起作用

我需要将我的 python 脚本与肌肉工具集成以进行多序列比对。我按照 Biopython 上的教程进行操作,这是我的代码:

我正在使用重命名的muscle.exe 文件在正确的文件夹中运行它。但是,除了命令和文件aligned.fasta 没有创建,python 不输出任何内容。我看到了老问题,但似乎没有人遇到过这个问题。Muscle 在正常命令行中工作正常。谢谢你。

0 投票
2 回答
355 浏览

r - R 中 align_local 函数的错误

我正在尝试比较两个基因序列:

使用 textreuse 包中的 align_local 函数。我的输入是:

我得到了错误:

我尝试修改对齐分数和不匹配分数,但无济于事。任何意见,将不胜感激。

0 投票
0 回答
462 浏览

algorithm - 如何对齐长文本?

我想将一对长文本与每个约 20M 字符对齐。

我过去使用过 Smith-Waterman 算法,但是(根据我的有限理解)它需要创建一个具有文本大小的二维数组(20M x 20M 数组)——这是不切实际的。

所以我正在寻找一种算法来对齐一对长文本,以保持实际的内存大小和执行时间。

更新

我也尝试过使用此实现的 Myers 和 Miller:https ://www.codeproject.com/Articles/42279/Investigating-Myers-diff-algorithm-Part-of 但我仍然在“不太大”时出现内存不足异常" 文本 (1MB)。

0 投票
2 回答
893 浏览

ios - 为什么 Vision 框架无法对齐两个图像?

我正在尝试使用相机拍摄两张图像,并使用 iOS Vision 框架对齐它们:

但这会产生严重未对齐的图像:

在此处输入图像描述

在此处输入图像描述

在此处输入图像描述

你可以看到我尝试了三种不同类型的场景——特写主体、室内场景和室外场景。我尝试了更多的户外场景,结果几乎每一个都是一样的。

我预计在最坏的情况下会出现轻微的错位,但不会完全错位。出了什么问题?

我没有将图像的方向传递给 Vision 框架,但这不应该是对齐图像的问题。这仅适用于面部检测之类的问题,其中旋转的面部不会被检测为面部。在任何情况下,输出图像都有正确的方向,所以方向不是问题。

我的合成代码工作正常。只有Vision框架有问题。如果我删除对 Vision 框架的调用,将电话放在三脚架上,则构图可以完美运行。没有错位。所以问题是Vision框架。

这是在 iPhone X 上。

如何让 Vision 框架正常工作?我可以告诉它使用陀螺仪、加速度计和指南针数据来改善对准吗?

0 投票
1 回答
25 浏览

diff - 两个紧密匹配的文件:得到对应的行?

我处于以编程方式生成 LaTeX 代码的情况,我希望我的 Synctex 指向原始文件中的正确行。

生成基本上是做模板扩展,所以原始文件与生成的文件几乎相同,但扩展了一些片段。

我想知道,是否有一个 diff 工具或库可以轻松地为我提供与生成的给定行相对应的原始文件的行号?这可以以某种方式从普通的 Unix 差异中提取出来吗?

这是构建脚本的一部分,因此理想情况下,易于运行的东西(如 bash 或 python)优于需要编译的东西。

0 投票
1 回答
157 浏览

matlab - 沿水平方向对齐曲线

对于相同的实验条件,我有一些实验曲线。由于系统中固有的热漂移,数据集彼此并不完全对齐。我正在寻找一种强大的算法来为我对齐数据曲线。

这是我到目前为止所尝试的:

曲线如下所示:

在此处输入图像描述

这就是我想要得到的:

预期产出

(在这里我已经对齐了曲线y1和曲线y2的顶部y


我认为互相关可能有助于我对齐数据。所以我尝试了:

但这给了我sh=0

有没有更好的方法来做到这一点?

0 投票
0 回答
42 浏览

sequence - 在 Smith-Waterman 算法中找到最大间隙率

我现在正在研究 Smith-Waterman 算法。我知道通过增加间隙惩罚,在我的最终对齐中将获得更少的间隙,但我需要有关如何控制最大间隙率(检测到的字符中间隙字符的比率)的建议?例如:

最大间隙率:50% 序列 1:ABBBBC 序列 2:ABC

最终对齐:AB---C

从检测到的字符的总长度为 6,它将检测多达 3 个有间隙的字符作为相似的对齐。谢谢你。

0 投票
0 回答
75 浏览

r - 比对序列并将其与引物进行比较

我希望展示引物在一些基因组数据中的一致性。我有一个大约 23bp 的引物,并希望将其与大约 5000 个 10kb 的基因组序列进行比较。由于这对我的计算机来说太多了,所以我想这样做:

我使用的数据是所有登革热序列(所有血清型)和带有以下代码的引物:ATGTGGAAGCAAATATCAAATGA。

我试图以某种方式使用 msa() 函数,只查看感兴趣的基因部分。但是,这很困难,因为要准确预测是否需要对齐。

我仍在考虑可能在基因的那部分周围剪下一个任意数字并对齐它,但无法找到正确展示它的方法,并且还认为其他人可能会提出更好的方法来做这件事。

我正在使用 Biostrings、msa 和 seqinr。我使用ncbi获取基因序列并使用 FASTA 文件。

谢谢!

0 投票
1 回答
2758 浏览

r - R如何可视化成对对齐

如何可视化两个序列的完全对齐?

输出:

在这里,只显示了对齐的一部分?你知道任何绘制或打印对齐的现有函数吗?

0 投票
1 回答
1276 浏览

python - 如何在python中合并字符串与重叠字符?

我正在开发一个 python 项目,该项目读取一个 URL 编码的重叠字符串列表。每个字符串的长度为 15 个字符,并与其顺序字符串重叠至少 3 个字符,最多 15 个字符(相同)。

该程序的目标是从重叠字符串列表(有序或无序)转换为压缩的 URL 编码字符串。

我当前的方法在重叠字符串中的重复段上失败。例如,我的程序错误地组合:

输出:

当正确的输出是:

我使用的是简单的 python,而不是 biopython 或序列对齐器,但也许我应该是?

非常感谢任何关于此事的建议或在 python 中执行此操作的好方法的建议!

谢谢!