1

如何使用替换矩阵修改Smith-Waterman 算法以在 Perl 中对齐蛋白质?

[需要引用]

4

2 回答 2

5

我实际上是一名生物信息学研究员,并且正在等待他自己的生物信息学代码运行,所以我会尝试回答你的问题,即使它的提出相当糟糕。

我不确定您为什么认为需要“修改” Smith-Waterman 算法。Smith-Waterman 算法唯一需要比对蛋白质而不是 DNA 的是蛋白质的替换矩阵。查看 BLOSUM 或 PAM。这些是基于很久以前一些生物学家手工比对的序列中各种氨基酸对的替换频率。

构建蛋白质序列的替换矩阵比 DNA 序列复杂得多。例如,您希望一种亲水性氨基酸相对频繁地替代另一种亲水性氨基酸,因为它通常能够这样做而不会导致蛋白质失去功能。但是,您不会期望疏水性氨基酸经常替代亲水性氨基酸,因为这会更剧烈地改变蛋白质结构。

如果您将替换矩阵视为输入而不是算法的一部分,则 Smith-Waterman 算法虽然通常应用于 DNA 或蛋白质,但在技术上是一种通用的字符串对齐算法。

于 2009-11-09T23:14:02.317 回答
2

也许从Bio::Tools::pSW开始,尝试按照您想要的方式修改它,如果遇到困难,请提出具体问题。

于 2009-11-09T17:48:43.363 回答