0

我有两组字母“AGTE”的字符串AB,我想找到一些比较它们的方法,看看它们在统计上是否相似。第一组 A 是真实世界的观察,B 是预测。每组有 400 人左右

**A**
GTAATEGTTTEAAA
TTEAGE
...

**B**
AGTEAAAAGT
TAT
GGATEAATGGGTEAATG
....

我还想以某种方式将这些可视化,真正用于演示目的。你有什么想法我可以做到这一点吗?

4

1 回答 1

1

我建议您计算字符串之间的Levenshtein 距离,然后您可以绘制这些字符串间的距离。较大的值表示更不同的字符串。

如果您不想自己实施 Levenshtein 距离计算,请查看这些 关于文件交换的提交。

于 2012-09-15T12:54:40.360 回答