algorithm - 如何对齐长文本？

翻译自：https://stackoverflow.com/questions/48479308 2018-01-27T18:48:22.337

462 次

我想将一对长文本与每个约 20M 字符对齐。

我过去使用过 Smith-Waterman 算法，但是（根据我的有限理解）它需要创建一个具有文本大小的二维数组（20M x 20M 数组）——这是不切实际的。

所以我正在寻找一种算法来对齐一对长文本，以保持实际的内存大小和执行时间。

更新

我也尝试过使用此实现的 Myers 和 Miller：https ://www.codeproject.com/Articles/42279/Investigating-Myers-diff-algorithm-Part-of 但我仍然在“不太大”时出现内存不足异常" 文本 (1MB)。

0 回答 0