我想将一对长文本与每个约 20M 字符对齐。
我过去使用过 Smith-Waterman 算法,但是(根据我的有限理解)它需要创建一个具有文本大小的二维数组(20M x 20M 数组)——这是不切实际的。
所以我正在寻找一种算法来对齐一对长文本,以保持实际的内存大小和执行时间。
更新
我也尝试过使用此实现的 Myers 和 Miller:https ://www.codeproject.com/Articles/42279/Investigating-Myers-diff-algorithm-Part-of 但我仍然在“不太大”时出现内存不足异常" 文本 (1MB)。