基本上我得到了这两个带有文本的行数组。
我想比较这两个数组并突出显示差异。这些数组相当大,因为我有一些巨大的文本文件。
欢迎任何有关解决此问题的帮助。
问候
基本上我得到了这两个带有文本的行数组。
我想比较这两个数组并突出显示差异。这些数组相当大,因为我有一些巨大的文本文件。
欢迎任何有关解决此问题的帮助。
问候
您可以在用于进行基因组序列比对的算法上使用某种变体。本质上,您正在寻找两个字符串中的差异,将它们存储在一个地方作为 diff 1、diff 2 等等?
http://www.codeproject.com/Articles/304772/DNA-Sequence-Alignment-using-Dynamic-Programming-A
我希望我没有猜错你的要求。:)
这是一个相当难解决的问题,被称为“最长公共子序列问题”。我可以尝试描述它以及解决方案,但我只会将你指向维基百科,因为我只是看了这篇文章并且有人做得非常好。
http://en.wikipedia.org/wiki/Longest_common_subsequence_problem