想知道解决这个特定问题的最佳方法以及是否有任何库(最好是 python,但如果需要我可以灵活)。
我有一个文件,每行都有一个字符串。我想在每行中找到最长的常见模式及其位置。我知道我可以使用 SequenceMatcher 来比较第一行和第二行、第一行和第三行,等等,然后关联结果,但是如果有什么已经做到了呢?
理想情况下,这些匹配会出现在每行的任何位置,但对于初学者来说,我可以接受它们存在于每行的相同偏移处并从那里开始。像压缩库这样具有良好 API 来访问其字符串表的东西可能是理想的,但到目前为止我还没有找到任何符合该描述的东西。
例如这些行:
\x00\x00\x8c\x9e\x28\x28\x62\xf2\x97\x47\x81\x40\x3e\x4b\xa6\x0e\xfe\x8b
\x00\x00\xa8\x23\x2d\x28\x28\x0e\xb3\x47\x81\x40\x3e\x9c\xfa\x0b\x78\xed
\x00\x00\xb5\x30\xed\xe9\xac\x28\x28\x4b\x81\x40\x3e\xe7\xb2\x78\x7d\x3e
我希望看到 0-1 和 10-12 在同一位置的所有行中匹配,并且 line1[4,5] 匹配 line2[5,6] 匹配 line3[7,8]。
谢谢,