我想知道是否有一种简单的方法可以检测两个字符串中的“短语”而不用引号引起来。例如:
“我喜欢盒子里的杰克”和“盒子里的杰克有很好的食物”
在这种情况下,将检测到“盒子里的插孔”。现在我可能会遍历整个第一个字符串,看看它是否在第二个字符串中,它不是......并继续减少到更小的长度并通过第二个字符串运行它,直到我找到 3-word-match “盒子里的杰克”……但效率不高。
任何帮助都会很棒 - 谢谢!
我想知道是否有一种简单的方法可以检测两个字符串中的“短语”而不用引号引起来。例如:
“我喜欢盒子里的杰克”和“盒子里的杰克有很好的食物”
在这种情况下,将检测到“盒子里的插孔”。现在我可能会遍历整个第一个字符串,看看它是否在第二个字符串中,它不是......并继续减少到更小的长度并通过第二个字符串运行它,直到我找到 3-word-match “盒子里的杰克”……但效率不高。
任何帮助都会很棒 - 谢谢!
您指的是最长公共子序列问题。这用作字符串比较的基础。
有很多关于这个问题的问题: https ://stackoverflow.com/search?q=longest+common+subsequence
该算法实现起来并不难。维基百科有伪代码,您可以将其用作起点。