我正在阅读一个词干,这是将单词匹配到一个共同的根的问题,并且似乎是搜索引擎中的一个标准问题。
当我第一次想到这个问题时,我认为这是最长公共子串问题应用于N
单词的经典应用。
例如,对于单词来说{computation, compute, computers}
,最长的公共子串是compute
,这是词干/词根。
但我读到这不是问题的解决方案。实际上,这似乎甚至不是一个考虑因素,其他方法(后缀去除、随机等)是标准解决方案。
我的问题是:为什么最长的公共子字符串N
不能解决这个问题?