我最近一直在更新我的算法知识,并一直在阅读后缀数组。我读过的每个文本都将它们定义为单个搜索字符串上的后缀数组,但有些文章提到它“微不足道”以概括为整个搜索字符串列表,但我不知道如何。
假设我正在尝试对单词列表进行简单的子字符串搜索,并希望返回与给定子字符串匹配的单词列表。天真的方法似乎是在我的列表中的单词之间插入词典结束字符“$”,将它们连接在一起,并从结果中生成一个后缀树。但这似乎会产生大量不相关的条目。如果我创建一个“banana$muffin”的源字符串,那么我最终会为“ana$muffin”生成我永远不会使用的后缀。
我将不胜感激有关如何正确执行此操作的任何提示,或者更好的是,指向一些处理这种情况的算法文本的指针。