我正在与大量数据进行字符串匹配。
编辑:我正在将一个大列表中包含的单词与一些本体文本文件进行匹配。我从本体中获取每个文件,并在每个文件行的第三个字符串与列表中的任何单词之间搜索匹配项。
我在监督我需要做的不是纯匹配(结果很差)这一事实时犯了一个错误,但我需要一些更松散的匹配函数,当字符串包含在另一个字符串中时它也会返回结果。
我用Radix Trie做到了这一点;它非常快并且效果很好,但现在我想我的工作没用,因为 trie 只返回完全匹配。:/
- 执行此操作的算法类型是字符串搜索算法吗?
- 有人可以推荐一些他有经验的Java实现吗?
该算法应该很快,但不是最优先考虑的,会兼顾速度和复杂性。
我非常感谢所有建议/示例/解释/链接!
谢谢!