我在发布之前搜索了这个,但我找不到对我有帮助的东西。我正在使用java。我有一个 300.000 字的文件(已经按字母顺序排序)。我想将这些单词加载到结构中并搜索我要传递的单词是否存在。我想要最适合字符串搜索的东西。我已经看到过尝试(后缀树)和红黑树(TreeSet - 因为我只想要键,而没有值 - 在 java 中)。
如果您考虑回答,请对您的提议的效率提供一些解释。谢谢你。
编辑 结构将通过加载文件创建,不会再添加单词。不需要区分大小写。我不知道什么是词干。我现在知道了,但我不知道它是否会有所帮助。该文件是一本字典(没有翻译,只有给定语言的单词)。