4

我需要确定一个未知的 5 或 6 个字母字符串是否是有效单词,即是否在字典中。我可以将字符串/单词提交到在线词典,但我需要检查这个字符串/单词,每次都会不同,大约 100 到 150 次。这似乎有点费时。

我的下一个想法是尝试获得我自己的字典程序。它需要使用 Java,因为我的程序是用 Java 编写的。Java API 是否已经有一个用于执行此操作的类?我可以得到一个已经有人编码的血统,而我所要做的就是向它提交字符串/单词吗?

我的程序没有用于拼写检查。我想写一个程序,当我遇到一个乱字时,可以解开乱字谜题。感谢您的建议。

4

7 回答 7

1

您可以使用其中一个开源词典并将其加载到数据库中: ftp: //ftp.cerias.purdue.edu/pub/dict/ftp://ftp.ox.ac.uk/pub/wordlists/

于 2010-01-09T02:11:53.030 回答
1

对于乱码,您可能需要查看Jumble 算法这里可以看到其实现。

于 2010-01-09T02:28:46.260 回答
1

如果您不需要拼写检查,这将非常容易。只需将所有单词加载到 HashSet 中,然后检查该集合是否包含您要测试的单词。有大量可用的单词列表

如果您确实需要拼写检查器,请查看 aspell 或其他免费 API。

于 2010-01-09T05:18:00.140 回答
0

aspell及其相关的单词列表和字典可能是答案。

于 2010-01-09T02:12:15.267 回答
0

我认为aspell有一个 Java 版本。

编辑:实际上看起来你可能会用这个名为Jazzy的 aspell 衍生产品做得更好。

于 2010-01-09T02:12:19.387 回答
0

也许你可以查看一些单词表: http ://wordlist.sourceforge.net/

这个页面有一些文本格式的单词列表,所以你可以自己用 Java 处理,最容易使用 HashSet。如果效率很重要,您需要使用更高效的数据结构。

于 2010-01-09T02:15:42.780 回答
0

也许你可以试试Peter Norvig 的拼写检查器。我认为这是获得 80-90% 准确率的优雅方式。

于 2010-01-09T04:23:31.860 回答