我需要一个包含每个英语有效单词的数据库。我检查了/usr/share/dict/words
文件,它包含少于 100k 个单词。维基百科说英语有 475k 单词。我在哪里可以获得完整列表(美式拼写)?
另外,是否有一个网站也提供其他语言的单词,包括亚洲和欧洲语言?
编辑:忘了补充,我不需要名字等,只需要有效的英文单词。
您可以在infochimps.org上找到您需要的内容。
他们有一个包含 350,000 个简单(即非复合)单词的列表,可供免费下载。
关于其他语言,您可能想在维基词典上四处寻找。这是所有数据库备份的链接- 信息不太可能组织,但如果它们有语言,您可以下载 SQL 格式的数据。
我没有看到这里提到的http://wordlist.sourceforge.net/,但是如果我正在寻找这样的东西(当我偶然发现这个问题时),我会从那里开始。
如果你在那里找不到你想要的东西,而你想要的是一个英文单词列表,那么你可能应该花一些额外的时间来描述如何识别你想要的东西。
没有“完整”列表之类的东西。不同的人有不同的衡量方式——例如,它们可能包括俚语、新词、多词短语、冒犯性术语、外来词、动词变位等。有些人甚至数了一百万字!所以你必须决定你想要的单词列表。
您可以查看Mozilla、OpenOffice 和许多其他软件使用的*spell
en-GB 字典。
你没有说你需要这个列表做什么。如果用作密码检查黑名单的东西就足够了,那么cracklib可能对你有好处。它包含超过 150 万字。