0

我需要包含所有可用语言的单词表的文件。我搜索了一下,发现ftp.gnu.org主机aspell目录包含很多字典,但是当我提取它们时,我没有找到任何包含单词数据的原始文件。我需要它来生成 n-gram 并可能识别特定文本中的语言。

4

2 回答 2

1

文件/usr/share/dict/british-english包含在wbritish包中,它又是来自Kevin 单词列表页面的Ispell 英语单词列表,其他词典也可供下载。

于 2012-05-25T07:19:38.167 回答
1

我发现这个https://skydrive.live.com/?cid=3732e80b128d016f&resid=3732E80B128D016F!3584&id=3732E80B128D016F%213584这正是我想要的。

于 2012-05-25T15:12:18.237 回答