我需要包含所有可用语言的单词表的文件。我搜索了一下,发现ftp.gnu.org主机aspell
目录包含很多字典,但是当我提取它们时,我没有找到任何包含单词数据的原始文件。我需要它来生成 n-gram 并可能识别特定文本中的语言。
问问题
244 次
2 回答
1
文件/usr/share/dict/british-english包含在wbritish包中,它又是来自Kevin 单词列表页面的Ispell 英语单词列表,其他词典也可供下载。
于 2012-05-25T07:19:38.167 回答
1
我发现这个https://skydrive.live.com/?cid=3732e80b128d016f&resid=3732E80B128D016F!3584&id=3732E80B128D016F%213584这正是我想要的。
于 2012-05-25T15:12:18.237 回答