4

我正在尝试编写一个简单的文本挖掘应用程序来尝试分辨德语单词的性别和复数形式。

所以,首先,我需要一个用于训练的大词汇表。我四处搜索,但找不到任何具有性别或复数形式的列表。

4

2 回答 2

4

您可以使用来自Durm German Lemmatizer 、Morphisto Lexikon德语 ispell 词典的数据。您可以通过查看带有“德国”标签的 me del.ico.us 页面找到其他一些资源

于 2010-12-31T15:16:41.383 回答
1

您可以挖掘英语德语维基词典中的可用数据。您可以在此处此处下载每个的当前数据。

但我警告你,wikitext是一种相当模糊的格式,英语和德语维基词典用户想出了完全不同的方法来为每个项目使用它。

于 2010-12-29T07:52:23.130 回答