我在 Java 中找到了 2 个库——JWNL 和 JAWS。到目前为止,在我看来,这些 API 很适合查找同义词集和下义词以及类似的东西。你知道是否有一些工具可以使用 wordnet 来检查名词是否是可数/不可数名词?我的意思是,人们会使用 wordnet 来完成这项任务吗?否则,工具是什么?
问问题
1398 次
2 回答
1
如果找不到简单的来源,可以考虑构建自己的分类器,即。编写自己的用户定义函数。
需要考虑的因素:
- 有一些英文词典会将名词标记为 (U) vs (C) 来表示不可数和可数,你也许可以在网上找到某个地方。
- 你可以查看一个巨大的语料库中的二元组,看看这个名词是在可数还是不可数的意义上使用的:
one boy
orthis boy
orthat boy
butsome food
ora little bit of food
etc. - 您必须考虑许多极端情况:
I'd like some coffee
vsI'd like a coffee
(一杯咖啡的缩写)。它变得复杂。
这个 SO question非常相关,尽管它没有解决您的 Java 请求。这个问题的三个答案都很好。
希望这可以帮助。
于 2012-11-28T22:44:16.073 回答
0
我不是 100% 肯定你想要什么,但WolframAlpha有一个你可以使用的开发者界面。
他们似乎也已经有了一个java 库,尽管免费版本似乎仅限于 2k 个查询(不知道这是否是一个可行的限制)。
于 2011-06-20T20:16:02.097 回答