7

我在 Java 中找到了 2 个库——JWNL 和 JAWS。到目前为止,在我看来,这些 API 很适合查找同义词集和下义词以及类似的东西。你知道是否有一些工具可以使用 wordnet 来检查名词是否是可数/不可数名词?我的意思是,人们会使用 wordnet 来完成这项任务吗?否则,工具是什么?

4

2 回答 2

1

如果找不到简单的来源,可以考虑构建自己的分类器,即。编写自己的用户定义函数。

需要考虑的因素:

  • 有一些英文词典会将名词标记为 (U) vs (C) 来表示不可数和可数,你也许可以在网上找到某个地方。
  • 你可以查看一个巨大的语料库中的二元组,看看这个名词是在可数还是不可数的意义上使用的: one boyor this boyor that boybut some foodor a little bit of foodetc.
  • 您必须考虑许多极端情况:I'd like some coffeevs I'd like a coffee(一杯咖啡的缩写)。它变得复杂。

这个 SO question非常相关,尽管它没有解决您的 Java 请求。这个问题的三个答案都很好。

希望这可以帮助。

于 2012-11-28T22:44:16.073 回答
0

我不是 100% 肯定你想要什么,但WolframAlpha有一个你可以使用的开发者界面。

他们似乎也已经有了一个java 库,尽管免费版本似乎仅限于 2k 个查询(不知道这是否是一个可行的限制)。

于 2011-06-20T20:16:02.097 回答