1

Google Cloud Natural Language API 可用于分析文本并返回一个句法分析树,其中每个单词都标有词性标签。

如果名词是复数,有没有办法判断?

如果 Google Cloud NL 能够解决引理,那么信息可能存在但未通过 API 返回?

4

2 回答 2

3

更新

随着 NL API 的 GA 发布,annotateText端点现在number为每个标记返回一个密钥,指示单词是单数、复数还是双数。对于“这里有一些猫”这句话,API 返回“猫”的以下标记数据(注意numberPLURAL):

{
      "text": {
        "content": "cats",
        "beginOffset": -1
      },
      "partOfSpeech": {
        "tag": "NOUN",
        "aspect": "ASPECT_UNKNOWN",
        "case": "CASE_UNKNOWN",
        "form": "FORM_UNKNOWN",
        "gender": "GENDER_UNKNOWN",
        "mood": "MOOD_UNKNOWN",
        "number": "PLURAL",
        "person": "PERSON_UNKNOWN",
        "proper": "PROPER_UNKNOWN",
        "reciprocity": "RECIPROCITY_UNKNOWN",
        "tense": "TENSE_UNKNOWN",
        "voice": "VOICE_UNKNOWN"
      },
      "dependencyEdge": {
        "headTokenIndex": 1,
        "label": "DOBJ"
      },
      "lemma": "cat"
}

请参阅此处的完整文档。

于 2016-11-17T18:49:39.557 回答
1

感谢您试用 NL API。

现在没有一种干净的方法来检测复数,除了注意基本词与引理不同并猜测它是否是复数(在英语中,它可能以 -s 结尾)。

但是,我们计划发布一种更好的检测形态信息(如复数)的方法,敬请期待。

于 2016-08-15T20:16:04.873 回答