Google Cloud Natural Language API 可用于分析文本并返回一个句法分析树,其中每个单词都标有词性标签。
如果名词是复数,有没有办法判断?
如果 Google Cloud NL 能够解决引理,那么信息可能存在但未通过 API 返回?
Google Cloud Natural Language API 可用于分析文本并返回一个句法分析树,其中每个单词都标有词性标签。
如果名词是复数,有没有办法判断?
如果 Google Cloud NL 能够解决引理,那么信息可能存在但未通过 API 返回?
更新
随着 NL API 的 GA 发布,annotateText
端点现在number
为每个标记返回一个密钥,指示单词是单数、复数还是双数。对于“这里有一些猫”这句话,API 返回“猫”的以下标记数据(注意number
是PLURAL
):
{
"text": {
"content": "cats",
"beginOffset": -1
},
"partOfSpeech": {
"tag": "NOUN",
"aspect": "ASPECT_UNKNOWN",
"case": "CASE_UNKNOWN",
"form": "FORM_UNKNOWN",
"gender": "GENDER_UNKNOWN",
"mood": "MOOD_UNKNOWN",
"number": "PLURAL",
"person": "PERSON_UNKNOWN",
"proper": "PROPER_UNKNOWN",
"reciprocity": "RECIPROCITY_UNKNOWN",
"tense": "TENSE_UNKNOWN",
"voice": "VOICE_UNKNOWN"
},
"dependencyEdge": {
"headTokenIndex": 1,
"label": "DOBJ"
},
"lemma": "cat"
}
请参阅此处的完整文档。
感谢您试用 NL API。
现在没有一种干净的方法来检测复数,除了注意基本词与引理不同并猜测它是否是复数(在英语中,它可能以 -s 结尾)。
但是,我们计划发布一种更好的检测形态信息(如复数)的方法,敬请期待。