我正在查看文档并测试Google 的自然语言 API,并注意到它得到了一些不正确的人员、事件、组织和位置 - 它似乎使用 Wikipedia 作为主要数据源,所以如果它不在 Wikipedia 中,它似乎难以识别各种单词的类型。此外,如果某些词出现在名称(专有名词)中,它似乎总是将实体标识为某种类型,这并不总是正确的。
例如:“国会”似乎总是被识别为一个组织[政府],即使它是事件名称的一部分。名称“WordCamp”显示为一个位置,但它是一个事件。
有没有办法训练自然语言引擎或提供一组自定义的组织、位置、事件等,以便它为不太受欢迎的实体提供更准确的类型信息?