我如何训练说泰米尔语名称(泰米尔族)作为 Google NLP 中的人的一部分
像这样的名字
帕扎尼维尔
库赞泰维尔
在您的描述中,您展示了自然语言 API 的演示运行。该演示在其后端有一个自然语言模型,该模型使用大量标记数据进行了训练,您正在选择一个实体提取任务。
要使用自然语言 API 执行实体任务,您有两个选项,如果您在 [1] 中向下滚动一点,您可以看到:实体分析和自定义实体提取。
第一个选项是您在演示中看到的,它采用实体分析模型并使用输入文本执行任务。模型学习到的标签无法更改,因此无法识别 Pazhanivel 和 Kuzhanthaivel 的名字。
第二个选项是您正在寻找的,自定义实体提取。要使用它进行培训,您可以查看快速入门 [2]。这意味着训练自定义实体识别模型不是一项简单的任务,但是使用 Google Cloud Platform,您可以仅使用 UI 启动模型训练,因此它变得易于管理。此外,在 Google Cloud 文档中,您还对准备数据 [3]、训练模型 [4] 等的所有步骤进行了解释。
如果您有任何问题,请不要犹豫。
[1] https://cloud.google.com/natural-language/#section-5
[2] https://cloud.google.com/natural-language/automl/docs/quickstart
[3] https://cloud.google.com/natural-language/automl/docs/prepare?_ga=2.66840366.-1201206137.1584215642
[4] https://cloud.google.com/natural-language/automl/docs/models