我对 NLC 的工作方式感到困惑。我的期望是,当它被要求对不应该有任何关系或训练数据来学习的文本进行分类时,应该不会返回任何结果或置信度分数非常低的结果。
我已经用一组训练数据训练了一个模型,当我尝试对训练数据之外的文本进行分类时,我得到的结果具有高置信度值(~60%)。
这是我的训练数据的示例:
foo,1,2,3,4
bar,1,2,3,4
baz,1,2,3,4
当我尝试对文本“这不应该存在”进行分类时,我高度相信该文本是“1”。
我的假设是否正确,因为在这种情况下我应该返回值?我是否在训练数据以错误地对 foo、bar 和 baz 进行分类?如果不是,我应该从 NLC 服务中得到什么?