1

使用 Watson 的 NLC API 时,是否可以为课程使用量表?例如,1-5 分或是/否/可能分类?

我的训练数据由一系列新闻标题组成。对于每一个,我都有一个不有趣、有点有趣和非常有趣的“类”。我想根据读者过去发现的有趣内容来预测它是否是读者感兴趣的标题。因为它感觉更像是一个预测 1 到 3 之间数字的回归模型,所以我想知道分类器是否能在这个应用程序中正常工作。想法?

4

1 回答 1

2

是的,您可以使用 1-5 评级(使用 5 个类别),它是否有效,很难说,因为这取决于您的数据 :-)

但这是一种完全有效的方法。

NLC 将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的本体计算一些语义距离,并尝试根据每个样本文本的概念创建一个分类器。

因此,如果在您的文本示例中,每个集群之间存在内在语义差异,则使用 5 个类别将起作用,因此分类器可以正确收集相关内容并区分不同内容。

在这个秘籍中使用了相同的逻辑,使用 Watson Image 分类器而不是 NLC,但逻辑是相同的。

于 2016-06-17T11:56:49.367 回答