0

我已遵循文档并为我的目录创建了训练数据。

https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/retrieve-rank/training_data.shtml

在我的训练数据中,对于与我的答案无关的记录,我给了它们一个零值。根据该文档,“0”的相关性标签被预定义为指示答案不相关。

训练数据已成功完成,我有 ranker_id。现在,当我使用 fcselect 和 ranker_id 运行查询时,我发现查询中最上面的结果是我标记为“0”表示不相关的结果。

该文档显示有 10 的高分,如下所示:

<float name="score">10.0</float> 
<str name="featureVector">0.11107889 0.046247214 0.0 0.046247214 0.0 0.0 0.0 0.0 0.096357614 0.04101021 0.0 0.04101021 0.0 0.0 0.0 0.0 0.6666667 0 0.6931471805599453 10.0</str>

我正在寻找关于理解这个分数与我们在训练数据中提供的相关性的洞察力。我如何改进训练数据/相关性,以便我看到预期的结果。

4

0 回答 0