0

鉴于我有训练和测试数据,可能缺少逻辑序号。是否可以推断出不存在的值?

例如:训练/测试数据具有为标签指定的值 1、2、3、4、5...7、8、9、10。

是否有可能基于数据模型,即使在训练或测试数据中没有发生这种情况的实例,它也可以预测结果为 6?

我是机器学习的新手,并且已经阅读过监督/非监督学习。很难确定一个明确的答案,因为很难为我不熟悉的领域找到正确的术语。

最好在数据集中创建一个包含不存在的标签值的任意行?

使用 ML.net。

抱歉,如果这是一个简单的问题。

谢谢

4

3 回答 3

0

你的问题是关于确定性与概率性的方法吗?我不明白为什么你应该使用机器学习,但尝试阅读马尔可夫链:

https://en.wikipedia.org/wiki/Markov_chain

于 2018-12-05T15:52:46.200 回答
0

分类问题中,“标签”是“真实类别”的索引。如果训练数据集中没有示例属于“6”类,那么学习模型将永远不会预测 6 类:它被教导永远不会这样做。

回归问题中,“标签”是“要预测的数量”(实数)。在这种情况下,模型预测它在训练时没有看到的值是很正常的:模型可能预测 6、5.7 或 6.1 等。

如果没有更多细节,我无法判断您是在解决分类问题还是回归问题。

于 2018-12-05T18:11:17.543 回答
0

我解决或实际上缓解缺乏价值的方法是执行以下操作。对于需要顺序的每种输入数据类型 - 没有间隙,我只使用我的数据集中的数据/行,其中有一个完整的序列,跨越所有条目。

给定以下内容:0,1,2,3,4,5,6,7,9

我只使用符合所有条目中最大可用序列的数据。0 - 7。这可能会导致训练模型的一些数据丢失,但由于数据相当一致,因此很少有遗漏。

于 2019-05-27T18:32:53.327 回答