0

浏览一些关于协同过滤的教程,我发现它主要用于电影和书籍推荐,以及包含用户和他们评价的项目的数据集。当然,每个项目的评分范围是相同的(例如 1-10)。但是,如果我有一个具有不同范围的数据集怎么办。这意味着一个完全不同的数据集,它与人们如何评价一个项目无关,而是基于人们的医疗记录。我正在考虑将记录中的特征(如 BMI、体重、身高等)用作项目用户作为拥有该记录的人。基本上在过程结束时,我想根据已经有预定输出的其他记录来确定一个人是否患有疾病。我知道这通常/可以在神经网络中轻松完成。但我真的很想知道这在协作过滤中是否也是可能的。或者不是吗?

4

1 回答 1

3

不是推荐问题,这是经典分类,仅此而已。神经网络只是几十种可能的方法之一,但再一次 - 它不是协同过滤,它正是分类的定义方式。在协同过滤中,你不知道正确的答案(标签/输出)——你只是试图找到一些共同的模式。在疾病检测/预测的情况下,您确切知道应该是什么输出。

如果您有非常广泛的可能的相关疾病,并且患有该疾病的人数非常少(因此实际上不可能为这些疾病建立训练集),则可以在这里使用推荐系统。那么这种寻找潜在健康问题的“建议”将是有意义的。在标记的二进制输出数据的情况下,它只是一个分类。尽管如此,您最终可能会得到模型:“如果您患有肥胖症,那么您可能会心脏病发作”等。因此找到相似诊断之间的相关性。

于 2013-09-11T10:26:53.337 回答