0

根据以下数据,我尝试使用gradeint 下降来预测哪些标签将与新用户相关联。请注意,这些数字仅用于说明目的,实际上这些数字对应于单词。

username tags  title    group

user1    1     Senior   group1 
user2    2     Senior   group2 
user3    3,4,5 Junior   group2
user4    2,8   Dev      group1

因此,如果添加了一个新用户:“user5”并且我知道该用户的标题和组,我可以在“r”中使用梯度下降来预测用户可能需要哪些标签?

4

1 回答 1

4

梯度下降是一种学习回归模型的方法(例如),而不是一种进行预测的方法。也就是说,给定一组训练数据,您可以使用梯度下降和损失函数来确定回归模型的系数。

在您的特定情况下,在我看来,回归模型似乎不是最合适的模型。我假设标签的数字是 ID,作为数字没有实际意义。也就是说,标签 1 和 2 彼此相邻并且 1 和 3 彼此分开这一事实并不意味着什么。

相反,我会查看分类模型,例如决策树。如果您刚刚开始使用机器学习,我建议您看看Weka,它有许多不同的机器学习算法和相对易于使用的用户界面。您可以使用它来快速探索不同的算法和模型如何处理您的数据。

于 2013-04-27T11:52:40.537 回答