我的项目如下所示:我的数据集是一堆人的资料,具有各种属性,例如 boolean hasJob 和 int healthScore,以及他们的收入。使用这些数据,我试图预测他们未来的收入。每个配置文件也有一个历史:例如,他们过去的属性和收入。
所以本质上我正在尝试将多组(x booleans,y numbers)映射到一个数字(来年的薪水)。
我考虑过神经网络、贝叶斯网络和用于函数拟合的遗传算法。有什么建议或意见吗?
提前致谢!——艾米丽
我的项目如下所示:我的数据集是一堆人的资料,具有各种属性,例如 boolean hasJob 和 int healthScore,以及他们的收入。使用这些数据,我试图预测他们未来的收入。每个配置文件也有一个历史:例如,他们过去的属性和收入。
所以本质上我正在尝试将多组(x booleans,y numbers)映射到一个数字(来年的薪水)。
我考虑过神经网络、贝叶斯网络和用于函数拟合的遗传算法。有什么建议或意见吗?
提前致谢!——艾米丽
您要做的就是所谓的“时间序列建模”。但是,每个系列(每人)可能只有很少的数据。我认为很难找到适合每个人的模型,因为您会做出一些一般性假设,例如每个人都同样以职业为导向。这也是一个如此嘈杂的目标,例如,您可能必须考虑某人是否是甜言蜜语者。你如何衡量这样的事情?我很确定您当前的属性有足够的噪音,很难预测任何事情。当您说健康状况时,您是指身体健康还是心理健康。在不同的业务中,不同的事情很重要。他们从事的业务或行业呢?它的健康和增长潜力?我认为这会极大地影响他们的收入。我还认为您有因变量以及属性可能(并且可能)受目标变量的影响。例如。收入较高的人健康状况较好。这听起来是一件非常复杂和困难的事情,绝对没有什么“我天真地对我的数据进行分组并尝试了一堆方法”会给出有意义的结果。我建议更多地了解时间序列建模,尤其是你所拥有的数据。也许可以尝试从最初的属性对人进行聚类,看看他们是如何发展的。有没有与这种发展相关的变量?
你的研究问题是什么?