我有一个包含许多简历的数据库,包括每个人的性别、年龄、地址、受教育年限和许多其他参数的结构化数据。
对于大约 10% 的样本,我还有一些关于他们在某个时间点采取的特定行动的额外数据。例如,Jane 于 1998 年 7 月获得房屋贷款,或者 John 于 2007 年 1 月开始飞行员培训并于 2007 年 12 月获得执照。
我需要一种算法,该算法将为每个动作提供在未来时间增量中每个人发生的概率。例如,比尔在 2011 年获得住房贷款的机会是 2%,在 2012 年是 3.5%,等等。
我应该如何处理这个?回归分析?支持向量机?神经网络?还有什么?
是否有一些标准工具/库可以仅用于明显的自定义设置?