-1

我有一组过去 5 年的数据。大约 7000 行数据,其特征为二进制 {yes/no} 或多分类 {product A, B, C} 总共约 20 多个特征。

我正在尝试制作一个程序(或一次分析项目)来根据此历史数据确定(预测)产品发货日期(发货延迟天数)。我有两列表示产品计划何时发货,另一列表示实际发货时间!目前。

我想知道如何制作一个预测程序,根据历史数据确定产品的新数据输入何时预计发货。我不在乎得到一个具体的日期,甚至只是一个可以告诉我要添加的延迟天数的程序...

不久前我参加了 ML 课程,但我不知道如何开始这样的事情。有什么建议吗?再加上我能想到的最接近的事情是使用 NN 的图像识别任务。但这太容易了,我必须处理日期而不是像素白色/黑色......我以前使用过 Matlab(我仍然知道如何使用它)但我刚刚下载了 Weka 数据挖掘工具。

我正在考虑一个神经网络,但我不确定如何设置它以让我的程序从输入的发货日期给我一个预期的延迟时间(天数/月数)。

基本上,

我想输入(尺寸 = 5,产品 = A,....,预计发货日期 = 1 月 1 日)

考虑到历史趋势,程序返回天数作为延迟添加到我的预期发货日期......

对于如何以正确/最简单/最好的方式开始这样的事情,我们将不胜感激......在此先感谢。

4

1 回答 1

0

如果您使用 weka,则将您的输入/标签数据转换为arff格式,然后尝试所有不同的回归量(这毕竟是一个回归问题)。为了避免做太多的编程(如果您只是处于探索阶段),请使用weka Experimenter,它有一个 GUI 可以在您的数据集上尝试一大堆回归量。

然后,当您找到一个可以做一些预期的事情并且您想使用 MATLAB 进行更多数据分析时,您可以使用weka/matlab 接口

于 2012-05-23T17:59:59.117 回答