2

我正在尝试解决工厂合并订单中包含的产品的回归问题。

我有合并工厂合并一个订单所花费的总时间。现在问题来了。

当两个不同数量的产品合并在一起时,它们需要一定的时间才能合并。但有时两个不同数量的产品会在一个订单中出现,并且合并工厂正在合并它。

我有工厂为它合并的每个订单所花费的总时间。在合并中心要合并的产品数量可以是 1 到 n 之间的任意值。

如何为我的模型准备训练数据以理解这一点?

产品代码 ProdQ​​ty  

x1 1                

x2 4                

上面的例子用了 143 小时

产品代码 ProdQ​​ty  

x1 1                

x2 4     

x3 7           

上面的例子现在花了 200 个小时。

现在在第一个示例中,合并中心需要 143 个小时,其中有两个不同数量的产品,在第二个示例中,三个产品参与,需要 200 个小时。

我如何准备训练数据,以便我的模型能够理解它并且我可以预测工厂需要多长时间?

我还有很多其他功能,但这是特定于订单的,但我知道如何处理。

4

1 回答 1

4

像这样:

x1 x2 x3 x4 ... xn y
1  4  0  0      0  143
1  4  7  0      0  200

在这里,您的因变量y是每个包放在一起的时间,它是x进入该包的所有 s 数量的函数。您的目标是对单个数量的包装时间进行回归。在您的训练数据的第一行中,x3等等x4值都为零,因为它们没有按照需要 143 小时准备的顺序出现。在第二行中,x4等值x5都为零,因为它们没有按照需要 200 小时准备的顺序出现。

您现在可以y对所有x值进行回归,当有人说“我有 10 x5、 2x3和 7的新顺序时x7,您只需将这三个数字代入估计方程并得出您想要的预测y.

希望能回答您的数据问题。如果您需要对此结构进行任何澄清或修改,请发表评论。


添加:

如果您有影响打包时间的额外变量,您也可以将它们添加为列。假设您想使用温度、收到订单的时间、工人数量以及仓库经理是谁(只是弥补)来预测包装时间。你可以这样做:

x1 x2 x3 x4 ... xn temp orderTime workers manager y
1  4  0  0      0   20  5AM       5       John    143
1  4  7  0      0   30  11AM      3       George  200

当然,其中一些新功能需要虚拟化、分类等;而您的原始x数量只是连续变量。

于 2019-02-24T07:57:25.527 回答