0

我希望这样的问题属于这里。所以这就是我现在正在处理的问题:我从制造过程中收集了一些数据(传感器数据、过程参数等),对于离开生产线的每个零件,我都知道它是否是废品。所以对于每个部分,我都有它的过程数据和质量(0:好 1:坏)

我的目标是优化制造工艺,即找到最佳工艺参数以产生最少的废料。

到目前为止我所做的:我尝试了不同的分类算法(随机森林、SVM、神经网络),但没有一个能够达到很好的准确性。我认为原因是数据非常模糊,即如果我有具有相同工艺参数的零件,其中一些可能是废品,而另一些可能是好的。但质量和工艺参数之间肯定存在联系。我现在想要的是预测零件好坏的“概率”。我想估计概率密度?我可以对 K 最近的邻居执行此操作吗?

4

1 回答 1

0

您可以尝试的一个步骤是对每个参数进行估计,其中 x 是参数值,是好/坏指示变量。

有可能不遵守任何特定的分布,并且不知道他们所采用的价值观类型对我来说很难提出建议。

“无模型”方法是,给定一组 n 个观测值,“离散化”参数 x,使得

然后你可以通过估计 pmf

对于“坏”的情况也是如此。

获得每个参数之后,您可以计算该参数的“好”和“坏”情况之间的相对熵/KL 散度。两个类之间差异较大的参数是最重要的参数,它们的 pmfs 有望向您显示哪些值表示性能不佳。

这当然是假设参数 iid,实际上它们可能不是,但是可以通过考虑不独立的共同参数并相应地离散化来执行类似的过程。

于 2017-02-02T17:10:16.813 回答