我有一个具有属性的对象列表,例如颜色、长度、宽度和重要的价格。我最终试图将列表划分为最大的子集,以便每个子集成员具有相同的价格,并且颜色、长度、宽度的每个排列都存在于子集中。
换句话说,我希望能够划分项目集以发现子集,以便可以将每个集合描述为:
- 所有红色、蓝色或绿色且长 10 或 11 英寸以及高 4 英寸的物体都需要 5 美元
- 所有红色或绿色、长 12 英寸、高 4 英寸的物体均为 6 美元
- 一个蓝色 12X4 物体是 6.50 美元
- 等等等等
目标是让子集包含尽可能多的项目。
我一直在努力解决这个问题,我认为答案(或近似值)可能来自聚类技术。然而,我一直很难想出一个距离矩阵来提供我正在寻找的结果。有没有人对如何解决这个问题有任何见解。
更好的解释
给定与上述类似的对象列表,按价格将它们分组为最少数量的完整子集。