假设我们有一家香水店,里面有 100 种不同的香水。
假设有 10,000 名顾客以每款香水一到五颗星的价格出现。
假设问题是:“如何最好地构建一包 5 种香水,以便 95% 的客户至少对其中一种给予 4 星以上的评价”
如何在算法上做到这一点?
注意:我可以看到即使问题没有正确形成;不能保证这样的结构甚至存在。在 2 个参数之间进行权衡。
注意:另外,(这使得香水类比变得有点人为),我们得到一个好的匹配还是三个好的匹配并不重要。所以 {4.3, 0, 0, 0, 0} 将等价于 {4.3, 4.2, 4.2, 4.2, 4.2} - 在这两种情况下,分数都是 4.3。
假设为了论证的目的,香水 0-19 是甜的,香水 20-39 是酸的,等等(sim. salt, 苦味,unami)
所以0-19之间会有非常高的互相关。
如果你用 100 个空间点来建模,那么 0-19 都会非常强烈地相互吸引,它们会形成一个集群。
同样,对于其他四种口味,您将获得 4 个其他集群。
因此,仅从一个指标中,我们就分离出了 5 种不同的口味。
但是这种技术会扩展吗?
π
PS 只是给出相关技术的名称会非常有帮助,因为这可以让我在谷歌上获取更多信息。因此,任何仅在行业接受的术语中重申问题的答案都会很有用!