1

我有一个食谱数据库,它本质上是一个成分列表及其相关数量。如果给您一个食谱,您将如何识别允许变化和遗漏的相似食谱?例如,用牛奶代替水,用蜂蜜代替糖,或者完全省略一些东西来调味。

当前的策略是对主要成分的组合进行多次内连接,但是对于大型数据库,这可能会非常慢。还有另一种方法可以做到这一点吗?相当于感知散列的东西是理想的!

4

1 回答 1

0

余弦相似度如何?

这种技术通常在机器学习中用于文本识别,作为一种相似性度量。有了它,您可以计算两个文本之间的距离(实际上是任何两个向量之间),这可以解释为这些文本有多少相似(越接近,越相似)。

看看这个以简单方式解释余弦相似度的好问题。通常,您可以使用任何相似性度量来获取距离来比较您的食谱。本文讨论了不同的相似性度量,如果您想了解更多信息,可以查看。

于 2017-06-16T18:23:11.897 回答