0

我有一个函数,它接受两个字符串并给出显示两个文本之间关系的余弦相似度值。

如果我想比较 75 个文本,我需要进行 5,625 次单次比较才能将所有文本相互比较。

有没有办法减少这种比较次数?例如稀疏矩阵或 k-means?

我不想谈论我的功能或比较文本的方法。只是减少比较的次数。

4

2 回答 2

1

如果您的算法是成对的,那么根据定义,您可能无法减少比较次数。

您需要使用不同的算法,或者如果您想减少比较次数,至少要预处理您的输入。

没有您的功能的详细信息,很难提供任何具体的帮助。

于 2009-09-21T19:31:50.313 回答
1

Ben 说的是真的,要获得更好的帮助,您需要告诉我们目标是什么。

例如,如果您想查找相似的字符串,一种可能的优化是将字符串向量存储在空间数据结构(例如四叉树)中,您可以直接丢弃彼此相距太远的向量,从而避免多次比较。

于 2009-09-21T19:42:42.087 回答