我有大量数据,本质上是大向量,需要相互比较以确定它们之间的关系。向量保存在本地 sqlite 数据库中。
组织流程的最佳方式是什么?
到目前为止,我一直在做的是加载所有向量的键,然后遍历它们的组合,提取数据并比较它们,并在每次比较后将结果保存到数据库中。然而,这个过程需要很长时间。
我认为,更快的方法是批量加载数据,然后并行执行比较。怎么可能做得对?是否有一些关于该主题的论文,其中描述了最佳方法?
我使用 sqlite 数据库、c++ 作为语言和 qt 框架。被比较的数据和比较方法本质上是黑盒子——它们来自外部库。