假设我们有一个相互连接的大型数据库图,实际上是一个巨大的分布式数据库。图上的任何节点都可以通过递归查询其邻居来查询整个数据库,这些邻居从邻居那里获取结果并将组合结果传递回查询路径。
此外,假设如果节点自己的数据库包含“足够好”的结果,则可以停止递归,这样如果附近已经有一个不错的结果,就不必查询整个网络。这使得我要说的内容具有相关性。
每次进行查询时将返回的数据传输到更接近发起查询的节点是否有意义?也就是说,被查询节点查询其邻居并获取 X,查询自身并获取 Y,将 X+Y 传递回查询它的节点,将 X 存储在其数据库中,并从其数据库中删除 Y。这不会最终导致分布式数据库在其节点之间具有相对于查询期间将咨询的平均节点数量的大致最佳数据分布吗?
这种技术有名字吗?