我希望将一些非常低维(2 或 3)的数据聚集成少量的集群(< 25)。我拥有的实例数量非常大(大约 100M+ )。我可以从数据库中流式传输这些数据(并可能在每次传递时重新流式传输)——但要避免将整个集合放入内存。[如果我必须把它带入内存,我希望它尽可能地提高内存效率]
我正在寻找满足这些要求的算法(最好是 Javascript 实现)。
谢谢!
我希望将一些非常低维(2 或 3)的数据聚集成少量的集群(< 25)。我拥有的实例数量非常大(大约 100M+ )。我可以从数据库中流式传输这些数据(并可能在每次传递时重新流式传输)——但要避免将整个集合放入内存。[如果我必须把它带入内存,我希望它尽可能地提高内存效率]
我正在寻找满足这些要求的算法(最好是 Javascript 实现)。
谢谢!