我是 ELKI 的新手,我已经成功地调整了我想运行的算法。我在 3K 坐标上使用它,而且速度非常快 - 所以现在我试图扩大到大约 1 MM 记录。现在我正在运行 30K,但已经有几个小时了,它仍在运行。
有什么办法可以提高性能吗?我注意到 java.exe *32 仅使用 ~13% CPU 和 150KB 内存(机器是 2.8 GHz i7 和 32 GB RAM)
我根据其他人先前的建议使用了 pagesize 1024,仅使用 2 维(经度/纬度)
直接从 Windows 命令行运行:
java -jar <path> cli
-algorithm clustering.optics.OPTICSXi
-opticsxi.xi 0.006
-optics.minpts 5
-dbc.in <path>
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-pagefile.pagesize 1024
-spatial.bulkstrategy SortTileRecursiveBulkSplit
-algorithm.distancefunction geo.LngLatDistanceFunction
-geo.model WGS84SpheroidEarthModel
-opticsxi.algorithm OPTICSHeap
-resulthandler ResultWriter
-out <path>