1

我在将数据正确输入 ELKI 以通过光学算法运行时遇到了一些麻烦,但是使用光学的 R 实现,我可以轻松获得可达距离列表。我可以将它们写入这样的文件。(指数,距离)

1 婴儿

2 0.5

3 0.9 ...

我想找到由局部最小值分隔的集群。我认为 ELKI 软件中的 Optics Xi 算法可以做到这一点,但由于我在导入数据时遇到问题,我无法使用它。

使用光学论文中的伪代码以另一种语言编写光学集群提取算法会更容易吗?我认为最基本的是,当它们彼此相邻时,它只是将索引聚集在一起,并且不会减少到新的局部最小值。

谢谢

4

1 回答 1

2

您可以尝试实现该接口OPTICSTypeAlgorithm,这在很大程度上意味着读取您的数据并将其存储在一个类型的对象中ClusterOrder

但是,ELKI 包含一个稍微高级的 OPTICS 版本,它将通过 OPTICSXi 产生更好的结果。详细信息最终将作为技术报告左右发布。您从 R 实现中获得的数据不足以纠正 OPTICS 图中的一些常见伪影。

请在 ELKI 中使用 OPTICS 版本。试试 Cover 树索引(它非常快速且易于使用)。避免在输入数据中使用 ID 列,或者告诉解析器哪一列是 ID 列。

于 2016-01-05T12:24:07.900 回答