问题标签 [elki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
761 浏览

dbscan - 如何将 ELKI 用于带有预先计算的距离矩阵的 DBSCAN

我为数据库中的所有点预先计算了距离矩阵。我正在尝试使用以下命令调用 ELKI gui:

但我不断收到以下错误消息:

参数格式错误!参数“dbscan.epsilon”需要距离值,但距离没有设置!

我无法弄清楚我在这里做错了什么......

0 投票
2 回答
550 浏览

java - 关于 ELKI 的非常基本的事情

事实上,它似乎很基础,但谷歌没有给我答案。我已经下载ELKI了,这给了我一个.jar文件。

现在我该把存档放在哪里/我该怎么做才能在我的代码中使用 ELKI 函数?

我知道这必须是非常基本的......但谷歌并没有帮助我,因为每个人似乎都已经知道了。

0 投票
1 回答
732 浏览

machine-learning - ELKI 可以处理多大的数据集?

我有 100,000 个点要使用 ELKI 中的 OPTICS 算法进行聚类。对于这个点集,我有一个大约 50 亿个条目的上三角距离矩阵。在 ELKI 想要的矩阵格式中,大约需要 100GB 的内存。我想知道 ELKI 是否处理这种数据负载?任何人都可以确认您以前是否做过这项工作?

0 投票
1 回答
301 浏览

machine-learning - 为什么 ELKI 除了距离矩阵还需要 db.in 文件?db.in 文件还应该包含什么?

我尝试按照本教程使用 ELKI 和预先计算的距离进行聚类。

http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances

我使用了以下一组命令行选项:

ELkI 失败并出现配置错误,提示需要 db.in 文件来进行计算。

我的问题是什么是 db.in 文件?为什么除了距离矩阵文件之外还要提供它,因为成对距离矩阵文件完全指定了有关点云的所有信息。(除了成对距离信息,我也无权访问任何其他信息)。

我应该如何处理 db.in?我应该覆盖它,还是指定一些虚拟信息等。请帮助我理解。

谢谢你。

0 投票
2 回答
645 浏览

database - 如何在 ELKI 中使用索引结构?

这些是来自http://elki.dbs.ifi.lmu.de/的引号:

“本质上,我们将抽象距离查询绑定到数据库,然后对这个距离进行最近邻搜索。此时,ELKI 会自动选择最合适的 kNN 查询类。如果存在适合我们距离函数的索引(不是每一个索引都能加速每一个距离!),这里会自动使用。”

“getKNNForDBID 方法可能归结为缓慢的线性扫描,但是当数据库有合适的索引时,会使用索引查询。然后算法可以在 O(nk log n) 甚至 O(nk) 时间内运行。”

问题是:ELKI 选择运行索引查询的依据是什么?

什么是:“当数据库有适当的索引时”,我如何保证?

关于“运行”方法签名的另一个不相关的问题,为什么有 3 个签名而不是只有 1 个?它们之间有什么区别,确定使用哪个签名的标准是什么?

0 投票
1 回答
159 浏览

cluster-analysis - ELKI - 使用清单填充数据库的对象

很抱歉这个幼稚的问题,但我在遵循所有可用的教程时遇到了困难。那么,有没有办法从简单的列表中填充数据库数据库,而不是加载它来读取文件?

基本上我正在寻找的是类似于:

列出对象 = ...

数据库 db = ClassGenericsUtil.parameterizeOrAbort(ArrayDatabase.class, params, objects);

db.initialize();

提前致谢。

0 投票
1 回答
1671 浏览

cluster-analysis - ELKI OPTICSXi - 如何设置 xi?

我正在尝试使用 ELKI 使用 OPTICS 对地理位置数据集进行聚类。我知道要提取集群,我需要使用 OPTICSXi 算法而不是仅计算集群顺序的 OPTICS。

我想知道你是否可以给我更多关于参数xi如何工作的信息。我将此值固定为 0.009,但以随机方式。

0 投票
2 回答
649 浏览

data-mining - OPTICSXi - ELKI ResultWriter

我正在使用 ELKI 以分层方式对使用 OPTICSXi 的地理位置数据集进行聚类。算法执行的结果是一组文件。

文件的内容可能是:

我不明白每个文件中的元素(在示例中有四个元素)是否属于同一个集群或可能属于不同的集群。在后一种情况下,我需要编写一些构建集群的代码(例如查看每个节点的前身),或者我可以在 Elki 中指定一些参数来获取每个集群?

0 投票
2 回答
620 浏览

data-mining - ELKI 工具 - ABOD 的异常值检测结果

我正在尝试使用 ABOD 方法运行 ELKI 进行异常值检测。我看到了各种可视化结果,但没有看到异常值或排名。我该怎么说使用 ELKI 获得前 10 个异常值?

0 投票
1 回答
373 浏览

algorithm - 使用 ELKI MiniGUI 创建空间 KNN 用于属性值的空间异常值检测。

我在使用 ELKI MiniGUI 运行空间异常值检测算法时遇到了困难。许多算法需要数据库中每个对象的 KNN 列表。似乎首先需要从空间坐标数据库创建 KNN 标签列表,不包括属性。然后,我假设空间异常值检测算法与空间 KNN 的外部文件一起在属性数据库上运行。

我的 Java 经验有限,所以我想在命令行中使用 ELKI,并使用 MiniGUI 为每个任务组装代码。但是,使用 MiniGUI,我只能为 1) 三角距离矩阵和 2) KNN 距离顺序创建或具体化外部文件,这似乎包括对象本身作为 KNN 之一。看来我真的需要每个对象及其空间邻居列表的外部文件或缓存数据。也许 KNN 查询、KNN 连接、预先计算的距离或预处理的数据库过滤器会有所帮助,但我真的不知道。

需要哪些步骤来创建和使用为每个对象与其邻居的空间异常值检测属性关系提供 KNN 空间关系所需的文件或缓存数据?我不清楚如何用 MiniGUI 做到这一点,特别是因为看起来需要先创建空间邻域关系,然后才能将其与空间异常值检测算法和属性数据库一起使用。

任何意见是极大的赞赏。

谢谢!