问题标签 [elki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
313 浏览

cluster-analysis - Unable to use precomputed distances with Elki

I am trying to use precomputed distances with Elki, but for some reason cannot get it working. I have read the instructions here: http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances and this question on SO: ELKI - input distance matrix.

Unfortunately I am still unable to get ELKI working.

This is the command I am running in a bash shell:

And these are the contents of the files in the parameters:

I tried with a lower-triangular distance matrix too:

but no luck with that either. I keep getting this error (truncated - but let me know if you need the full error msg):

The following parameters were not processed: [external.FileBasedDoubleDistanceFunction, -distance.matrix, elki_sample_dist_ut.txt] Task is not completely configured:

Wrong value of parameter algorithm.distancefunction. Read: de.lmu.ifi.dbs.elki.distance.distancefunction.external.FileBasedDoubleDistanceFunction. Expected: Distance function to determine the distance between database objects. Implementing de.lmu.ifi.dbs.elki.distance.distancefunction.PrimitiveDistanceFunction Known classes (default package de.lmu.ifi.dbs.elki.distance.distancefunction):

I am using OpenJDK Runtime Environment (IcedTea 2.4.7) (7u55-2.4.7-1ubuntu1) and Elki 0.6.0.

Can someone please point out what I am missing here? Thanks in advance!

0 投票
1 回答
70 浏览

elki - 在 ELKI 中运行 OPTICS 的数据属性

我一直在尝试对我的数据运行“OPTICS”算法,我的数据有大约 40000 条记录,每条记录都有 3 个属性 + 加上每条记录的 ID。有趣的是,当我仅在 3 个属性上运行“OPTICS”时,ELKI 给了我一个关于“stackoverflow”的错误,但是当我运行它时,包括 4 个属性,它运行时没有任何问题。我的数据有问题吗? !

0 投票
1 回答
1061 浏览

java - ELKI 中非常简单的 K-means 聚类示例

我目前正在尝试使用 elki 库提供的 KMeans Clustering 功能。

这就是我想出的:

埃尔基给我:

de.lmu.ifi.dbs.elki.data.type.NoSupportedDataTypeException:找不到满足要求的数据类型:NumberVector,field AND NumberVector 可用类型:在 de.lmu.ifi.dbs.elki.database.AbstractDatabase.getRelation(未知来源)在 de.lmu.ifi.dbs.elki.algorithm.AbstractAlgorithm.run(未知来源)

0 投票
1 回答
927 浏览

algorithm - Outlier dectection Using ELKI

I am use ELKI data mining software for outlier detection. It have many outliers detection techniques but all provides same results(same outliers with all techniques the only difference is in the size of the circle around the points as shown in figures below). I uses the mouse head dataset provided on the ELKI website. In data-set all the points are labeled with its respective cluster name, whether its is from ear_left or ear_right or head or noise. If i change the label of noise to the ear_right, it then shows that outlier point as ear_right. i have change 5 out of 10 noise label to ear_right.

here is the result of using KNN and LDOF outlier detection technique with modified data-set and in ELKI:

enter image description here

Is it a problem with the software or i am doing something wrong? have anyone tried it using for outlier detection? Is there any good software which can perform outlier detection using different algorithms like LOF, LDOF , KNN or where i could find algorithm source code for these techniques?

0 投票
1 回答
367 浏览

machine-learning - 使用 ELKI MiniGUI 进行带有训练集和测试集的异常检测

我有:

  1. training.arff仅包含具有正常行为的样本的文件。

  2. test.arff包含具有正常和异常行为的样本的文件。

我想使用 ELKI MiniGUI 使用半监督学习进行异常检测。

我相信通常我应该使用构建/训练模型training.arff,然后将模型应用到test.arff.

我使用哪种算法并不重要。

我似乎无法找到将这两个文件放在 ELKI MiniGUI 中的位置,所以我会得到我想要的结果。(只有一个dbc.in

*PS:尝试使用 weka 一周后我放弃了,但我不仅限于 ELKI。

谢谢!!

0 投票
0 回答
77 浏览

algorithm - 使用 ELKI 库的 Tamura 距离测量

我正在使用 ELKI 库来执行特征之间的一些距离测量。

在其他功能中,我计划实现 Tamura 功能。根据我所做的研究,该算法返回一个表示三个“不相关”特征的向量。(第 1 元素:粗糙度,第 2 元素:对比度,第 3-18 元素:方向)。两个 tamura 特征向量之间的距离应该作为一个整体来测量,还是单独测量这三个特征之间的距离更好(可能使用不同的距离函数)?

此外,我读到 Chisqaure 和二次型距离是测量直方图之间距离的好算法,因为它们利用跨箱的信息来检索更多感知上理想的结果。但是,我仍然不确定这些算法是否足以测量 Tamura 特征的方向性直方图部分。有人可以为这种情况建议一个好的距离函数吗?

谢谢!

0 投票
1 回答
80 浏览

data-mining - ResultWriter 中的前 n 个异常值

我正在处理高维和大型数据集,所以我需要从ResultWriter. elki 中有一些选项可以从这个输出中获取前 N 个异常值?

0 投票
1 回答
361 浏览

sparse-matrix - 如何使用 ELKI 处理稀疏数据?

我正在尝试使用稀疏矩阵作为 ELKI SOD 算法中的输入数据来检测异常值。我在 howto 和 faqs 页面中寻找关于稀疏数据的帮助,所以我尝试像这样使用 SparseNumberVectorLabelParser 和 SparseVectorFieldFilter:

但我有这个运行时异常:

这是在 java 代码中使用 SparseNumberVectorLabelParser 和 SparseVectorFieldFilter 的正确方法吗?

0 投票
1 回答
104 浏览

k-means - ELKI PAM 聚类

我是第一次使用 ELKI,但在理解它的结构时遇到了问题。看来我需要做很多事情才能产生一些结果。

如何使用自定义距离度量执行 PAM K-medoid 聚类?

0 投票
1 回答
39 浏览

time - Script for measuring runtime

If I run an algorithm in an environment (ELKI) and want to measure the time, how can I do that? - Make a script? -let that run 10 seconds and press the run button in the environment to run the algorithm - and subtract the 10 seconds. - or maybe I can make a script that interacts with ELKI and knows when I press the run algorithm-button (But I can't see how) - How do one usually write a script? In what language? Can you link to a page, where I can learn it? Bash-script? Perl? Python?

Thanks for any respond.