1

我正在尝试在 ELKI 中使用 SUBCLU,但为了弄清楚我已经尝试过 DBSCAN,甚至是 KMEANSLloyd,只是为了知道如何输入高维数据。不幸的是,我最多只能输入 14 个维度,任何更高的维度,程序开始抱怨我没有为“bubble.scaling”输入参数,即使我很清楚地有。我通过使用格式与“mouse.csv”教程文件类似的 .csv 文件输入数据(这是我首先弄清楚如何输入尺寸大于 1 的数据的方法)。我究竟做错了什么?

4

2 回答 2

1

原来我没有正确格式化 CSV 文件。我需要包含标题,而不是只包含由空格分隔的数据的 CSV 文件。由于我没有使用随机生成的信息,而且我事先不知道集群的数量,这就是 CSV 的样子。

## Size: 10
########################################################
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14 13 12 11 10 9 8 7 6 5 4 3 2 1
14 13 12 11 10 9 8 7 6 5 4 3 2 1
于 2015-05-28T13:50:35.043 回答
0

我有同样的问题。我的情况是,我的 csv 文件只包含整数列,它们被视为字符串数据类型而不是数字数据类型。通过将 dbc.parser 设置为 CategoricalDataAsNumberVectorParser,outofbounds 错误消失了。

于 2015-06-29T11:41:47.070 回答