2

我正在使用 ELKI GUI 来运行 DBSCAN 算法。我的输入是一个 CSV 文件。我创建一个投影作为特征选择:

-dbc.filter transform.ProjectionFilter -projection NumericalFeatureSelection -projectionfilter.selectedattributes 1,2 

ELKI 给了我一些文件作为集群。这些文件只包含投影属性,而其他属性如UserId不存在。如何识别集群中每个对象的UserId ?

4

1 回答 1

3

最简单的方法是使用投影来删除不需要的列(这实际上会删除这些列),而是将它们视为标签。因为这就是它们,标签。

通常,如果您希望之后能够识别点,最可靠的方法是在每个对象中包含一个唯一标识符(对象标签)。

换句话说,使用

-parser.labelIndices 0

而不是您的过滤器(当然,选择您的标签列 - 假设您的用户 ID 在第 0 列中)。

于 2015-10-14T13:54:13.313 回答