0

以下行代表 -40 到 400 度的温度,7 列代表热电偶的类型(B、J、K....)

![温度与电动势矩阵][1]

X=[   -1.961 -1.527 -0.194 -1.475 -1.023 -0.188 -2.255
      -1.482 -1.156 -0.150 -1.121 -0.772 -0.145 -1.709
      -0.995 -0.778 -0.103 -0.757 -0.518 -0.100 -1.152
      -0.501 -0.392 -0.053 -.0383 -0.260 -0.051 -0.582
       0.000  0.000  0.000  0.000  0.000  0.000  0.000
       0.507  0.397  0.055  0.391  0.261  0.054  0.591
       1.019  0.798  0.113  0.790  0.525  0.111  1.192
       1.537  1.203  0.17   1.196  0.793  0.171  1.801
       2.059  1.612  0.235  1.612  1.065  0.232  2.420
       2.585  2.023  0.299  2.036  1.340  0.296  3.048
       3.116  2.436  0.365  2.468  1.619  0.363  3.685
       3.650  2.851  0.433  2.909  1.902  0.431  4.330
       4.187  3.267  0.502  3.358  2.189  0.501  4.985
       4.726  3.682  0.573  3.814  2.480  0.573  5.648
       5.269  4.096  0.646  4.279  2.774  0.647  6.319
       5.814  4.509  0.720  4.750  3.071  0.723  6.998
       6.360  4.920  0.795  5.228  3.374  0.800  7.685
       6.909  5.328  0.872  5.714  3.680  0.879  8.379
       7.459  5.735  0.950  6.206  3.989  0.959  9.081
       8.010  6.138  1.029  6.704  4.302  1.041  9.789
       8.562  6.540  1.110  7.209  4.618  1.124 10.503
       9.115  6.941  1.191  7.720  4.937  1.208 11.224
       9.669  7.340  1.273  8.237  5.259  1.294 11.951
       10.224 7.739  1.357  8.759  5.585  1.381 12.684
       10.779 8.138  1.441  9.288  5.913  1.469 13.421
       11.334 8.539  1.526  9.822  6.245  1.558 14.164
       11.889 8.940  1.612  10.362 6.579  1.648 14.912
       12.445 9.343  1.698  10.907 6.916  1.739 15.664
       13.000 9.747  1.786  11.458 7.255  1.831 16.420
       13.555 10.153 1.874  12.013 7.597  1.923 17.181
       14.110 10.561 1.962  12.574 7.941  2.017 17.945
       14.665 10.971 2.052  13.139 8.288  2.112 18.713
       15.219 11.382 2.141  13.709 8.637  2.207 19.484
       15.773 11.795 2.232  14.283 8.988  2.304 20.259
       16.327 12.209 2.323  14.862 9.341  2.410 21.036
       16.881 12.624 2.415  15.445 9.696  2.498 21.817
       17.434 13.040 2.507  16.032 10.054 2.597 22.600
       17.986 13.457 2.599  16.624 10.413 2.696 23.386
       18.538 13.874 2.692  17.219 10.774 2.796 24.174
       19.090 14.293 2.786  17.819 11.136 2.896 24.964
       19.642 14.713 2.880  18.422 11.501 2.997 25.757
       20.194 15.133 2.974  19.030 11.867 3.099 26.552
       20.745 15.554 3.069  19.641 12.234 3.201 27.348
       21.297 15.975 3.164  20.255 12.603 3.304 28.146
       21.848 16.397 3.259  20.872 12.974 3.408 28.946];

我的问题是:当所有列包含不同状态的相同实体时,我们可以在这种类型的矩阵上使用聚类算法吗?

如果不是,那么可能的识别方法是什么?

4

3 回答 3

0

好吧,从技术上讲,你当然可以运行 k-means 。

你应该问自己的问题是:你想做什么?

这种类型的数据上的 K-means 将有很大的偏差(因为冗余;k-means 最好在白化数据上运行,具有单位方差且没有协方差!),并且它将每个时间点视为实例,即它将聚类time,但没​​有任何连接约束。即,它将对单个测量值进行聚类,但不会对间隔进行聚类。

例如,您可能对将数据分割成凸段更感兴趣。另外,您确实需要注意您的个人属性所传达的内容。

于 2013-11-12T16:23:15.917 回答
0

如果您不想使用高度相关的数据,您可以在对数据集进行聚类之前使用某种类型的降维技术(例如 PCA)来简化数据集。但是,正如许多其他人所建议的那样,您应该首先确定您的目标是什么。

于 2013-11-20T15:32:42.180 回答
0

一般来说 - 是的,您可以对特征高度相关的数据使用聚类算法 - 唯一的问题是 - 您实际上要捕获什么?

可以在一定程度上处理特征之间相关性的最基本的预处理方法是通过 cov(X)^(-1/2) (数据协方差矩阵的逆的平方根)转换数据。结果,您获得了具有单位相关矩阵的数据,这更适合尺度变量聚类方法。这样的结果可以通过使用 Mahalanobis k-means 直接获得(正是这样做的)。

于 2013-11-11T17:31:12.520 回答