13

这是二维的: [[2,2]] 但它也有 2 个特征/属性,不是吗。我对维度、属性和特征之间的区别感到困惑。

4

2 回答 2

37

我不得不不同意@Atilla 的回答

  • 维度通常是指属性的个数,虽然也可以用“数据向量的第二个维度是人的年龄”的形式使用,但是比较少见——大多数情况下维度是“属性的个数”
  • 属性是您的点中的一种特定“数据类型”,因此每个观察/数据点(如个人记录)包含许多不同的属性(如人的体重、身高、年龄等)
  • 根据上下文, 特征可能有多种含义:
    • 它有时指的是属性
    • 它有时指特定学习模型生成的数据的内部表示,例如 - 神经网络提取特征,这些特征是属性或其他特征的组合
    • 它有时指的是由核方法(在 Kernel PCA、Kernel k-means、SVM 中)诱导的数据的假设表示

一般来说,您有一些对象 X,您使用一些属性来描述它们(这是特征提取的第一步,因此这些属性有时也称为特征),它创建了给定维度的表示(属性数、提取的特征)。然后你训练一些模型,它通常会创建某种抽象(有时甚至是多层次的),并且每个这样的抽象都会生成新的特征(从特征中提取特征),这些对象比较低“级别”上的对象更复杂。

 X  --->   repr(X)   --->   f1(repr(X)) --->   ....  --->   fn(repr(X))
data      attributes         1st level                      nth level
        (0th features)       features                       features

      |repr(X)|=dimension

f 经常出现,所以f2(repr(X))实际上有些f2'(f1(repr(X))

于 2013-11-06T07:29:08.607 回答
2

它们是相同的东西。属性、维度和特征。根据作者的背景或领域,它们可以互换使用。

例如,如果您在谈论数学方面,您可以说这是高维问题。

于 2013-11-06T06:57:39.533 回答