0

我有一个包含 12 个变量的数据集,每个变量取值 1 到 4,并被视为序数。如果我没有指定它们的类型,它们将被视为间隔类型

> attributes(gower_dist)
$class
[1] "dissimilarity" "dist"         

$Size
[1] 5845

$Metric
[1] "mixed"

$Types
 [1] "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I"

但如果我添加'type=list(ordratio=1:12)',则类型变为'T',我确定它代表什么。如果它不代表序数,那么我如何告诉雏菊我正在输入序数数据?

> attributes(gower_dist)
$class
[1] "dissimilarity" "dist"         

$Size
[1] 5845

$Metric
[1] "mixed"

$Types
 [1] "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T"
4

1 回答 1

2

简短的回答

如果您指定了序数比率并观察结果类型为“T”,那么这就是预期的行为。

长答案

我看了一下daisy函数内部。该属性有 6 个可能的值Types

typeCodes <- c("A", "S", "N", "O", "I", "T")

我在调试模式下使用不同的参数循环了几次函数。此属性的映射如下所示:

  • 如果您指定type = list(asymm=<whichever columns in the dataset>):“A”

  • 如果您指定type = list(symm=<whichever columns in the dataset>):“S”

  • 如果您指定type = list(ordratio=<whichever columns in the dataset>):“T”

如果您指定类型,或者您指定type=list(logratio=<whichever columns in the dataset>), & 您的数据集的列是:

  • 因素:“N”

  • 订购:“O”

  • 数字/整数:“我”

(不知道为什么 logratio 没有自己的类型,但这可能在这里偏离主题......)

于 2017-08-19T09:15:32.353 回答