0

我想使用具有 322 个变量和菊花的 59 个可观察量的序数数据 (1,2,3,4),最终导致聚类分析。我在 excel 输入文件 (csv) 上使用下面的脚本。daisy 后,出现以下错误信息:

> Error in daisy(grb, stand = TRUE) :    ungültiger Typ character für
> Spaltennummern 1 In addition: Warning messages: 1: In data.matrix(x) :
> NAs introduced by coercion 2: In daisy(grb, stand = TRUE) :  
> Binärvariable 2, 3, 4,

grb 数据在第一列中包含行名,在第一行中包含列标题。daisy 似乎认为它必须使用第一列:我怎样才能告诉它不这样做?输入数据看起来没问题。

其次,daisy 认为数据是二进制文件,但它们是序数,1-4。如何纠正这个?任何帮助是极大的赞赏。

脚本:

library(readr)
grb <- read_delim("~/R/Projects/Datasets/Ges.csv", 
                  ";", escape_double = FALSE, trim_ws = TRUE)
attach(grb)
library(cluster)
data(grb)
head(grb, 2)
d.d <- daisy(grb, stand = TRUE)
grb.hc <- hclust(d.d, method = "ward.D2")
library("factoextra")
fviz_dend(grb.hc, cex=.5, horiz = TRUE)
4

0 回答 0