2

请考虑以下示例数据集:

a <- c(1, 2, 3, 1, 4, 1968, 2, 1)
b <- c(2, 1, 2, 4, 3, 1984, 2, 0)
c <- c(3, 3, 4, 2, 1, 1945, 1, 0)
d <- c(4, 1, 4, 3, 2, 1975, 3, 1)
df <- data.frame(rbind(a,b,c,d))
names(df) <- c("ID", "OptionW", "OptionX", "OptionY", "OptionZ", "yearofBirth", "education", "sex")


ID OptionW OptionX OptionY OptionZ yearofBirth education sex
1       2       3       1       4        1968         2   1
2       1       2       4       3        1984         2   0
3       3       4       2       1        1945         1   0
4       1       4       3       2        1975         3   1

有 200 人被要求将选项 W 到 Z 从 1 到 4 排名,以降低社区犯罪率的有效性。他们的年龄、最高学历和性别也有注释。我想知道:

  • 大多数公民更喜欢哪些选择?
  • 男女老幼、受过良好教育的公民的信仰是否存在显着差异?
  • 如果此人年龄较大/较年轻、受过或多或少的正规教育并且是男性还是女性,那么排名顺序发生变化的可能性有多大?

我读到多项逻辑回归可能是要走的路,但我发现很难将我找到的示例应用于我的数据集。通常它们只允许选择一个选项,使每个选项(W,XYZ)成为一个变量(选项)的水平。但在我的情况下,我有几个变量(OptionW、OptionX、OptionY、OptionZ),其中排名位置似乎是级别(1、2、3、..10)。还是我看错了?

哪个包中的哪个功能合适?除了多项逻辑回归之外,还有其他可用的方法吗?我可以对 200 个样本进行聚类分析吗?

我主要使用 R 进行空间分析,并且在统计方面不是很流利。希望你能在这里帮助我。

4

0 回答 0