请考虑以下示例数据集:
a <- c(1, 2, 3, 1, 4, 1968, 2, 1)
b <- c(2, 1, 2, 4, 3, 1984, 2, 0)
c <- c(3, 3, 4, 2, 1, 1945, 1, 0)
d <- c(4, 1, 4, 3, 2, 1975, 3, 1)
df <- data.frame(rbind(a,b,c,d))
names(df) <- c("ID", "OptionW", "OptionX", "OptionY", "OptionZ", "yearofBirth", "education", "sex")
ID OptionW OptionX OptionY OptionZ yearofBirth education sex
1 2 3 1 4 1968 2 1
2 1 2 4 3 1984 2 0
3 3 4 2 1 1945 1 0
4 1 4 3 2 1975 3 1
有 200 人被要求将选项 W 到 Z 从 1 到 4 排名,以降低社区犯罪率的有效性。他们的年龄、最高学历和性别也有注释。我想知道:
- 大多数公民更喜欢哪些选择?
- 男女老幼、受过良好教育的公民的信仰是否存在显着差异?
- 如果此人年龄较大/较年轻、受过或多或少的正规教育并且是男性还是女性,那么排名顺序发生变化的可能性有多大?
我读到多项逻辑回归可能是要走的路,但我发现很难将我找到的示例应用于我的数据集。通常它们只允许选择一个选项,使每个选项(W,XYZ)成为一个变量(选项)的水平。但在我的情况下,我有几个变量(OptionW、OptionX、OptionY、OptionZ),其中排名位置似乎是级别(1、2、3、..10)。还是我看错了?
哪个包中的哪个功能合适?除了多项逻辑回归之外,还有其他可用的方法吗?我可以对 200 个样本进行聚类分析吗?
我主要使用 R 进行空间分析,并且在统计方面不是很流利。希望你能在这里帮助我。