r - 比较 expss 表中的两个变量（数字或两个因子）

Question

我正在深入挖掘 expss 包，并面对此处提到的示例之一 --> https://gdemin.github.io/expss/#example_of_data_processing_with_multiple-response_variables（尤其是该部分的最后一个表。

考虑以下数据框：

vecA <- factor(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)),levels=c(1,2,3,4,5))
vecB <- factor(c(rep(1,20),rep(2,20),rep(NA,10)),levels=c(1,2,3,4,5))
df_fact <- data.frame(vecA, vecB)

vecA_num <- as.numeric(c(rep(1,10),rep(2,10),rep(3,10),rep(4,10),rep(5,10)))
vecB_num <- as.numeric(c(rep(1,20),rep(2,20),rep(NA,10)))
df_num <- data.frame(vecA, vecB)

严格复制建议的代码（上面的 URL），这是我的表格的样子：

df_fact %>%
  tab_cols(total(label = "#Total| |")) %>% 
  tab_cells(list(vecA)) %>%
  tab_stat_cpct(label="vecA", total_row_position="above", total_statistic="u_cases") %>%
  tab_cells(list(vecB)) %>% 
  tab_stat_cpct(label="vecB", total_row_position="above", total_statistic="u_cases") %>%
  tab_pivot(stat_position = "inside_columns") %>%  
  recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy)

与数字示例略有不同的过程：

df_num %>%
  tab_cols(total(label = "#Total| |")) %>% 
  tab_cells(vecA_num, vecB_num) %>%
  tab_stat_valid_n(label = "Valid N") %>%
  tab_stat_mean(label="Mean") %>%
  tab_pivot(stat_position = "inside_columns") %>%  
  recode(as.criterion(is.numeric) & is.na ~ 0, TRUE ~ copy) %>%
  tab_transpose()

问题从这里开始，因为这些复杂的结构是……复杂的！

1）我想包括 tab_last_sig* 系列函数，但我不知道如何去做（当变量是因素时，可能是小计/网）

2) 包括多个统计数据（案例、百分比、平均值……）是一个挑战

3）最后，我不清楚我应该在哪里写统计名称/变量名称

我还没有找到这些构造的详细文档，因此这个消息在一个瓶子里:)

score 1 · Accepted Answer

很遗憾，但目前仅支持独立样本的显着性检验。在您的示例中，您希望比较相关样本的统计信息。您可以对独立比例进行显着性计算，但结果将不准确。
包括多个统计数据并不难——您只需按顺序写入tab_stat_。但复杂的表格布局确实是一个挑战:(
统计的变量名总是应该写在tab_cells. 之后，您可以使用等编写统计函数tab_stat_mean。您可以通过在 R 控制台中tab_stat_cpct打印来查找文档。?tab_pivot这是获取 R 函数手册的标准方法。

r - 比较 expss 表中的两个变量（数字或两个因子）

1 回答 1

Related

Reference