我有一个非常大的(949,000 obs.)堆叠(长格式)数据集。我想根据一个变量中是否存在数据来选择案例,但保留该唯一 ID 的其他堆叠数据。那有意义吗?
你有什么想法吗?
我有一个非常大的(949,000 obs.)堆叠(长格式)数据集。我想根据一个变量中是否存在数据来选择案例,但保留该唯一 ID 的其他堆叠数据。那有意义吗?
你有什么想法吗?
你当然可以在统计中做到这一点。使用 AGGREGATE 并将人员 ID 用作中断变量,例如,将平均值用作汇总统计量。选择将聚合统计信息添加到案例中。然后只需选择聚合不丢失的那些情况。
SPSS 是用于统计的应用程序包,而不是编程语言。我会使用 stackoverflow 系列的其他成员。
尝试交叉验证(https://stats.stackexchange.com/)