0

我有一个非常大的(949,000 obs.)堆叠(长格式)数据集。我想根据一个变量中是否存在数据来选择案例,但保留该唯一 ID 的其他堆叠数据。那有意义吗?

你有什么想法吗?

4

2 回答 2

0

你当然可以在统计中做到这一点。使用 AGGREGATE 并将人员 ID 用作中断变量,例如,将平均值用作汇总统计量。选择将聚合统计信息添加到案例中。然后只需选择聚合不丢失的那些情况。

于 2014-09-19T16:44:26.517 回答
-1

SPSS 是用于统计的应用程序包,而不是编程语言。我会使用 stackoverflow 系列的其他成员。

尝试交叉验证(https://stats.stackexchange.com/

于 2014-09-17T19:29:57.900 回答