背景:我正在研究一个个人响应数据集,我会将这些数据汇总到市级。但是,我只想处理来自 20 多个个案的汇总数据。
问题:如何使用市级变量来计算存在多少个不变量唯一案例,不包括计数小于 20 的案例?
我知道一些解决方法,使用聚合函数,但也在 Excel 中计数。但是,这可以在语法上更轻松地完成,并且在聚合数据之前完成吗?
将不胜感激任何帮助和建议!
运行 AGGREGATE 时,选择 N 作为统计数据之一。然后,您可以在聚合数据集中使用 SELECT IF 来仅选择至少具有最小 N 的单位。不过,您可能想考虑一下小 N 单位是否存在系统性差异,从而可能会影响您的分析。
如果您不想聚合您的数据,您可以使用 LAG-Funktion 和一些排序来完成此操作(取决于您的数据集的大小,这可能需要一些时间)。
首先,您必须确保属于同一自治市的所有案件都在一个案件中。
SORT CASES BY municipality.
现在您可以使用 LAG-Function 计算每个市镇的人数。
COMPUTE n_mun = 1.
IF (municipality = LAG(municipality)) n_mun = LAG(n_mun) + 1.
EXECUTE.
每个自治市的个人总数现在存储在每个自治市的最后一个案例中 (n_mun)。如果您想将此值复制到同一自治市的其他案例中,您必须再次使用 n_mun 按降序排序,因此最高值在顶部。(除非 IBM 决定在 SPSS 中包含反向 LAG-Command)。
SORT CASES municipality n_mun(D).
IF (municipality = LAG(municipality)) n_mun = LAG(n_mun).
EXECUTE.