0

我得到了一个包含 1,000 个变量的数据集,并被要求对解释变量和二元因变量运行 Pearson 相关性。我使用以下代码生成相关性:

correlations /variables = x1 to x500 with y
correlations /variables = x501 to x1000 with y

结果输出是一个在 SPSS 或其他软件(例如 Excel)中显示为不可排序的表格

x1 Pearson Correlation
   p-value
   N
-----------------------
x2 Pearson Correlation
   p-value
   N
-----------------------
         .
         .
         .
-----------------------
xi Pearson Correlation
   p-value
   N
-----------------------

我希望能够根据 Pearson 的相关性然后 p 值对变量进行排名。SPSS 是否有能力将变量名称、皮尔逊相关值和 p 值保存为表格,然后对它们进行排名?

我太习惯于 Stata 和 R 并且无法注意到手册中的任何内容。解决方法是运行仅包含一个因变量的单变量回归模型 1,000 次并尝试保存这些系数?

谢谢!

4

1 回答 1

0

您可以轻松地将统计信息转置到输出表中的列中,这将为您提供可排序的排列。尝试使用一些变量,看看它是如何工作的。双击表格将其激活,然后使用 Pivot > Pivoting Trays 打开控件进行旋转。

要为您的真实数据执行此操作,您将需要使用 OMS 捕获表,创建一个新数据集,然后您可以对其进行排序或执行其他数据操作操作。当你创建你的 OMS 命令时,你会想要告诉它旋转表格,以便数据集排列方便。

请记住,寻找最高相关性可能会让您对顶级变量的预测能力过于乐观。

NAIVEBAYES 过程(统计服务器)可能是另一种需要考虑的方法。有关详细信息,请查看命令语法参考。

于 2013-10-18T01:33:52.120 回答