-2

我目前正在设计一个调查系统(其中一个调查有很多问题,一个问题有很多答案,一个响应属于_用户、调查、问题和答案)。

我将在用户模型中拥有大量人口统计数据,并期望对各种问题等做出成千上万的回应。

例如,最终我们将要分析响应。80% 的男性喜欢香蕉,20% 的女性拥有福特之类的。

我正在研究 R、SAS 和 SPSS 等统计语言,我想知道我的数据是否需要以任何特定方式进行结构化才能被这些程序使用?还是他们都接受csv文件?

您在统计数据和构建数据模型方面有什么建议吗?

最后,SAS、SPSS 和 Stata 的成本是多少?

4

1 回答 1

2

CSV files绰绰有余。R管理所有按行和列排列的数据非常强大。

例如:您可以将 csv 的所有列排列为带有标题的变量/响应,并且您的行可以是数据,反之亦然。

只要它们按行和列排列就没有关系。Comma, SpaceCSV 文件中的分隔列可以轻松处理。不是我具体,你可以有任何delimiterR强大的regular expression匹配。

唯一的建议是您应该为不同的数据集制作不同的 CSV 文件以使事情变得更容易,并且可以轻松地将其全部导入data-frameCSV 文件。

一旦你完成它,你就可以自由地释放它的力量R

于 2012-06-05T21:51:19.183 回答