0

我对 SAS 编程很陌生。但是,我有兴趣使用该数据开发算法的数据集。但是,我不会总是连接到 Internet,因此无法通过 Web 访问数据库。

相反,我想知道:

  1. 复制非常大的 SAS 数据库 (3 TB) 的最佳方法是什么?

  2. 我是否可以使用我的 PC(而不是专用硬件)来运行本地 SAS 服务器并执行 SAS 脚本?

4

2 回答 2

3

您当然可以在本地运行 SAS,尽管桌面许可证很昂贵(取决于您许可的产品,第一年可能需要 2000 美元)。您当然也可以将文件存储为 MYSQL 格式(或其他任何格式);MYSQL 可以轻松读取逗号分隔文件 (CSV),并且您可以非常快速地从 SAS 生成创建表脚本。

我会注意到您通常不会将 SAS 文件称为“数据库”,尽管这并没有什么不准确的地方;但是,它们比整个数据库更接近“表”(对于许多表来说,它们通常是一个独立的数据和元数据单元)。SAS 文件通常称为“数据集”,SAS 数据集和元数据(格式目录等)的集合称为“库”。

复制一个 3TB 的 SAS 数据集,如果它是一个单一的数据集,可以通过正常的文件传输方法(FTP、HTTP、windows 或 UNIX 复制等)来完成。SAS 数据集通常压缩得很好(即,一个 3TB 未压缩的 SAS 数据集可能很容易压缩低至 2-3GB,具体取决于具体细节)。您可能需要获取 SAS 格式目录以及数据集(存储值标签);此外,这是特定于操作系统和位的(因此 Windows 32 位不能使用 Unix 甚至 Windows 64 位格式目录);有一些方法可以在适当的版本中获取格式目录(或更常见的是,获取目录的数据集转储以在本地重新创建)。

于 2013-02-13T17:09:30.880 回答
2

是的,您可以为 PC 授权 SAS。

您是否建议将 3tb 数据集下载到本地环境?哇。如果您是 SAS 新手并想开发算法,为什么不从一些较小的数据集开始,例如 SAS 本身附带的数据集或您自己创建的数据集?然后,一旦你确定了一个好的算法,也许就需要在 3tb 数据集上运行它。

或者可能首先获取完整数据集的子集。

于 2013-02-13T07:42:26.243 回答