我正在使用大约 3.3 GB 的 Stata .dta 文件,因此它很大但不会太大。我对使用 IPython 很感兴趣,并尝试使用 Pandas 导入 .dta 文件,但发生了一些奇怪的事情。我的盒子有 32 GB 的 RAM,尝试加载 .dta 文件会导致所有 RAM 都被使用(大约 30 分钟后),并且我的计算机停止运行。这并不“感觉”正确,因为我能够使用外部包中的 read.dta() 在 R 中打开文件没问题,并且在 Stata 中使用该文件很好。我正在使用的代码是:
%time myfile = pd.read_stata(data_dir + 'my_dta_file.dta')
我在 Enthought 的 Canopy 程序中使用 IPython。'%time' 的原因是因为我有兴趣将其与 R 的 read.dta() 进行基准测试。
我的问题是:
- 我做错了什么导致熊猫出现问题吗?
- 有没有办法将数据放入 Pandas 数据框中?