一旦通过 CSV 加载,使用等来处理 CSV 中的数据read.csv
就相当简单了。然而,阅读它是相当耗费时间的。multicore
segue
意识到最好使用 mySQL 等。
假设使用运行 R2.13 的 AWS 8xl 集群计算实例
规格如下:
Cluster Compute Eight Extra Large specifications:
88 EC2 Compute Units (Eight-core 2 x Intel Xeon)
60.5 GB of memory
3370 GB of instance storage
64-bit platform
I/O Performance: Very High (10 Gigabit Ethernet)
任何想法/想法都非常感谢。