我有一个包含以下列的 matlab 表。让我们称之为“参考表”: [Security(char),RegionId(int either 1,2,3) ] 这个表的高度约为 49,000
我有其他包含 Security(char) 和随机数据点作为列的表。让我们将这些表称为“数据表”。这些数据表的总大小为 45Gigs。这些表中的每一个都超过 1 亿行。我需要使用参考表来映射 regionId 并执行以下操作:
[Security(char),RandomDataPoint(float)] > [Security(char),RegionId(int 1,2,3),RandomDataPoint(float)]
通常对于此操作,我会使用表连接。但是,由于这些表的大小,我在这个实现中遇到了真正的问题。我的主要问题是内存不足。
一种选择是将表格分解为部分并加入。但是,考虑到 45Gigs 的聚合数据,我怀疑这在时间方面会非常昂贵。
有没有人对我应该如何解决这个问题有任何建议。如果重要,我需要将区域列添加到我的数据表中,以便我可以将数据写入文本文件并将它们批量加载到 sql 中。
提前致谢