我有一个大型数据集分为 5 个文件(每个文件有 15000 个属性,第一个文件包含标题(属性名称)和 9999 条记录,另外 4 个包含 10000 条记录)。
使用 textscan,我创建了 5 个必须合并的单元格数组,不知道这种方法是否合适,或者直接将所有 5 个文件读入单个单元格数组会更好。无论如何,如果你们中的任何人能够展示将多个单元格数组合并为单个单元格数组或将多个文本文件读入单个单元格数组的方法,我将不胜感激。
谢谢!
我有一个大型数据集分为 5 个文件(每个文件有 15000 个属性,第一个文件包含标题(属性名称)和 9999 条记录,另外 4 个包含 10000 条记录)。
使用 textscan,我创建了 5 个必须合并的单元格数组,不知道这种方法是否合适,或者直接将所有 5 个文件读入单个单元格数组会更好。无论如何,如果你们中的任何人能够展示将多个单元格数组合并为单个单元格数组或将多个文本文件读入单个单元格数组的方法,我将不胜感激。
谢谢!
除非你想做一些 Java 魔法,否则你不能直接将多个文件读入一个数组。
但是,一旦您获得了元胞数组,就应该很容易将它们组合起来:假设每个元胞数组中的列数相同,您可以像这样连接它们:
finalCell = [cell1;cell2;cell3;cell4;cell5];
扩展 Jonas 的答案,如果内存是一个问题,您可以在读取文件时将它们组合起来,以避免使用 5 x 15000 x 10000 + 1 15000 x 50000 单元阵列。
finalCell = textscan(fid_1,'format');
finalCell = [finalCell; 文本扫描(fid_2,'格式')];
finalCell = [finalCell; 文本扫描(fid_3,'格式')];
finalCell = [finalCell; 文本扫描(fid_4,'格式')];
finalCell = [finalCell; 文本扫描(fid_5,'格式')];
最好的祝福,
亚当