我正在从事一个涉及使用大型数据矩阵进行计算的项目。我有 10,000 行和 100 列的 CSV 文件,其中有 10 个。目前,我正在运行一个后台作业,该作业从每个 CSV 读取数据,将其拉入一个数组,对数据运行一些矩阵乘法计算,然后移动到下一个 CSV。我确信有更好的方法可以做到这一点,因为处理工作所需的大部分时间似乎都花在了打开 CSV 上。我的问题实际上归结为我应该如何存储当前在这些 CSV 文件中的数据,以便轻松访问它并以更有效的方式运行计算。任何帮助,将不胜感激
编辑
正如评论中所建议的,我想补充一点,矩阵密度为 100%,并且数字都是浮点数。