我在弄清楚如何将大型数据集分类为更有用的数据时遇到问题。
CSV 格式的原始文件如下所示 - 数据表示 x、y、z 位置,最后是能量。x,y,z 坐标分布很广,这是下面的一个小片段——基本上它是对一个体积的能量搜索。
-2.800000,-1.000000,5.470000,-0.26488315
-3.000000,1.000000,4.070000,-0.81185718
-2.800000,-1.000000,3.270000,1.29303723
-2.800000,-0.400000,4.870000,-0.51165026
不幸的是,它很难在必要的四个维度上绘制,所以我需要修剪这些数据。我想这样做,我会将体积变成最低能量 z 轴上的表面。在较小的数据集上,这很简单,在 Excel 中按 X、Y 和能量排序,然后删除最低能量以上的所有能量。这对于小型数据集来说很容易,但很快就会出现问题。
我尝试了各种方法,例如拆分 csv 和使用 sort 命令,但我运气不佳。任何有关如何解决此问题的建议将不胜感激。