我是一名研究员,我的主要兴趣是改进稀疏内核以实现高性能计算。我研究了许多稀疏矩阵上的大量参数。我想知道是否有管理这些结果的工具。我遇到的问题是:
- 结合每个矩阵的多个实验结果
- 版本化结果
- 取平均值,找到结果的最小/最大/标准偏差
- 有数百个描述性能改进的指标。我想轻松地选择几个指标并尝试找出与性能改进相关的指标。
在这里,我举了一个小例子来说明我的大问题。共有三种类型的参数和每个参数的两个值:Row/Column、Cyclic/Block、HeuristicA/HeuristicB。所以这些参数的组合必须有8个文件。其中两个内容:
文件内容RowCyclicHeuristicA.txt
a.mtx#3#5.1#10#2%#row#cyclic#heuristicA#1
a.mtx#7#4.1#10#4%#row#cyclic#heuristicA#2
b.mtx#4#6.1#10#3%#row#cyclic#heuristicA#1
b.mtx#12#5.7#10#7%#row#cyclic#heuristicA#2
b.mtx#9#3.1#10#10%#row#cyclic#heuristicA#3
文件内容ColumnCyclicHeuristicA.txt
a.mtx#3#5.1#10#5%#column#cyclic#heuristicA#1
a.mtx#1#5.3#10#6%#column#cyclic#heuristicA#2
b.mtx#4#7.1#10#5%#column#cyclic#heuristicA#1
b.mtx#3#5.7#10#9%#column#cyclic#heuristicA#2
b.mtx#5#4.1#10#3%#column#cyclic#heuristicA#3
我有一个方案文件来描述这些文件的内容。该文件有一行描述结果文件中每一列的类型和含义:
str MatrixName
int Speedup
double Time
int RepetationCount
double Imbalance
str Parameter1
str Parameter2
str Parameter3
int ExperimentId
我需要显示平均值 Time
和两种类型的参数如下:(下表中的数字是随机的)
Parameter1 Parameter2
Matrix row col cyclic block
a.mtx 4.3 5.2 4.2 5.4
b.mtx 2.1 6.3 8.4 3.3
有没有先进的工具可以获取上表的方案并自动生成这个表?目前,我有一个用 Java 编写的工具来处理原始文件和 Latex 代码,以使用pgfplotstable
. 但是,我需要一种更专业的工具。我不想要 MS Excel 的数据透视表。
一个类似的问题是here。