我有一组与流程输入相关的三个(或更多)已知变量。我也有这个过程的(测量的)结果,在这种情况下是完成过程所花费的时间。
为了能够给出估计的持续时间并根据输入创建进度指示器,我需要找到变量和结果之间的关系(如果有的话)。
确定是否存在关系以及是否存在关系以创建公式的最佳方法是什么。
我有许多数据集可供使用(输入变量值和结果时间)。
与此相关的任何建议或链接?关于如何使用代码或指向某些理论的指针来解决这个问题的提示会很有帮助。
一些添加的背景:
该过程由许多要处理的文件(主输入)和一个附加的辅助输入组成,该辅助输入由与主输入的内容直接相关的另一组(参考)文件组成。目前,进度是通过显示整体文件进度(与主要输入的总数相关)以及基于当前输入文件内容中的位置的文件内进度来指示的。由于每个文件(集)所需的总时间可能相当长(取决于内容),我想添加某种“剩余时间”或“预期完成时间”指示器。
实际代码包括将列表(Excel 格式)中的数据子集与 XML 文件合并到旧格式文件中。“耗时”的部分是 Excel 文件的解析,但这受文件实际大小、需要处理的项目数以及需要创建为输出的文件数的影响很大。在某些情况下,大文件会导致一个输出,而在其他情况下,小文件会导致大量输出。由于执行了大量文件访问,因此次要因素(很难用数字表示)是同时运行的相同进程的数量。
这个想法是能够根据输入给出估计的吞吐量。