这很简单:
假设我在文件夹中有许多文件data/
要通过一些可执行文件进行处理./proc
。最大化效率的最简单方法是什么?我一直在这样做以获得一些效率:
ls --sort=size data/* | tac | parallel ./proc
它根据大小列出数据,然后tac
(reverse of cat
) 翻转该输出的顺序,以便首先处理最小的文件。这是最有效的解决方案吗?如果没有,如何提高效率(首选简单的解决方案)?
我记得像这样的排序会带来更高的效率,因为更大的工作不会阻塞管道,但除了示例之外,我找不到或记住这背后的任何理论,所以任何参考都将不胜感激!