使用 C、C++、Shell、Perl 和/或 Python 的组合我想开发一个允许用户将作业提交到队列(或队列)的系统。队列中的作业应该以适当的顺序在多个工作机器之一上执行。
该系统应提供基本功能。但是,除此之外,您还可以更详细地考虑以下一个或多个具体问题:
Support for multiple users
Flexible specification of jobs
Interdependencies between jobs
Integration of job creation with existing package(s)
Cancelling Jobs
Smarter scheduling of jobs
Discovery of available machines
Varying capabilities of worker nodes
Multiple Operating Systems
Failure of worker hardware
Failure of the Job Execution(including hanging indefinitely)
Failure of the queue management machine(s).
我在 C、C++ 和 Python 方面有一些基本经验。我有兴趣使用该系统提供基本功能。互联网上主要有关于所有这些的理论,但我找不到例子来看看它是如何工作的。如果有人有信息、来源、示例代码或任何可以帮助我的东西,我会非常感激。