这确实是一个生物信息学问题,但我会尽可能笼统地说。这是半假设的情况:
假设我可以访问集群甚至云。我想在这个集群/云上运行一些非常具体的程序(准确地说是基因组/转录组程序)。问题是我预计这些程序(Velvet/Oases、Trinity 等)需要大量 RAM,保守地说是 100GB 以上,而我的集群/云上最大的节点只有 32GB。
现在除了切换到基于 MPI/Hadoop 的程序(ABySS 或诸如此类)、编写自己的程序或购买新计算机之外,我还有哪些可行的选择?有没有人尝试过在集群/云的多个节点上使用具有共享内存的分布式操作系统(MOSIX、Kerrighed、...)?虚拟 SMP 怎么样?还有什么?
谢谢你的帮助!
编辑澄清:假设上面提到的程序(Velvet/Oases 和 Trinity)需要一个具有大量 RAM 池的单个系统。简而言之,我正在寻找一种可行的方法将一堆节点“粘贴”到一个虚拟超级节点中,其中单个进程可以访问所有节点的所有 RAM,就像它是一个系统一样。我知道这样的事情可能会对性能产生相当大的影响,但我正在寻找可能的东西,不一定有效。
ps 对不起,如果我的术语让事情变得混乱。我对很多这些都有些陌生。