0

您好我已经使用以下命令在 4 节点集群上安装了 gridengine:

sudo apt-get install gridengine-client gridengine-qmon gridengine-exec gridengine-master
sudo apt-get install gridengine-exec gridengine-client

它返回了:

SGE_ROOT: /var/lib/gridengine
SGE_CELL: bms

因此,我已经完成了配置 gridengine 的所有必要步骤,并且它可以工作。

但是我想使用 python drmaa 库运行我的工作,并且我已经安装在主节点上:

sudo apt-get install libdrmaa-dev
pip install drmaa

因此,如果我使用以下脚本查询系统:

#!/usr/bin/env python
import drmaa
def main():
    """Query the system."""
    s = drmaa.Session()
    s.initialize()
    print 'A DRMAA object was created'
    print 'Supported contact strings: ' + s.contact
    print 'Supported DRM systems: ' + str(s.drmsInfo)
    print 'Supported DRMAA implementations: ' + str(s.drmaaImplementation)
    print 'Version ' + str(s.version)
    print 'Exiting'
    s.exit()
if __name__=='__main__':
    main()

它返回:

 A DRMAA object was created
 Supported contact strings: session=NGS-1.9217.1679116461
 Supported DRM systems: GE 6.2u5
 Supported DRMAA implementations: GE 6.2u5
 Version 1.0
 Exiting

但是,如果我尝试使用链接建议的脚本运行作业: http ://code.google.com/p/drmaa-python/wiki/Tutorial#Running_a_Job

它返回

drmaa.errors.NoActiveSessionException: code 5: No active session

有人可以帮我吗?怎么了。drmaa 库看起来能够与 gridengine 通信,但它无法运行作业。为什么会引发此错误?我真的很感激任何帮助。

4

1 回答 1

0

您会发现使用 DRMAA 运行作业的示例不会初始化会话,因此只需在创建新会话 s = drmaa.Session() 后添加 s.initialize() 如下:

#!/usr/bin/env python

import drmaa
import os

def main():
   """Submit a job.
   Note, need file called sleeper.sh in current directory.
   """
   s = drmaa.Session()
   s.initialize()
   print 'Creating job template'
   jt = s.createJobTemplate()
   jt.remoteCommand = os.getcwd() + '/sleeper.sh'
   jt.args = ['42','Simon says:']
   jt.joinFiles=True

   jobid = s.runJob(jt)
   print 'Your job has been submitted with id ' + jobid

   print 'Cleaning up'
   s.deleteJobTemplate(jt)
   s.exit()

if __name__=='__main__':
    main()
于 2014-07-31T11:13:43.037 回答