问题标签 [condor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
273 浏览

condor - 手动定义 HTCondor 的 ClusterID

有谁知道是否可以手动定义新秃鹰安装的起始 ClusterID ?

我已经包装了一些查询 condor 的外部服务,它们使用 ClusterID 作为参考值。

不幸的是,我的安装损坏了,解决它的最简单方法就是清除 /spool 目录中的所有内容。

然而,这意味着秃鹰将重新开始,ClusterID=0这会对我的系统造成严重破坏。

0 投票
1 回答
214 浏览

python - 使用 numpy.linalg.slogdet 需要哪个版本的 python?

我正在使用要求在 Condor 上运行我的 python 脚本Requirements = (HAS_NUMPY =?= TRUE)。这适用于普通的 numpy 函数,但是当我使用numpy.linalg.slogdet函数时出现错误:

虽然我很难知道该节点上存在哪个版本的 python,但主 condor 机器上的版本是 2.6.6。

代码非常简单:

我的问题是:
发生此错误是因为 np.linalg.slogdet 需要更高版本的 python 吗?
如果是这样,有没有办法指定 Condor 所需的 python 版本?

更新:

使用 mgilson 的建议,发现 numpy 版本是 1.4.1,因此出现了问题。所以,现在这是一个 Condor 问题:有没有办法在 Condor 提交文件中指定所需的 numpy 版本;比什么更好Requirements = (HAS_NUMPY =?= TRUE)?谢谢

0 投票
0 回答
206 浏览

matlab - 如何在 condor 集群中运行 Matlab 脚本?

我有一个 m 文件 main.m,它执行一个非常简单的任务:它将两个值相加并将总和写入一个文件。我有一个 .submit 文件,其内容如下:

我面临的问题是,当我使用以下命令时:

什么都没有发生,它表明提交了一个作业并且 .out 文件是空的。.log 文件仅显示作业是从我的 IP 提交的。

我的 .submit 文件有问题吗?还是在秃鹰配置中?

0 投票
1 回答
304 浏览

image - 在 Condor 环境中被杀死的工作

我在 Condor 中运行一个可执行文件,它基本上处理输入图像并将二进制图像保存在给定文件夹中。我在 213 张图片中使用了这个代码。

我的神鹰配置文件内容如下:

有些图像处理正常,但在某些情况下,我的邮箱中收到以下错误:

我在想这是不是因为内存不足而发生的,但是这张图片(名为 47)的大小不超过 20MB(实际上它有 16.7MB)。

正如我之前所说,condor 可以为其他一些图像运行这个可执行文件。

我应该增加配置文件中的 request_memory 吗?这里发生了什么?

0 投票
1 回答
321 浏览

condor - 让下一个神鹰作业等到前一个完成复制输入文件

我在大学的计算集群上使用 condor 来管理大量工作。我的程序读入两个大 (~1Gb) 输入文件并生成一个小 (~100kb) 输出文件。我所有的输入文件都位于同一个网络磁盘上,所有 condor 节点都可以读取(我们大约有 150 个)。我注意到在我提交大量作业后,它们开始运行速度变慢,我怀疑这是由于 IO 延迟,因为磁盘头必须移动更多才能同时读取许多文件。我想通过在运行作业之前将文件复制到节点来优化这一点。更准确地说,我希望一次只复制一个文件,以便更按顺序读取磁盘。我试着用

但这似乎并没有强制后续作业等待前面的作业完成复制文件。

0 投票
3 回答
5659 浏览

condor - condor:找不到本地 schedd 的地址

我正在尝试提交我的神鹰工作,但它一直给我一个错误说:

我是一个初学者的秃鹰用户,我不太确定这意味着什么。

此外,当我输入 condor_q 时,我收到以下错误消息:

有趣的是 condor_status 工作得很好(我可以看到所有集群的状态)。

我做了一些研究,它说我需要使用公共目录才能访问它。是否有针对秃鹰提交/队列的特定目录?

0 投票
1 回答
632 浏览

condor - 一定时间后在 Condor 中重新开始工作

我正在 Condor 上运行作业,并注意到由于某种原因,我的一部分作业将运行但永远不会完成。提交文件中是否有一个设置会在需要一定时间才能完成时杀死然后重新提交作业?这类似于Condor Timeout for idle jobs的问题, 除了我希望 Condor 不要简单地杀死这些工作,而是重新提交它们。

谢谢!

0 投票
0 回答
45 浏览

java - 如何生成 .condor 文件

我创建了一个批处理文件,它可以从命令提示符处完美执行 .jar。我正在尝试将此提交给 condor,但需要先编译一个 .condor。

我不确定如何执行此操作,我需要在特定目录中还是已经在 condor 环境中?

谢谢!

0 投票
0 回答
191 浏览

windows - 使用 WNetAddConnection2 和令牌连接 Windows 共享驱动器

我使用 WNetAddConnection2 使用存储在我们自己的数据库中的用户名和密码连接 Windows 共享驱动器。虽然我在数据库中加密了密码,但必须在客户端解密才能进行真正的连接。我的程序在 Condor 下运行。

这种方法存在泄露密码的安全风险。我可以实现一个令牌方法来授权 Windows 共享驱动器吗?此令牌必须由一台计算机生成,并由其他计算机使用。

我们的组织使用 windows 域来存储用户名和密码。所有计算机都是可变的 Windows 操作系统。

感谢您的任何建议。如果需要更多信息,请告诉我。

0 投票
1 回答
1828 浏览

condor - HTCondor 作业未运行

我无法让 HTCondor 运行我的工作。我一直在破解这个问题,而且我正处于尝试随机事物的地步,所以我认为我应该寻求指导。

我从Ubuntu 15.04的网站上安装了 HTCondor 8.2.9 。以下是有关我的系统的以下信息。

我当前的主机名

我定义的主机

我现在的状态

看看队列

尝试分析作业挂起,然后打印并出错

而我的 StartLog 从头到尾,

如果需要更多信息,请告诉我。

更新:

我在谈判者日志中找到了这个。我不明白这意味着什么。