问题标签 [mpiexec]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mpi - 将 strace 与 mpiexec 一起使用
如何从 mpiexec (MPICH2, linux) 开始跟踪 MPI 并行作业的所有进程?
-o
会弄乱不同进程的输出
PS 致一些编辑:谁可能会这么认为MPICH is the name of the library. MPICH2 is a particular version.
。MPICH2 实际上是MPICH2 is an all-new implementation of MPI
,我有时不得不同时使用 mpich 和 mpich2。所以,我们不能用 mpich 代替 mpich2。
cluster-computing - mpiexec 使用错误数量的 cpu
我正在尝试建立一个 MPI 集群。但是我的问题是添加到 mpd.conf 文件中的 CPU 数量没有正确使用。我有三台 Ubuntu 服务器。具有 48 个内核的 opteron 具有 8 个内核的 calc1 具有 8 个内核的 calc2。
我的 mpd.hosts 看起来像:
opteron:46
calc1:6
calc2:6
引导后(mpdboot -n 3 -f mpd.hosts)系统正在运行。mpdtrace -> 列出所有三个。
但是运行像“mpiexec -n 58 raxmlHPC-MPI ...”这样的程序会导致 calc1 和 calc2 获得许多工作,而 opteron 同时获得很少的工作。我究竟做错了什么?
问候
比约恩
python - Mpdboot:弃用警告
我正在尝试使用 mpdboot 命令启动 4 个处理器来运行我的 MPI 程序。我创建了一个具有 4 个节点(75、77、79 和 80)的 mpd.hosts 文件。他们每个人都运行 python 2.3.4。我还修改了 bashrc 和 cshrc 文件,以确保变量包含编译器库目录的路径。我还设置了 mpd.conf 文件并检查它是否具有 rw (600) 权限。
运行 mpdboot 时,我已在输出屏幕下方复制
[n@heart]$ mpdboot -n 4 -r ssh
:38:弃用警告:popen2 模块已弃用。使用子流程模块。
n@75的密码:xxx
n@77的密码:xxx
n@79的密码:xxx
n@80的密码:xxx
mpdboot_heart.int(err_exit 526): mpd 无法在 heart.int 上正确启动
原因:0:来自 mpd /opt/intel/mpi/2.0/bin/mpd.py:85 的端口无效:DeprecationWarning:不推荐使用 md5 模块;改用 hashlib
被杀
第2部分:
我还登录到其中一个节点并尝试运行 mpdboot。这是这样做的输出
[n@79 ~]$ mpdboot -n 4 -r ssh
n@75的密码:xxx
n@77的密码:xxx
n@79的密码:xxx
n@80的密码:xxx
mpdboot_79_0 (mpdboot 499):在 1 75 的 mpd(boot) 启动期间检测到问题;输出:
权限被拒绝,请重试。
n@75 的密码:权限被拒绝,请重试。
n@77 的密码:mpdboot_79_0 (mpdboot 515):在 2 77 的 mpd(boot) 启动期间检测到问题;输出:
权限被拒绝,请重试。
权限被拒绝(公钥、gssapi-with-mic、密码)。
n@77 的密码:权限被拒绝,请重试。
权限被拒绝(公钥、gssapi-with-mic、密码)。
我应该如何处理这个问题?
linker - MPI 和 D:链接器选项
我正在尝试将 MPI 与 D 编程语言一起使用。D完全支持C ABI,可以链接和调用任何C代码。我已经完成了显而易见的工作并将 MPI 标头翻译为 D。然后我将一个测试程序从 Wikipedia翻译为 D。我使用以下命令对其进行了编译:
dmd test.d -L-lmpistubs
它在我运行时有效./test
,并打印:
0: We have 1 processors
但是,当我运行时mpiexec -n 8 test
,它什么也不打印。我的理解是 MPI 可执行文件需要一堆奇怪的链接选项,这就是为什么mpicc
存在像这样的工具来自动化该过程的原因。但是,如果我尝试在 D 中使用 MPI,这对我没有帮助。我认为这是因为我没有使用正确的链接器选项。有人可以告诉我做什么mpicc
以及如何让 DMD 做同样的事情吗?
编辑:我使用mpicc -showme
. 这显示了mpicc
转发到的命令gcc
。但是,我也意识到我做的头文件翻译错误。下一个问题: 如何做到正确。
mpi - 为什么我不能让 mpiexec 连接到另一个节点?
我正在尝试通过在 Windows XP 上运行的 MPI (MPICH2) 设置分布式计算集群。我正在尝试按照以下方式运行单个命令
可能的原因是什么?我知道网络很好,因为 ping 有效:
mpiexec.exe 和 smtpd.exe 在 Windows 防火墙中都被列为例外。
这个问题的可能原因是什么?我的 Google-fu 让我失望了!(这可能与身份验证有关吗?我尝试使用-logon,但这并没有改变任何事情。如果可能是身份验证问题,我怎样才能找到我自己的用户名/密码(或者它是否使用计算机用户名/密码)?)
请原谅无知,因为我不熟悉 MPI 的工作原理。
visual-studio - Microsoft MPI 不运行
我正在尝试微软的 MPI 实现。我从这里安装了 CCP sdk:
http://www.microsoft.com/en-us/download/details.aspx?id=239
然后在我的项目设置中,我添加了包含文件夹、lib 文件夹并提到了 msmpi.lib。
使用其余设置,我构建程序,然后在命令提示符中继续运行程序,但启动后没有任何反应。
这是代码(它应该显示每个线程的 id 号):
一旦我运行 mpiexec.exe(命令在注释中),程序什么也不做,直到我按下 Ctrl-C。有谁知道我做错了什么?构建程序时没有错误,如果我从 Visual Studio 运行它,就好像只启动了一个进程。
mpi - mpiexec 无法启动指定的应用程序 (Raspberry pi)
对于以下 3 个命令中的每一个,我都会收到相同的错误。是我来自 ifconfig 的 IP 地址。关于出了什么问题的任何想法?昨晚效果很好。
我正在学习来自http://www.southampton.ac.uk/~sjc/raspberrypi/pi_supercomputer_southampton.htm的教程
system - 在调用“系统”调用 mpiexec 后,STDIN 似乎被破坏
这是我第一次在这里发帖,所以请原谅任何格式问题。
我有一个交互式程序,它产生外部进程并监视它们的 IO。一切正常,直到我用“mpiexec”生成了一些东西,之后 STDIN 似乎中断了。
我意识到这对于大多数人来说很难重现,但如果有人看到任何明显的东西或知道这个问题......请帮忙!
这是一个片段:
我尝试了很多不同的东西,例如管道、显式分叉、细致的描述符管理。最奇怪的是,如果我关闭并保存标准输入,然后在“mpiexec”返回后恢复它,那么我不再在 std::cin 上获得 EOF,而是 std::getline(std::cin,... ) 不再阻塞!程序进入一个无限循环,在 std::readline 调用中从 std::cin 读取零字节。
如果,当外部进程在 mpiexec 下运行时,我将一堆数据堆叠到 std::cin 中(例如通过键入),然后对 std::readline 的后续调用正确解析我卡在其中的数据行,但是再次......一旦完成读取该数据,它就会继续进入无限循环(即即使没有要读取的数据也不会阻塞 std::readline(std::cin,..) !呃。很烦人。
任何帮助都深表感谢。
干杯!
shell - 如何在 linux shell 中使用 mpiexec
我有一个文件 a.txt ,每一行都包含一个参数。现在我想使用 mpiexec 来调用我的程序,例如 a.out 来计算每个参数。所以我使用 linux shell 脚本来处理这个问题。代码是示例
没想到脚本只处理了一行文件a.txt就结束了。那么,是因为管道使用不当造成的吗?我该如何解决这个问题?
python-2.7 - python mpi包装器的新macport openmpi错误
前段时间我们为 python 编写了自己的 mpi 包装器。在我最近升级到之后,一切都在 mac 上运行良好:
以下代码的所有内容都运行良好,并且仍然在 linux 上运行,尽管版本可能不同。但是,这是代码。这些函数本质上是包装器。
调用 init() 会出现以下错误:
消息类型不可重现,并且似乎是未初始化的内存段。任何人的想法?
谢谢, EL