问题标签 [hpc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1615 浏览

c - Halo 交换在 MPI 中无法正常工作

我正在编写一些在大型 3D 网格上进行计算的代码,并使用光环交换程序,以便它可以使用 MPI 工作。我从我的代码中得到了错误的结果,我很确定这是因为光环交换无法正常工作。

基本上我有一个大的 3D 数组,其中的一部分保存在每个进程中。每个进程都有一个数组,该数组的每个维度比它所保存的数据块大 2 个元素 - 这样我们就可以在数组的每个面进行光环交换,而不会影响存储在数组其余部分中的数据。我有以下代码来进行光环交换通信:

g->nx,g->nyg->nz是该进程所持有的数组块的大小,g->west, g->east, g->north, g->south,g->upg->down是每个方向上相邻进程的等级,使用以下代码找到:

每个进程上的数组定义为:

(它有两个副本,因为一旦我完成了光环交换,我每次都需要通过我的更新程序更新一个副本)。

谁能告诉我我是否正确地进行了沟通?特别是向量类型的定义。我在代码中定义的向量类型会提取 3D 数组的每个面吗?MPI_Sendrecv 调用看起来正确吗?

我完全不知道为什么我的代码不起作用,但我很确定它与通信有关。

0 投票
1 回答
637 浏览

c# - Windows HPC 和 Azure

我的公司正在测试/比较各种网格+云替代方案以执行科学计算。
我已经阅读了 David Chappell 撰写的关于 HPC/Azure 主题的有趣白皮书,从“概念”的角度来看,它非常出色,但由于这是相当新的和前沿的,我很难找到一个完整的安装“愚蠢指南”一个 HPC 服务器,将节点放在云上,带有一个虚拟的“Hello HPC-Cloud World”多线程 .Net 程序。

我已经阅读/尝试了几天的东西,我不得不承认这是一片茂密的森林,所以我有点迷路了。我们负担不起仅仅为了给 HPC 一个机会就分配一个整月的资源。如果有人可以提供帮助,那将为像我们这样的初次测试者和冒险家节省宝贵的时间:-)

和平。

注意:在这里期待评论/要求更精确的问题:我理想地寻找的是从头开始的操作指南,关于如何在现场安装 HPC 服务器,在 Azure 节点(或其他一些 Windows服务器 R2 虚拟机(理想情况下)(即云部分),并部署一个虚拟的“hello-world”.Net 应用程序,该应用程序具有数百个线程,这些线程将分配给不同的节点(即网格部分)

编辑 1: MS 提供了一个非常好的在线 HPC 虚拟实验室。不幸的是,它一直在不停地挤压,所以我们正在寻找一个普通的“纸质”指南。

编辑 2: 听...你在这声音???仔细听……那是沙漠中吹来的风声。“Feeeeeeeeeeeeeeeeewwwwwwwwwwwww”......看到那里滚动的风滚草了吗?这是我悲伤而孤独的问题,等待有人回答:-)

0 投票
2 回答
875 浏览

sql-server - SSIS 并行 - Microsoft HPC 集群?

我是 SSIS 的新手,正在尝试使用它的并行功能从数据库中导入数据。

我的工作是做到这一点:尽快将一个多 TB 的数据库导入一组平面文件。

我在想这个:

我有一个 Microsoft Server 2008 HPC 集群(3 个节点)供我使用。我正在考虑编写一个 HPC SOA 作业,以便所有三个计算节点都可以独立连接到 SQL Server 并并行导入部分数据。当然,这与 SSIS 无关,是一个独立的实用程序。

然后我遇到了 SSIS,以及它的并行导入功能。我的 SSIS 服务器不是很高端——只有 4GB 的机器。我有点倾向于使用 SSIS,因为这是 Microsoft 进行数据导入的理想方式——而且我不必重写很多东西,也不必使用现有的转换等。

使用自定义任务(或可用任务)并并行导入的最佳方式是什么?

0 投票
1 回答
109 浏览

windows-server-2008-r2 - 自动发现 HPC 头节点/代理节点

我想在 UI 组件上做一个下拉菜单,让我的用户选择他们想要提交工作的 Headnode/Brokernode。我想用网络上的负责人/经纪人填充这个下拉列表。

更进一步,最好提供一些关于所选节点上可用的 SOA 服务的反馈。

任何想法或建议以一种简洁的方式做到这一点将不胜感激!

谢谢!

-编辑-您可以使用活动目录,如 Microsoft 示例所示

http://msdn.microsoft.com/en-us/library/cc907077(v=vs.85).aspx

0 投票
1 回答
250 浏览

powershell - MS Compute Cluster 2003 命令行 - Powershell WMI

我有一个带有一个头节点和多个计算节点的计算集群安装。这是在多个环境之间共享的。当有无人值守的构建升级时,我遇到了问题。Robocopy 无法抱怨正在使用的文件。

是否有任何 WMI 类可用于获取有关正在使用的环境的信息?如果可能的话,我可以停止为该特定环境运行的进程并继续升级。

任何帮助表示赞赏。

谢谢!桑吉夫

0 投票
1 回答
759 浏览

client - Microsoft HPC SetCreds 导致服务器拒绝了客户端凭据

我正在尝试使用 cluscfg setcreds /scheduler:scheduler1 /user:domain2\user1 /password:pass 设置凭据(用于运行作业)

我收到“服务器已拒绝客户端凭据”

客户端计算机位于 domain1 中。

问题: 1. 这与跨域有关吗?2. 这和账户的某些属性有关吗?该帐户没有足够的特权来运行 HPC 作业?

0 投票
3 回答
611 浏览

c - OpenCL 代码在 MBP 上比在 NVIDIA GTX 480 上运行得更快

我遇到了一个奇怪的问题。我在 OpenCL 中实现了一些线性代数,到目前为止只有矩阵乘法,并且一直在我的笔记本电脑上进行测试。代码非常简单:

我通过运行代码 100 次来测试硬件,如下所示:

在我的 MBP 矩阵乘法上大约需要 1.2 毫秒,在大小为 512*512 的矩阵上,而在 GTX 480 Linux 机器上运行相同的代码大约需要 3 毫秒。这让我很困扰,因为我不希望昂贵的 GTX 卡比笔记本电脑快一点。

据我所见,我的代码要么是“错误的”,要么是我以某种错误的方式计时。

我尝试在 OpenCL 规范中使用基于事件的计时系统,这给出了一些更真实的结果。

现在 GT330M 将在 46 毫秒内完成操作,而 GTX480 在 2.5 毫秒内完成。这就引出了另一个非常有趣的问题,开启 PROFILING 后,GT 330M 的速度会慢 30 倍左右,这是有道理的,但 GTX480 保持了相同的性能。谁能解释这是为什么?

0 投票
2 回答
496 浏览

c - HPC中的UPC——经验与建议

我目前正在探索统一并行 C 的某些方面,以替代 HPC 中的标准并行化方法(如 MPI、OpenMP 或混合方法)。

我的问题是:有没有人在大型应用程序(~>10.000 个内核)的 UPC 性能方面有经验?我主要对共享内存的访问速度感兴趣。显然,这取决于底层硬件、网络连接、操作系统、编译器等。但我通常对使用 UPC 解决任何类型的“现实世界”问题感兴趣。

此外,您对 UPC 的总体印象如何?你认为它有可能在未来比现在更广泛地使用吗?是否值得切换到它?

欢迎任何意见!

非常感谢,马克

0 投票
3 回答
1752 浏览

hpc - 与高性能计算或类似领域相关的本科项目

我正在为我的本科项目寻找想法,我非常喜欢高性能计算领域,有很多研究空间。是否有任何想法/已经存在的开源项目值得一看?

0 投票
1 回答
370 浏览

fortran - 没有指令的高性能 Fortran (HPF)?

在高性能 Fortran (HPF) 中,我可以使用DISTRIBUTE指令指定并行计算中涉及的数组的分布。例如,以下最小子例程将并行对两个数组求和:

我的问题是,该DISTRIBUTE指令是否必要?我知道在实践中这没什么兴趣,但我很好奇一个朴素的、无指令的 Fortran 程序是否也可以是一个有效的 HPF 程序?