问题标签 [hpc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - Halo 交换在 MPI 中无法正常工作
我正在编写一些在大型 3D 网格上进行计算的代码,并使用光环交换程序,以便它可以使用 MPI 工作。我从我的代码中得到了错误的结果,我很确定这是因为光环交换无法正常工作。
基本上我有一个大的 3D 数组,其中的一部分保存在每个进程中。每个进程都有一个数组,该数组的每个维度比它所保存的数据块大 2 个元素 - 这样我们就可以在数组的每个面进行光环交换,而不会影响存储在数组其余部分中的数据。我有以下代码来进行光环交换通信:
g->nx
,g->ny
和g->nz
是该进程所持有的数组块的大小,g->west
, g->east
, g->north
, g->south
,g->up
和g->down
是每个方向上相邻进程的等级,使用以下代码找到:
每个进程上的数组定义为:
(它有两个副本,因为一旦我完成了光环交换,我每次都需要通过我的更新程序更新一个副本)。
谁能告诉我我是否正确地进行了沟通?特别是向量类型的定义。我在代码中定义的向量类型会提取 3D 数组的每个面吗?MPI_Sendrecv 调用看起来正确吗?
我完全不知道为什么我的代码不起作用,但我很确定它与通信有关。
c# - Windows HPC 和 Azure
我的公司正在测试/比较各种网格+云替代方案以执行科学计算。
我已经阅读了 David Chappell 撰写的关于 HPC/Azure 主题的有趣白皮书,从“概念”的角度来看,它非常出色,但由于这是相当新的和前沿的,我很难找到一个完整的安装“愚蠢指南”一个 HPC 服务器,将节点放在云上,带有一个虚拟的“Hello HPC-Cloud World”多线程 .Net 程序。
我已经阅读/尝试了几天的东西,我不得不承认这是一片茂密的森林,所以我有点迷路了。我们负担不起仅仅为了给 HPC 一个机会就分配一个整月的资源。如果有人可以提供帮助,那将为像我们这样的初次测试者和冒险家节省宝贵的时间:-)
和平。
注意:在这里期待评论/要求更精确的问题:我理想地寻找的是从头开始的操作指南,关于如何在现场安装 HPC 服务器,在 Azure 节点(或其他一些 Windows服务器 R2 虚拟机(理想情况下)(即云部分),并部署一个虚拟的“hello-world”.Net 应用程序,该应用程序具有数百个线程,这些线程将分配给不同的节点(即网格部分)
编辑 1: MS 提供了一个非常好的在线 HPC 虚拟实验室。不幸的是,它一直在不停地挤压,所以我们正在寻找一个普通的“纸质”指南。
编辑 2: 听...你在这声音???仔细听……那是沙漠中吹来的风声。“Feeeeeeeeeeeeeeeeewwwwwwwwwwwww”......看到那里滚动的风滚草了吗?这是我悲伤而孤独的问题,等待有人回答:-)
sql-server - SSIS 并行 - Microsoft HPC 集群?
我是 SSIS 的新手,正在尝试使用它的并行功能从数据库中导入数据。
我的工作是做到这一点:尽快将一个多 TB 的数据库导入一组平面文件。
我在想这个:
我有一个 Microsoft Server 2008 HPC 集群(3 个节点)供我使用。我正在考虑编写一个 HPC SOA 作业,以便所有三个计算节点都可以独立连接到 SQL Server 并并行导入部分数据。当然,这与 SSIS 无关,是一个独立的实用程序。
然后我遇到了 SSIS,以及它的并行导入功能。我的 SSIS 服务器不是很高端——只有 4GB 的机器。我有点倾向于使用 SSIS,因为这是 Microsoft 进行数据导入的理想方式——而且我不必重写很多东西,也不必使用现有的转换等。
使用自定义任务(或可用任务)并并行导入的最佳方式是什么?
windows-server-2008-r2 - 自动发现 HPC 头节点/代理节点
我想在 UI 组件上做一个下拉菜单,让我的用户选择他们想要提交工作的 Headnode/Brokernode。我想用网络上的负责人/经纪人填充这个下拉列表。
更进一步,最好提供一些关于所选节点上可用的 SOA 服务的反馈。
任何想法或建议以一种简洁的方式做到这一点将不胜感激!
谢谢!
-编辑-您可以使用活动目录,如 Microsoft 示例所示
http://msdn.microsoft.com/en-us/library/cc907077(v=vs.85).aspx
powershell - MS Compute Cluster 2003 命令行 - Powershell WMI
我有一个带有一个头节点和多个计算节点的计算集群安装。这是在多个环境之间共享的。当有无人值守的构建升级时,我遇到了问题。Robocopy 无法抱怨正在使用的文件。
是否有任何 WMI 类可用于获取有关正在使用的环境的信息?如果可能的话,我可以停止为该特定环境运行的进程并继续升级。
任何帮助表示赞赏。
谢谢!桑吉夫
client - Microsoft HPC SetCreds 导致服务器拒绝了客户端凭据
我正在尝试使用 cluscfg setcreds /scheduler:scheduler1 /user:domain2\user1 /password:pass 设置凭据(用于运行作业)
我收到“服务器已拒绝客户端凭据”
客户端计算机位于 domain1 中。
问题: 1. 这与跨域有关吗?2. 这和账户的某些属性有关吗?该帐户没有足够的特权来运行 HPC 作业?
c - OpenCL 代码在 MBP 上比在 NVIDIA GTX 480 上运行得更快
我遇到了一个奇怪的问题。我在 OpenCL 中实现了一些线性代数,到目前为止只有矩阵乘法,并且一直在我的笔记本电脑上进行测试。代码非常简单:
我通过运行代码 100 次来测试硬件,如下所示:
在我的 MBP 矩阵乘法上大约需要 1.2 毫秒,在大小为 512*512 的矩阵上,而在 GTX 480 Linux 机器上运行相同的代码大约需要 3 毫秒。这让我很困扰,因为我不希望昂贵的 GTX 卡比笔记本电脑快一点。
据我所见,我的代码要么是“错误的”,要么是我以某种错误的方式计时。
我尝试在 OpenCL 规范中使用基于事件的计时系统,这给出了一些更真实的结果。
现在 GT330M 将在 46 毫秒内完成操作,而 GTX480 在 2.5 毫秒内完成。这就引出了另一个非常有趣的问题,开启 PROFILING 后,GT 330M 的速度会慢 30 倍左右,这是有道理的,但 GTX480 保持了相同的性能。谁能解释这是为什么?
c - HPC中的UPC——经验与建议
我目前正在探索统一并行 C 的某些方面,以替代 HPC 中的标准并行化方法(如 MPI、OpenMP 或混合方法)。
我的问题是:有没有人在大型应用程序(~>10.000 个内核)的 UPC 性能方面有经验?我主要对共享内存的访问速度感兴趣。显然,这取决于底层硬件、网络连接、操作系统、编译器等。但我通常对使用 UPC 解决任何类型的“现实世界”问题感兴趣。
此外,您对 UPC 的总体印象如何?你认为它有可能在未来比现在更广泛地使用吗?是否值得切换到它?
欢迎任何意见!
非常感谢,马克
hpc - 与高性能计算或类似领域相关的本科项目
我正在为我的本科项目寻找想法,我非常喜欢高性能计算领域,有很多研究空间。是否有任何想法/已经存在的开源项目值得一看?
fortran - 没有指令的高性能 Fortran (HPF)?
在高性能 Fortran (HPF) 中,我可以使用DISTRIBUTE
指令指定并行计算中涉及的数组的分布。例如,以下最小子例程将并行对两个数组求和:
我的问题是,该DISTRIBUTE
指令是否必要?我知道在实践中这没什么兴趣,但我很好奇一个朴素的、无指令的 Fortran 程序是否也可以是一个有效的 HPF 程序?