问题标签 [intel-mic]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
464 浏览

memory-alignment - 由于 MIC 上的数据对齐问题导致的分段错误

我有两个数组说'fa'和'tempxyz'。我需要从另一个中减去一个并将其存储在另一个数组中。我正在使用流媒体商店。所以我需要有对齐的访问权限。我对齐了这两个数组以及第三个数组。我仍然得到一个段。过错。对于流式存储,数组应该是 64 字节对齐的。这是否意味着数组的每个元素都应该相隔 64 个字节,以便每个元素的地址都是 64 的倍数?我在下面给出了我的代码片段。请帮帮我。

0 投票
3 回答
274 浏览

xeon-phi - 更改线程号不会影响代码

我正在尝试学习 xeon-phi ,并且在学习 Intel Xeon-Phi Coprocessor HPC 书籍时,我尝试在此处运行代码。(来自书)

该代码使用 openmp 和 2 个线程。

但是我得到的结果与使用 1 个线程运行的结果相同。(根本不使用openmp)

我什至在麦克风中使用了不同的组合,但仍然相同:

似乎以某种方式未启用openmp?我在这里遗漏了什么吗?

仅使用 1 个线程的代码在这里

我编译使用:

谢谢!

0 投票
1 回答
642 浏览

c++ - 英特尔至强融核卸载代码 + STL 矢量

我想将存储在 STL 矢量中的数据复制到英特尔至强融核协处理器。在我的代码中,我创建了包含计算所需数据的向量的类。我想在主机上创建类对象,也在主机上初始化数据,然后我想将此对象发送到协处理器。这是一个简单的代码,它说明了我想要做什么。将对象复制到协处理器后,向量为空。有什么问题?如何正确执行?

0 投票
1 回答
107 浏览

openmp - libiomp5.so(带有 ompt 支持)无法在卸载 openmp 环境中触发 ompt_initialize()

我正在使用 openmp 运行时运行英特尔 MIC 卸载 openmp 应用程序(CPU 端和 MIC 端都支持 ompt),而 CPU 端的 libiomp5.so 可以触发其 ompt_intialize() 并获取配置文件数据 libiomp5.so MIC 端无法触发其 ompt_initialize(),因此无法获取所需的配置文件数据。我想知道问题出在哪里。

0 投票
1 回答
240 浏览

c++ - 英特尔 MIC - 固有向量元素的总和

我有一个 __m512d 内在向量,我需要他的元素的总和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。

谢谢 :)

0 投票
1 回答
96 浏览

c++ - 使用对齐的数据卸载到英特尔 MIC

当我编译下面的代码时,我收到警告:

尽管我认为我已经处理了所有需要的对齐方式。当我执行它时,我得到一个分段错误。

有人知道我怎样才能让它工作吗?

编码:

0 投票
1 回答
217 浏览

c++ - 英特尔 MIC - 卸载错误:数据传输

我在将数据从 Intel Xeon Phi 协处理器传输到主机 CPU 时遇到问题。我尝试使用卸载模型来实现计算。在我的计算开始时,我将所有数据传输到协处理器(一个数组)。计算后,我只想将此数组的一部分传输到主机处理器,但结果出现以下错误:

卸载错误:数据传输(base=0x75654640,size=7896016)不是现有分配的子集(base=0x75654640,size=4512008)

以下是部分源代码:

在这种情况下,这个数组的大小 = 564001,micBegin = 423001,micEnd = 564001。我需要传输数据,因为它们被 CPU 使用。什么是问题?如何解决?

0 投票
1 回答
1180 浏览

gcc - What it takes to make OpenACC/OpenMP4.0 offloading to nvidia/mic work om GCC?

I am trying to understand how exactly I can use OpenACC to offload computation to my nvidia GPU on GCC 5.3. The more I google things the more confused I become. All the guides I find, they involve recompiling the entire gcc along with two libs called nvptx-tools and nvptx-newlib. Other sources say that OpenACC is part of GOMP library. Other sources say that the development for OpenACC support will continue only on GCC 6.x. Also I have read that support for OpenACC is in the main brunch of GCC. However if I compile a program with -fopenacc and -foffload=nvptx-non is just wont work. Can someone explain to me what exactly it takes to compiler and run OpenACC code with gcc 5.3+?

  • Why some guides seem to require (re)compilation of nvptx-tools, nvptx-newlib, and GCC, if, as some internet sources say, OpenACC support is part of GCC's main branch?
  • What is the role of the GOMP library in all this?
  • Is it true that development for OpenACC support will only be happening for GCC 6+ from now on?
  • When OpenACC support matures, is it the goal to enable it in a similar way we enable OpenMP (i.e., by just adding a couple of compiler flags)?
  • Can someone also provide answers to all the above after replacing "OpenACC" with "OpenMP 4.0 GPU/MIC offload capability"?

Thanks in advance

0 投票
1 回答
110 浏览

xeon-phi - 如何将我的工作绑定到英特尔至强 phi 协处理器?

我有一个带有四张麦克风卡 (mic0-mic3) 的服务器,它运行良好。如何将并行作业(mic_app)绑定到 mic0,其他并行作业无法在 mic0 中运行。如何检测 mic0 是否已为并行作业(mic_app)运行。

0 投票
1 回答
100 浏览

intel-mic - 如何禁用英特尔至强 phi 协处理器?

我有一个带有四个麦克风卡 (mic0-mic3) 的服务器,它运行良好。我想禁用一些麦克风,例如 mic3,现在只有 mic0 - mic2 可用。我应该怎么办?