问题标签 [intel-mic]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
memory-alignment - 由于 MIC 上的数据对齐问题导致的分段错误
我有两个数组说'fa'和'tempxyz'。我需要从另一个中减去一个并将其存储在另一个数组中。我正在使用流媒体商店。所以我需要有对齐的访问权限。我对齐了这两个数组以及第三个数组。我仍然得到一个段。过错。对于流式存储,数组应该是 64 字节对齐的。这是否意味着数组的每个元素都应该相隔 64 个字节,以便每个元素的地址都是 64 的倍数?我在下面给出了我的代码片段。请帮帮我。
c++ - 英特尔至强融核卸载代码 + STL 矢量
我想将存储在 STL 矢量中的数据复制到英特尔至强融核协处理器。在我的代码中,我创建了包含计算所需数据的向量的类。我想在主机上创建类对象,也在主机上初始化数据,然后我想将此对象发送到协处理器。这是一个简单的代码,它说明了我想要做什么。将对象复制到协处理器后,向量为空。有什么问题?如何正确执行?
openmp - libiomp5.so(带有 ompt 支持)无法在卸载 openmp 环境中触发 ompt_initialize()
我正在使用 openmp 运行时运行英特尔 MIC 卸载 openmp 应用程序(CPU 端和 MIC 端都支持 ompt),而 CPU 端的 libiomp5.so 可以触发其 ompt_intialize() 并获取配置文件数据 libiomp5.so MIC 端无法触发其 ompt_initialize(),因此无法获取所需的配置文件数据。我想知道问题出在哪里。
c++ - 英特尔 MIC - 固有向量元素的总和
我有一个 __m512d 内在向量,我需要他的元素的总和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我对内在的了解不足以自己做,所以我需要你的帮助。
谢谢 :)
c++ - 使用对齐的数据卸载到英特尔 MIC
当我编译下面的代码时,我收到警告:
尽管我认为我已经处理了所有需要的对齐方式。当我执行它时,我得到一个分段错误。
有人知道我怎样才能让它工作吗?
编码:
c++ - 英特尔 MIC - 卸载错误:数据传输
我在将数据从 Intel Xeon Phi 协处理器传输到主机 CPU 时遇到问题。我尝试使用卸载模型来实现计算。在我的计算开始时,我将所有数据传输到协处理器(一个数组)。计算后,我只想将此数组的一部分传输到主机处理器,但结果出现以下错误:
卸载错误:数据传输(base=0x75654640,size=7896016)不是现有分配的子集(base=0x75654640,size=4512008)
以下是部分源代码:
在这种情况下,这个数组的大小 = 564001,micBegin = 423001,micEnd = 564001。我需要传输数据,因为它们被 CPU 使用。什么是问题?如何解决?
gcc - What it takes to make OpenACC/OpenMP4.0 offloading to nvidia/mic work om GCC?
I am trying to understand how exactly I can use OpenACC to offload computation to my nvidia GPU on GCC 5.3. The more I google things the more confused I become. All the guides I find, they involve recompiling the entire gcc along with two libs called nvptx-tools
and nvptx-newlib
. Other sources say that OpenACC is part of GOMP library. Other sources say that the development for OpenACC support will continue only on GCC 6.x. Also I have read that support for OpenACC is in the main brunch of GCC. However if I compile a program with -fopenacc
and -foffload=nvptx-non
is just wont work. Can someone explain to me what exactly it takes to compiler and run OpenACC code with gcc 5.3+?
- Why some guides seem to require (re)compilation of
nvptx-tools
,nvptx-newlib
, and GCC, if, as some internet sources say, OpenACC support is part of GCC's main branch? - What is the role of the GOMP library in all this?
- Is it true that development for OpenACC support will only be happening for GCC 6+ from now on?
- When OpenACC support matures, is it the goal to enable it in a similar way we enable OpenMP (i.e., by just adding a couple of compiler flags)?
- Can someone also provide answers to all the above after replacing "OpenACC" with "OpenMP 4.0 GPU/MIC offload capability"?
Thanks in advance
xeon-phi - 如何将我的工作绑定到英特尔至强 phi 协处理器?
我有一个带有四张麦克风卡 (mic0-mic3) 的服务器,它运行良好。如何将并行作业(mic_app)绑定到 mic0,其他并行作业无法在 mic0 中运行。如何检测 mic0 是否已为并行作业(mic_app)运行。
intel-mic - 如何禁用英特尔至强 phi 协处理器?
我有一个带有四个麦克风卡 (mic0-mic3) 的服务器,它运行良好。我想禁用一些麦克风,例如 mic3,现在只有 mic0 - mic2 可用。我应该怎么办?