问题标签 [xeon-phi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
erlang - 在 Xeon Phi 上运行 Erlang
如何在英特尔至强融核协处理器上编译 VM 并运行 Erlang 程序?
c++ - 英特尔至强融核 - 运行多个单线程可执行文件
我试图找出是否可以使用英特尔至强融核协处理器来“并行化”以下问题:
假设我有 2000 个文件需要由单线程可执行文件处理。对于每个文件,可执行文件读取它,执行它的操作并将其输出到相应的输出文件,然后退出。
例如:
这些工具不是为多线程执行或循环文件而编码的,我们现在也不希望更改其代码中的任何内容。它们是用 C 语言编写的,带有一些外部库。
我的问题是:
这种“脚本循环”能否在 Xeon Phi 的本机操作系统上运行,使其并行调用可执行文件,从而在其所有内核上同时运行?它足够“通用”吗?
文件本身很小,所以它的 8GB 内存足以在运行时存储数据,但不能将所有输出保存在设备上,所以我需要在主机上输出。所以我的第二个问题是:这种内存交换是否可能“在外部”?
即不是编码到工具中,而是由主机操作系统和设备管理,用于可执行文件的每次执行。
- 如果这是可能的,它能否以任何方式提供性能提升,或者内存和线程分配瓶颈是否过于密集?基本上每次执行都需要几秒钟,具体取决于输入文件的长度,但我很有信心这比传输文件所需的时间长几个数量级。
gcc - 使用 gcc 进行英特尔至强 phi 编程
我有点想买英特尔至强 phi 协处理器,因为有一个型号似乎要 230 美元。我有两个问题。我是否可以仅使用 gcc 和 openmp 来充分利用它的功能,还是需要 intel 编译器。另外,这个模型是什么让它如此便宜?
openmp - Xeon Phi 协处理器 vs Xeon Phi 主机处理器?
主处理器和协处理器有什么区别?特别是至强融核协处理器和至强融核主机处理器?
我在这些机器上获得了一些性能结果(正在运行扩散方程的并行 OpenMP 代码),这表明当相同数量的线程工作时,主处理器的工作速度要快得多。我想知道差异并将它们与我的结果联系起来。
c++ - 内核不等待事件
我的内核调用有问题。我的代码如下所示:
当我运行它时,它不会进入内核代码,但是当我将“make_kernel”调用更改为:
它进入内核,但我不确定“arrayFirst”的内存是否正确分配,我检查了 OpenCl 1.2 Wrapper 的文档,我发现调用应该如下所示:
但是当我尝试传递事件向量的地址时,我得到编译错误,没有合适的方法具有以下参数..
错误:
有人知道我做错了什么吗?
c++ - cBLAS 矩阵乘法调用不适用于 1XN 和 NxN 矩阵
我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的电话如下:
但是我在 C 中得到的只是 A 的副本。
以下是该方法的文档:https ://software.intel.com/en-us/node/429920
我已经多次检查了这些参数,它们看起来都很好,所以我想知道是否有人能指出我在做什么愚蠢的事情?
linux-kernel - 如何检查 MKL 调用是否在 Xeon Phi 上以正确数量的线程运行?
我正在运行 60 个 MPI 进程,并且 MKL_THREAD_NUM 设置为 4,以使我能够使用 Xeon Phi 上的全部 240 个硬件线程。我的代码正在运行,但我想确保 MKL 实际上使用 4 个线程。使用有限的 Xeon Phi linux 内核检查这一点的最佳方法是什么?
c - 在 XeonPhi 上使用 AVX 内联汇编的向量求和
我是使用 XeonPhi 英特尔协处理器的新手。我想使用 AVX 512 位指令为简单的向量和编写代码。我使用 k1om-mpss-linux-gcc 作为编译器并想编写内联汇编。这是我的代码:
但是,当我运行程序时,我的 asm 部分出现了分段错误。有人可以帮我吗???
谢谢
c - `vmovaps' 的分段错误
我编写了一个代码,在 Xeon Phi 英特尔协处理器上使用带有(512 位长向量)的 KNC 指令添加两个数组。但是,我在内联汇编部分中有分段部分。
这是我的代码:
我使用 gcc 作为编译器(因为我没有钱购买 intel 编译器)。这是我编译这段代码的命令行:
问题出在内联汇编中。以下内联汇编修复了它。
c - 如何在 Xeon Phi 中传递 struct 以卸载
我有struct A
几个int
和一个int *
成员。如何在卸载中使用它?
我可能做不到#pragma offload target(mic: 0) inout(A){}
……但是呢?
#pragma offload target(mic: 0) in(A->firstInt, A->secondInt) inout(A->intPointer:length(A->firstInt*A->secondInt)){}
但是当我尝试这个时,我error: invalid entity for this variable list in offload clause
在编译时得到了回应