问题标签 [xeon-phi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
750 浏览

erlang - 在 Xeon Phi 上运行 Erlang

如何在英特尔至强融核协处理器上编译 VM 并运行 Erlang 程序?

0 投票
2 回答
285 浏览

c++ - 英特尔至强融核 - 运行多个单线程可执行文件

我试图找出是否可以使用英特尔至强融核协处理器来“并行化”以下问题:

假设我有 2000 个文件需要由单线程可执行文件处理。对于每个文件,可执行文件读取它,执行它的操作并将其输出到相应的输出文件,然后退出。

例如:

这些工具不是为多线程执行或循环文件而编码的,我们现在也不希望更改其代码中的任何内容。它们是用 C 语言编写的,带有一些外部库。

我的问题是:

  1. 这种“脚本循环”能否在 Xeon Phi 的本机操作系统上运行,使其并行调用可执行文件,从而在其所有内核上同时运行?它足够“通用”吗?

  2. 文件本身很小,所以它的 8GB 内存足以在运行时存储数据,但不能将所有输出保存在设备上,所以我需要在主机上输出。所以我的第二个问题是:这种内存交换是否可能“在外部”?

即不是编码到工具中,而是由主机操作系统和设备管理,用于可执行文件的每次执行。

  1. 如果这是可能的,它能否以任何方式提供性能提升,或者内存和线程分配瓶颈是否过于密集?基本上每次执行都需要几秒钟,具体取决于输入文件的长度,但我很有信心这比传输文件所需的时间长几个数量级。
0 投票
2 回答
845 浏览

gcc - 使用 gcc 进行英特尔至强 phi 编程

我有点想买英特尔至强 phi 协处理器,因为有一个型号似乎要 230 美元。我有两个问题。我是否可以仅使用 gcc 和 openmp 来充分利用它的功能,还是需要 intel 编译器。另外,这个模型是什么让它如此便宜?

http://www.amazon.com/Intel-BC31S1P-Xeon-31S1P-Coprocessor/dp/B00OMCB4JI/ref=sr_1_2?ie=UTF8&qid=1444411560&sr=8-2&keywords=intel+xeon+phi

0 投票
2 回答
1240 浏览

openmp - Xeon Phi 协处理器 vs Xeon Phi 主机处理器?

主处理器和协处理器有什么区别?特别是至强融核协处理器和至强融核主机处理器?

我在这些机器上获得了一些性能结果(正在运行扩散方程的并行 OpenMP 代码),这表明当相同数量的线程工作时,主处理器的工作速度要快得多。我想知道差异并将它们与我的结果联系起来。

0 投票
2 回答
842 浏览

c++ - 内核不等待事件

我的内核调用有问题。我的代码如下所示:

当我运行它时,它不会进入内核代码,但是当我将“make_kernel”调用更改为:

它进入内核,但我不确定“arrayFirst”的内存是否正确分配,我检查了 OpenCl 1.2 Wrapper 的文档,我发现调用应该如下所示:

但是当我尝试传递事件向量的地址时,我得到编译错误,没有合适的方法具有以下参数..

错误:

有人知道我做错了什么吗?

0 投票
1 回答
108 浏览

c++ - cBLAS 矩阵乘法调用不适用于 1XN 和 NxN 矩阵

我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的电话如下:

但是我在 C 中得到的只是 A 的副本。

以下是该方法的文档:https ://software.intel.com/en-us/node/429920

我已经多次检查了这些参数,它们看起来都很好,所以我想知道是否有人能指出我在做什么愚蠢的事情?

0 投票
2 回答
450 浏览

linux-kernel - 如何检查 MKL 调用是否在 Xeon Phi 上以正确数量的线程运行?

我正在运行 60 个 MPI 进程,并且 MKL_THREAD_NUM 设置为 4,以使我能够使用 Xeon Phi 上的全部 240 个硬件线程。我的代码正在运行,但我想确保 MKL 实际上使用 4 个线程。使用有限的 Xeon Phi linux 内核检查这一点的最佳方法是什么?

0 投票
2 回答
1177 浏览

c - 在 XeonPhi 上使用 AVX 内联汇编的向量求和

我是使用 XeonPhi 英特尔协处理器的新手。我想使用 AVX 512 位指令为简单的向量和编写代码。我使用 k1om-mpss-linux-gcc 作为编译器并想编写内联汇编。这是我的代码:

但是,当我运行程序时,我的 asm 部分出现了分段错误。有人可以帮我吗???

谢谢

0 投票
1 回答
765 浏览

c - `vmovaps' 的分段错误

我编写了一个代码,在 Xeon Phi 英特尔协处理器上使用带有(512 位长向量)的 KNC 指令添加两个数组。但是,我在内联汇编部分中有分段部分。

这是我的代码:

我使用 gcc 作为编译器(因为我没有钱购买 intel 编译器)。这是我编译这段代码的命令行:


问题出在内联汇编中。以下内联汇编修复了它。

0 投票
1 回答
346 浏览

c - 如何在 Xeon Phi 中传递 struct 以卸载

我有struct A几个int和一个int *成员。如何在卸载中使用它?

我可能做不到#pragma offload target(mic: 0) inout(A){}……但是呢?

#pragma offload target(mic: 0) in(A->firstInt, A->secondInt) inout(A->intPointer:length(A->firstInt*A->secondInt)){}

但是当我尝试这个时,我error: invalid entity for this variable list in offload clause在编译时得到了回应