问题标签 [xeon-phi]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

187 问题

0 投票

1 回答

750 浏览

erlang - 在 Xeon Phi 上运行 Erlang

如何在英特尔至强融核协处理器上编译 VM 并运行 Erlang 程序？

erlang cross-compiling xeon-phi beam

2015-09-21T19:49:51.777

0 投票

2 回答

285 浏览

c++ - 英特尔至强融核 - 运行多个单线程可执行文件

我试图找出是否可以使用英特尔至强融核协处理器来“并行化”以下问题：

假设我有 2000 个文件需要由单线程可执行文件处理。对于每个文件，可执行文件读取它，执行它的操作并将其输出到相应的输出文件，然后退出。

例如：

这些工具不是为多线程执行或循环文件而编码的，我们现在也不希望更改其代码中的任何内容。它们是用 C 语言编写的，带有一些外部库。

我的问题是：

这种“脚本循环”能否在 Xeon Phi 的本机操作系统上运行，使其并行调用可执行文件，从而在其所有内核上同时运行？它足够“通用”吗？
文件本身很小，所以它的 8GB 内存足以在运行时存储数据，但不能将所有输出保存在设备上，所以我需要在主机上输出。所以我的第二个问题是：这种内存交换是否可能“在外部”？

即不是编码到工具中，而是由主机操作系统和设备管理，用于可执行文件的每次执行。

如果这是可能的，它能否以任何方式提供性能提升，或者内存和线程分配瓶颈是否过于密集？基本上每次执行都需要几秒钟，具体取决于输入文件的长度，但我很有信心这比传输文件所需的时间长几个数量级。

c++concurrency xeon-phi

2015-10-01T07:34:45.763

0 投票

2 回答

845 浏览

gcc - 使用 gcc 进行英特尔至强 phi 编程

我有点想买英特尔至强 phi 协处理器，因为有一个型号似乎要 230 美元。我有两个问题。我是否可以仅使用 gcc 和 openmp 来充分利用它的功能，还是需要 intel 编译器。另外，这个模型是什么让它如此便宜？

http://www.amazon.com/Intel-BC31S1P-Xeon-31S1P-Coprocessor/dp/B00OMCB4JI/ref=sr_1_2?ie=UTF8&qid=1444411560&sr=8-2&keywords=intel+xeon+phi

gcc openmp xeon-phi

2015-10-09T17:29:18.590

0 投票

2 回答

1240 浏览

openmp - Xeon Phi 协处理器 vs Xeon Phi 主机处理器？

主处理器和协处理器有什么区别？特别是至强融核协处理器和至强融核主机处理器？

我在这些机器上获得了一些性能结果（正在运行扩散方程的并行 OpenMP 代码），这表明当相同数量的线程工作时，主处理器的工作速度要快得多。我想知道差异并将它们与我的结果联系起来。

openmp processor xeon-phi

2015-10-28T03:23:17.343

0 投票

2 回答

842 浏览

c++ - 内核不等待事件

我的内核调用有问题。我的代码如下所示：

当我运行它时，它不会进入内核代码，但是当我将“make_kernel”调用更改为：

它进入内核，但我不确定“arrayFirst”的内存是否正确分配，我检查了 OpenCl 1.2 Wrapper 的文档，我发现调用应该如下所示：

但是当我尝试传递事件向量的地址时，我得到编译错误，没有合适的方法具有以下参数..

错误：

有人知道我做错了什么吗？

c++opencl xeon-phi

2015-11-01T12:55:05.850

0 投票

1 回答

108 浏览

c++ - cBLAS 矩阵乘法调用不适用于 1XN 和 NxN 矩阵

我正在尝试使用 cblas_dgemm 对 1 x N 和 N x N 矩阵执行矩阵乘法。我的电话如下：

但是我在 C 中得到的只是 A 的副本。

以下是该方法的文档：https ://software.intel.com/en-us/node/429920

我已经多次检查了这些参数，它们看起来都很好，所以我想知道是否有人能指出我在做什么愚蠢的事情？

c++matrix lapack intel-mkl xeon-phi

2015-11-15T06:47:23.743

0 投票

2 回答

450 浏览

linux-kernel - 如何检查 MKL 调用是否在 Xeon Phi 上以正确数量的线程运行？

我正在运行 60 个 MPI 进程，并且 MKL_THREAD_NUM 设置为 4，以使我能够使用 Xeon Phi 上的全部 240 个硬件线程。我的代码正在运行，但我想确保 MKL 实际上使用 4 个线程。使用有限的 Xeon Phi linux 内核检查这一点的最佳方法是什么？

linux-kernel mpi intel-mkl xeon-phi

2015-11-20T20:11:04.997

0 投票

2 回答

1177 浏览

c - 在 XeonPhi 上使用 AVX 内联汇编的向量求和

我是使用 XeonPhi 英特尔协处理器的新手。我想使用 AVX 512 位指令为简单的向量和编写代码。我使用 k1om-mpss-linux-gcc 作为编译器并想编写内联汇编。这是我的代码：

但是，当我运行程序时，我的 asm 部分出现了分段错误。有人可以帮我吗？？？

谢谢

c linux inline-assembly xeon-phi avx512

2015-12-06T04:36:11.823

0 投票

1 回答

765 浏览

c - `vmovaps' 的分段错误

我编写了一个代码，在 Xeon Phi 英特尔协处理器上使用带有（512 位长向量）的 KNC 指令添加两个数组。但是，我在内联汇编部分中有分段部分。

这是我的代码：

我使用 gcc 作为编译器（因为我没有钱购买 intel 编译器）。这是我编译这段代码的命令行：

问题出在内联汇编中。以下内联汇编修复了它。

c linux gcc inline-assembly xeon-phi

2015-12-08T05:26:33.503

0 投票

1 回答

346 浏览

c - 如何在 Xeon Phi 中传递 struct 以卸载

我有struct A几个int和一个int *成员。如何在卸载中使用它？

我可能做不到#pragma offload target(mic: 0) inout(A){}……但是呢？

#pragma offload target(mic: 0) in(A->firstInt, A->secondInt) inout(A->intPointer:length(A->firstInt*A->secondInt)){}

但是当我尝试这个时，我error: invalid entity for this variable list in offload clause在编译时得到了回应

c openmp xeon-phi

2015-12-09T18:49:03.760

1 2 3 4 5 6 7 8 9 10