问题标签 [xeon-phi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1654 浏览

python - 在 Xeon Phi 上运行 Python

我想将可使用 Python 编写脚本的半高性能计算代码移植到 Xeon Phi,以尝试提高性能;它不能在卸载模式下运行(数据传输会令人望而却步),整个代码必须在协处理器上运行。

有知识的人可以确认这意味着我必须为 Xeon Phi 架构“交叉编译”所有库(包括 Python),将这些库安装在 Xeon Phi 上的 NFS 上,然后在那里执行吗?

对于交叉编译:目标拱门是什么?当然,对于数字,由于扩展的内在函数,xeon-phi 是必须的,但是对于例如 Python,二进制文件和库是否与 amd64 二进制兼容?这将使它更容易,基本上只更改数字运算部分的一些标志。

更新:为了记录,我们在论坛上得到了来自英特尔的非常糟糕的支持;意识到软件堆栈的技术状态不佳(yocto 无法编译等),文档很少等等,我们放弃了这条路。再见,至强融核。

0 投票
1 回答
657 浏览

gpu - Coprocessor accelerators compared to GPUs

Are coprocessors like Intel Xeon-Phi supposed to be utilized much like the GPUs, so that one should offload a large amount of blocks executing a single kernel, so that only the overall throughput the coprocessor handles results in a speed up, OR offloading independent threads (tasks) will increase the efficiency as well?

0 投票
1 回答
84 浏览

intel - 英特尔至强融核能否直接从其他 PCI 设备获取数据?

英特尔至强融核能否配置为直接从 FPGA 板接收数据、处理它们并将结果发送到主机内存?

我有大量的输入数据,不想通过 PCI 进行冗余传输(FPGA 板 -> 主机内存 -> MIC-> 主机内存)。我想要更优雅的方案(FPGA板-> MIC->主机内存)可以吗?

0 投票
2 回答
961 浏览

bash - Xeon Phi 无法执行二进制文件

我正在尝试在 xeon phi 协处理器上执行二进制文件,它返回“bash:无法执行二进制文件”。所以我试图找到如何查看错误日志或让它显示当我告诉它执行导致它不起作用时发生的事情。我已经尝试过了bash --verbose,但它没有显示任何其他信息。有任何想法吗?

0 投票
1 回答
79 浏览

linux - 为不同平台重新编译加密货币文件

我正在尝试调整 cryptonight-algorithm 加密货币的一些源文件,以便它可以在嵌入到 xeon phi 上的 linux uOS 上运行,但是当有许多不同的源文件构成一个二进制文件时,我不确定如何编译。关于如何使用英特尔编译器来做到这一点的任何想法,或者真的有任何其他方式来做到这一点?

0 投票
1 回答
437 浏览

c++ - 英特尔 MIC 上的英特尔 TBB 和 Cilk Plus 线程关联

我想使用 Intel TBB 和 Cilk Plus 为 Intel Xeon Phi 编写并行代码,但我遇到了线程关联性问题。我想将一个线程绑定到一个逻辑核心。是否可以像在 OpenMP 中一样设置亲和力?我的意思是 KMP_AFFINITY="compact"。先感谢您。:)

0 投票
2 回答
246 浏览

multithreading - 我如何知道我的 CPU 是在内核之间共享向量寄存器,还是每个内核都有自己的私有寄存器?

我如何知道我的 CPU 是在内核之间共享向量寄存器,还是每个内核都有自己的私有寄存器?

我在哪里可以获得参考资料?

我希望使用多线程和 SIMD 来优化我的程序的浮点计算。它们会引起任何冲突吗?

0 投票
0 回答
577 浏览

cpu - How to monitor the utilization of cores on Xeon Phi at 10Hz?

I've been trying to measure/monitor the utilization of all those 60 cores on Xeon Phi (Knights Corner, in-order processors) at a relatively high frequency, say, at least every 0.1s which yields to 10Hz.

I tried the latest PAPI library. But it only supports PAPI_TOT_INS which is the counter of completed instructions. This won't work because I actually need something related to the instructions issued every 0.1s, not finished. Several instructions issued at different cycles may finish at the same cycle. The issue of instructions is influenced by whether the core is halted or not.

Other commands available like 'top' and 'perf' operate at 1Hz which is too slow for my measurement. I need a higher frequency. And, I also need to synchronize the measurement with vital phases of my codes. So, the Intel Vtune Profile does not work for me either.

Is there a possible way for me to monitor the issue of instructions on Xeon Phi or any other activities linked to their utilizations? I understand that those hardware counters are there, but to read them seems very challenging to me. Maybe I can deduce this utilization by measuring the CPU time of each thread?

Thanks.

0 投票
3 回答
274 浏览

xeon-phi - 更改线程号不会影响代码

我正在尝试学习 xeon-phi ,并且在学习 Intel Xeon-Phi Coprocessor HPC 书籍时,我尝试在此处运行代码。(来自书)

该代码使用 openmp 和 2 个线程。

但是我得到的结果与使用 1 个线程运行的结果相同。(根本不使用openmp)

我什至在麦克风中使用了不同的组合,但仍然相同:

似乎以某种方式未启用openmp?我在这里遗漏了什么吗?

仅使用 1 个线程的代码在这里

我编译使用:

谢谢!

0 投票
1 回答
101 浏览

openmp - 线程数和时间结果一致性

我正在尝试学习至强 phi 编程。

我在 cpu 上运行这段代码,我正在使用卸载编译指示来处理我想在协处理器上运行的部分。

由于我在 cpu 上编译并且我使用卸载,我正在使用:

为了指定线程数。

我的问题:

1) 运行代码,显示始终使用了 40 个线程。

2)一次又一次地运行代码而不编译,我得到不同的时间结果。

代码:

我正在编译: