2

(Sorry if I phrased the question incorrectly)

I am running some applications on a 16-core Parallella board and I was wondering if there was a way to calculate the amount of time taken by the slowest core?

I think that if I add the user + sys times, I will get the sum of the execution times for all the cores, correct?

These are some of the results:

real        0m1.927s
user        0m3.190s
sys         0m0.080s
4

1 回答 1

1

消歧义

以“并发”方式排列的基于多核的操作模式与并行模式处理之间存在很大差异。

在 Parallella 板上,如果谈到Zynq——双核 ARM Cortex-A9 CPU / Xilinx 7 系列片上 FPGA——你可以从板载 linux获得user+值。(大规模并行处理器阵列)硬件设备或其他可并行化的硬件可加载软 CPU 内核sys并不相同。Epiphany MPPAFPGA

另请注意,在真正的并行系统上,“较慢”或“最慢”核心一词失去了意义,因为所有处理器都以并行方式启动和完成,有关详细信息,请参阅PAR语法构造函数occam-pi (即使以等待为代价对于不同的替代处理路径,因为它们都并行完成)。

如何?

一个可能包括一些信令数据,以便在 MPPA 代码执行期间存储时钟计数器值/稍后从 Linux/ARM 端检索,并使用这些遥测记录数据来评估预先记录的“内部 MPPA”的代码执行时序”。

对于体内跟踪/状态诊断/检查分析工具,可能可以实时执行相同的操作,但对于这样的实时系统监控器,将需要大量系统特定的工程工作。

不过这是可行的。类似的方法用于在 FSA 设计/验证中对状态转换进行目视检查。

很好地解释了 a和代码执行模式之间PARALLEL的概念和性能差异。SERIALCONCURRENT

于 2015-07-26T17:07:51.413 回答