我正在通过使用不同场景运行 coremark 基准测试来测量 ARM cortex R5f 处理器的性能。一种情况是在 ATCM 内存上设置堆栈。
不带flag编译时inline
,TCM上的STACK效果更好。并且在使用标志编译时inline
,RAM 上的 STACK 会得到更好的结果。
鉴于 TCM 更快且更接近处理器,如何解释这一点。
在 TCM 上设置堆栈时,我的程序中没有堆栈溢出。
我正在通过使用不同场景运行 coremark 基准测试来测量 ARM cortex R5f 处理器的性能。一种情况是在 ATCM 内存上设置堆栈。
不带flag编译时inline
,TCM上的STACK效果更好。并且在使用标志编译时inline
,RAM 上的 STACK 会得到更好的结果。
鉴于 TCM 更快且更接近处理器,如何解释这一点。
在 TCM 上设置堆栈时,我的程序中没有堆栈溢出。