3

我可以使用 Accelerate Framework 对无符号 8 位整数数组求和而不转换为浮点数组吗?

我目前的做法是:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

但是 vDSP_vfltu8 很慢。

4

1 回答 1

1
  1. 如果vDSP_vfltu8( )快速对您很重要,请提交错误报告。如果有任何问题,请提交错误报告。性能不足一个错误,如果您报告它,将被视为错误。图书馆作者使用这种反馈来确定如何优先考虑他们的工作;您的错误报告是位于优化队列前面的函数与队列中的 #1937 之间的区别。
  2. 正如已经暗示的那样,整数累加会因溢出问题而变得复杂,但如果为 vDSP 库提供的特定情况提供优化函数会很有用,请提交错误报告以请求这样的函数(注意模式?) . 图书馆作者不是通灵者,也不会编写不需要的功能。一定要解释你将如何使用这样的功能——鉴于这些信息,他们可能会提出一个稍微不同的功能,对你来说甚至更有用。
  3. 如果您决定自己编写一些 NEON 代码,您将需要使用vaddw_u8( )内在函数。
于 2011-04-12T04:55:56.943 回答