一个非常简单的解决方案是使用一个像样的表驱动近似。如果您正确减少输入,您实际上并不需要大量数据。exp(a)==exp(a/2)*exp(a/2)
,这意味着你真的只需要exp(x)
计算1 < x < 2
。在该范围内,runga-kutta 近似将给出合理的结果,大约 16 个条目 IIRC。
同样,sqrt(a) == 2 * sqrt(a/4) == sqrt(4*a) / 2
这意味着您只需要1 < a < 4
. Log(a) 有点难:log(a) == 1 + log(a/e)
. 这是一个相当慢的迭代,但 log(1024) 只有 6.9,所以你不会有很多迭代。
您可以对 pow: 使用类似的“整数优先”算法pow(x,y)==pow(x, floor(y)) * pow(x, frac(y))
。这是可行的,因为pow(double, int)
它是微不足道的(分而治之)。
[编辑] 对于 的整数部分log(a)
,存储一个表可能很有用,1, e, e^2, e^3, e^4, e^5, e^6, e^7
这样您就可以log(a) == n + log(a/e^n)
通过在该表中对 a 进行简单的硬编码二进制搜索来减少。从 7 步到 3 步的改进并不是很大,但这意味着您只需除以一次e^n
而不是n
乘以e
。
[编辑 2] 对于最后一个log(a/e^n)
术语,您可以使用log(a/e^n) = log((a/e^n)^8)/8
- 每次迭代通过 table lookup再产生 3 位。这使您的代码和表格大小保持较小。这通常是嵌入式系统的代码,它们没有大缓存。
[编辑 3] 这对我来说仍然不聪明。log(a) = log(2) + log(a/2)
. 您可以只存储定点值log2=0.6931471805599
,计算前导零的数量,转移a
到用于查找表的范围,然后将该转移(整数)乘以定点常数log2
。可以低至 3 条指令。
使用e
减少步骤只会给你一个“不错”log(e)=1.0
的常数,但这是错误的优化。0.6931471805599 和 1.0 一样好;两者都是 10.22 定点的 32 位常量。使用 2 作为范围缩小的常数允许您使用位移位进行除法。
[编辑 5] 由于您将其存储在 Q10.22 中,因此您可以更好地存储 log(65536)=11.09035488。(16 x 对数 (2))。“x16”意味着我们还有 4 位可用的精度。
您仍然可以从编辑 2 中获得诀窍,log(a/2^n) = log((a/2^n)^8)/8
. 基本上,这会给你一个结果(a + b/8 + c/64 + d/512) * 0.6931471805599
- b,c,d 在 [0,7] 范围内。a.bcd
真的是一个八进制数。毫不奇怪,因为我们使用 8 作为电源。(这个技巧同样适用于幂 2、4 或 16。)
[编辑 4] 仍然有一个开放的结局。pow(x, frac(y)
只是pow(sqrt(x), 2 * frac(y))
和我们有一个像样的1/sqrt(x)
。这为我们提供了更有效的方法。说frac(y)=0.101
二进制,即 1/2 加 1/8。那么这意味着x^0.101
是(x^1/2 * x^1/8)
。But x^1/2
is justsqrt(x)
和x^1/8
is (sqrt(sqrt(sqrt(x)))
。保存一个操作,Newton-RaphsonNR(x)
给我们1/sqrt(x)
,所以我们计算1.0/(NR(x)*NR((NR(NR(x)))
. 我们只反转最终结果,不要直接使用 sqrt 函数。