一个非常简单的解决方案是使用一个像样的表驱动近似。如果您正确减少输入,您实际上并不需要大量数据。exp(a)==exp(a/2)*exp(a/2),这意味着你真的只需要exp(x)计算1 < x < 2。在该范围内,runga-kutta 近似将给出合理的结果,大约 16 个条目 IIRC。
同样,sqrt(a) == 2 * sqrt(a/4) == sqrt(4*a) / 2这意味着您只需要1 < a < 4. Log(a) 有点难:log(a) == 1 + log(a/e). 这是一个相当慢的迭代,但 log(1024) 只有 6.9,所以你不会有很多迭代。
您可以对 pow: 使用类似的“整数优先”算法pow(x,y)==pow(x, floor(y)) * pow(x, frac(y))。这是可行的,因为pow(double, int)它是微不足道的(分而治之)。
[编辑] 对于 的整数部分log(a),存储一个表可能很有用,1, e, e^2, e^3, e^4, e^5, e^6, e^7这样您就可以log(a) == n + log(a/e^n)通过在该表中对 a 进行简单的硬编码二进制搜索来减少。从 7 步到 3 步的改进并不是很大,但这意味着您只需除以一次e^n而不是n乘以e。
[编辑 2] 对于最后一个log(a/e^n)术语,您可以使用log(a/e^n) = log((a/e^n)^8)/8- 每次迭代通过 table lookup再产生 3 位。这使您的代码和表格大小保持较小。这通常是嵌入式系统的代码,它们没有大缓存。
[编辑 3] 这对我来说仍然不聪明。log(a) = log(2) + log(a/2). 您可以只存储定点值log2=0.6931471805599,计算前导零的数量,转移a到用于查找表的范围,然后将该转移(整数)乘以定点常数log2。可以低至 3 条指令。
使用e减少步骤只会给你一个“不错”log(e)=1.0的常数,但这是错误的优化。0.6931471805599 和 1.0 一样好;两者都是 10.22 定点的 32 位常量。使用 2 作为范围缩小的常数允许您使用位移位进行除法。
[编辑 5] 由于您将其存储在 Q10.22 中,因此您可以更好地存储 log(65536)=11.09035488。(16 x 对数 (2))。“x16”意味着我们还有 4 位可用的精度。
您仍然可以从编辑 2 中获得诀窍,log(a/2^n) = log((a/2^n)^8)/8. 基本上,这会给你一个结果(a + b/8 + c/64 + d/512) * 0.6931471805599- b,c,d 在 [0,7] 范围内。a.bcd真的是一个八进制数。毫不奇怪,因为我们使用 8 作为电源。(这个技巧同样适用于幂 2、4 或 16。)
[编辑 4] 仍然有一个开放的结局。pow(x, frac(y)只是pow(sqrt(x), 2 * frac(y))和我们有一个像样的1/sqrt(x)。这为我们提供了更有效的方法。说frac(y)=0.101二进制,即 1/2 加 1/8。那么这意味着x^0.101是(x^1/2 * x^1/8)。But x^1/2is justsqrt(x)和x^1/8is (sqrt(sqrt(sqrt(x)))。保存一个操作,Newton-RaphsonNR(x)给我们1/sqrt(x),所以我们计算1.0/(NR(x)*NR((NR(NR(x))). 我们只反转最终结果,不要直接使用 sqrt 函数。