特别是,我正在尝试实现一个向量数学模块来处理向量和矩阵。
我最初的计划如下:为所有同类对象(例如 4x4 矩阵)使用一个大堆,为内部计算保留一些空间,并通过偏移量访问其余矩阵。这是我的代码示例:
'use strict';
function Mat4(stdlib, foreign, heap) {
'use asm';
var H = new stdlib.Float32Array(heap);
function identity(n) {
n = n|0;
var offset = 0;
offset = ((n|0) << 6)|0;
H[((offset|0)) >> 2] = 1.0;
H[((offset|0) + 4) >> 2] = 0.0;
H[((offset|0) + 8) >> 2] = 0.0;
H[((offset|0) + 12) >> 2] = 0.0;
H[((offset|0) + 16) >> 2] = 0.0;
H[((offset|0) + 20) >> 2] = 1.0;
H[((offset|0) + 24) >> 2] = 0.0;
H[((offset|0) + 28) >> 2] = 0.0;
H[((offset|0) + 32) >> 2] = 0.0;
H[((offset|0) + 36) >> 2] = 0.0;
H[((offset|0) + 40) >> 2] = 1.0;
H[((offset|0) + 44) >> 2] = 0.0;
H[((offset|0) + 48) >> 2] = 0.0;
H[((offset|0) + 52) >> 2] = 0.0;
H[((offset|0) + 56) >> 2] = 0.0;
H[((offset|0) + 60) >> 2] = 1.0;
return ((offset|0) >> 2)|0;
}
return {
identity: identity
};
};
var buffer = new ArrayBuffer(4096);
var fArray = new Float32Array(buffer);
var mod = Mat4(window, {}, buffer);
var dmat4 = {
counter: 0
};
dmat4.identity = function() {
var offset = mod.identity(dmat4.counter++);
return fArray.subarray(offset, offset + 16);
};
这似乎有效,但似乎比仅仅创建一个 Float32Array 并用值填充它要慢得多。我的猜测是所有的偏移数学都花费了大部分时间,并且在编译这个 asm.js 代码时没有进行优化。
但也许我遗漏了一些东西,这段代码可以改进吗?