我正在寻找一个专注于图形的小型(4x4)矩阵运算的 SIMD 库。有很多单精度的,但我需要同时支持单精度和双精度。
我看过英特尔的 IPP MX 库,但我更喜欢有源代码的东西。我对这些特定操作的 SSE3+ 实现非常感兴趣:
- Mat4 * Mat4
- Mat4 * Vec4
- Mat4 * Mat4 数组
- Mat4 * Vec4 数组
- Mat4 反转(很高兴拥有)
编辑:请不要“过早优化”答案。任何使用过小矩阵的人都知道 GCC 不会向量化这些以及手动优化的内在函数或 ASM。在这种情况下,这很重要,否则我不会问。