我在 MATLAB 中编写了自己的 SHA1 实现,它提供了正确的哈希值。但是,它非常慢(在我的 Core i7-2760QM 上,一个 1000 的字符串a
需要 9.9 秒),我认为缓慢是由于 MATLAB 如何实现按位逻辑运算(bitand
, bitor
, bitxor
, bitcmp
)和按位移位(bitshift
, bitrol
, bitror
)整数。
bitrol
特别是我想知道是否需要为命令和bitror
使用命令构造定点数字对象fi
,因为无论如何在 Intel x86 程序集中都有各种大小的寄存器rol
和ror
内存地址。但是,bitshift
它非常快(它不需要任何定点数值结构,常规uint64
变量可以正常工作),这使情况变得奇怪:为什么在 MATLAB 中bitrol
需要bitror
用 构造的定点数值对象fi
,而bitshift
在装配级别这一切都归结为shl
,shr
和?rol
ror
因此,在将这个函数用 C/C++ 编写为 .mex 文件之前,我很高兴知道是否有任何方法可以提高这个函数的性能。我知道 SHA1 有一些特定的优化,但这不是问题,如果按位旋转的基本实现是如此缓慢。
tic
用and进行一点测试toc
,很明显是什么让它变慢是用bitrol
and中的循环fi
。有两个这样的循环:
%# Define some variables.
FFFFFFFF = uint64(hex2dec('FFFFFFFF'));
%# constants: K(1), K(2), K(3), K(4).
K(1) = uint64(hex2dec('5A827999'));
K(2) = uint64(hex2dec('6ED9EBA1'));
K(3) = uint64(hex2dec('8F1BBCDC'));
K(4) = uint64(hex2dec('CA62C1D6'));
W = uint64(zeros(1, 80));
... some other code here ...
%# First slow loop begins here.
for index = 17:80
W(index) = uint64(bitrol(fi(bitxor(bitxor(bitxor(W(index-3), W(index-8)), W(index-14)), W(index-16)), 0, 32, 0), 1));
end
%# First slow loop ends here.
H = sha1_handle_block_struct.H;
A = H(1);
B = H(2);
C = H(3);
D = H(4);
E = H(5);
%# Second slow loop begins here.
for index = 1:80
rotatedA = uint64(bitrol(fi(A, 0, 32, 0), 5));
if (index <= 20)
% alternative #1.
xorPart = bitxor(D, (bitand(B, (bitxor(C, D)))));
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(1);
elseif ((index >= 21) && (index <= 40))
% FIPS.
xorPart = bitxor(bitxor(B, C), D);
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(2);
elseif ((index >= 41) && (index <= 60))
% alternative #2.
xorPart = bitor(bitand(B, C), bitand(D, bitxor(B, C)));
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(3);
elseif ((index >= 61) && (index <= 80))
% FIPS.
xorPart = bitxor(bitxor(B, C), D);
xorPart = bitand(xorPart, FFFFFFFF);
temp = rotatedA + xorPart + E + W(index) + K(4);
else
error('error in the code of sha1_handle_block.m!');
end
temp = bitand(temp, FFFFFFFF);
E = D;
D = C;
C = uint64(bitrol(fi(B, 0, 32, 0), 30));
B = A;
A = temp;
end
%# Second slow loop ends here.
tic
使用和进行测量toc
,消息的 SHA1 哈希的整个计算abc
在我的笔记本电脑上花费了大约 0.63 秒,其中大约 0.23 秒在第一个慢循环中传递,大约 0.38 秒在第二个慢循环中传递。那么在编写 .mex 文件之前,有什么方法可以优化 MATLAB 中的这些循环吗?