0

下面是我从 Philippe Tenenhaus ( http://www.philten.com/us-xmlhttprequest-image/ ) 获得的 base 64 图像编码函数。

这让我很困惑,但我很想理解。

我想我理解按位 & 和 | , 并用 << 和 >> 移动字节位置。

我对这些行特别困惑:((byte1 & 3) << 4) | (字节2 >> 4);((byte2 & 15) << 2) | (字节3 >> 6);

以及为什么它仍然对 enc2 使用 byte1,对 enc3 使用 byte2。enc4 = byte3 & 63;以及...的目的

有人可以解释这个功能。

function base64Encode(inputStr) 
            {
               var b64 = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=";
               var outputStr = "";
               var i = 0;

               while (i < inputStr.length)
               {
                   //all three "& 0xff" added below are there to fix a known bug 
                   //with bytes returned by xhr.responseText
                   var byte1 = inputStr.charCodeAt(i++) & 0xff;
                   var byte2 = inputStr.charCodeAt(i++) & 0xff;
                   var byte3 = inputStr.charCodeAt(i++) & 0xff;

                   var enc1 = byte1 >> 2;
                   var enc2 = ((byte1 & 3) << 4) | (byte2 >> 4);

                   var enc3, enc4;
                   if (isNaN(byte2))
                   {
                       enc3 = enc4 = 64;
                   }
                   else
                   {
                       enc3 = ((byte2 & 15) << 2) | (byte3 >> 6);
                       if (isNaN(byte3))
                       {
                           enc4 = 64;
                       }
                       else
                       {
                           enc4 = byte3 & 63;
                       }
                   }

                   outputStr += b64.charAt(enc1) + b64.charAt(enc2) + b64.charAt(enc3) + b64.charAt(enc4);
                } 

                return outputStr;
            }
4

1 回答 1

1

它可能有助于理解 Base64 编码的作用。它将 8 位分组中的 24 位转换为 6 位分组。(http://en.wikipedia.org/wiki/Base64

所以 enc1, 是前 6 位,即第一个字节的前 6 位。

enc2,是接下来的 6 位,第一个字节的最后 2 位和第二个字节的前 4 位。按位和操作 byte1 & 3 以第一个字节中的最后 2 位为目标。所以,

XXXXXXXX & 00000011 = 000000XX

然后向左移动 4 位。

000000XX << 4 = 00XX0000。

byte2 >> 4 执行右移位,隔离第二个Byte的前4位,如下图

YYYYXXXX >> 4 = 0000YYYY

所以, ((byte1 & 3) << 4) | (byte2 >> 4) 将结果与按位或

00XX0000 | 0000YYYY = 00XXYYYY

enc3,是第二个字节的最后 4 位和第三个字节的前 2 位。

enc4 是第 3 个字节的最后 6 位。

charCodeAt 返回一个 16 位值的 Unicode 代码点,因此似乎假设相关信息仅在低 8 位中。这个假设让我想知道代码中是否仍然存在错误。由于这种假设,可能会丢失一些信息。

于 2013-09-27T16:58:45.083 回答