我需要在 C 中编写一个将大端转换为小端的函数。我不能使用任何库函数。
13 回答
假设您需要的是一个简单的字节交换,请尝试类似
无符号 16 位转换:
swapped = (num>>8) | (num<<8);
无符号 32 位转换:
swapped = ((num>>24)&0xff) | // move byte 3 to byte 0
((num<<8)&0xff0000) | // move byte 1 to byte 2
((num>>8)&0xff00) | // move byte 2 to byte 1
((num<<24)&0xff000000); // byte 0 to byte 3
这会将字节顺序从位置 1234 交换到 4321。如果您的输入是0xdeadbeef
,则 32 位字节序交换可能会输出0xefbeadde
.
上面的代码应该用宏或至少是常量而不是幻数来清理,但希望它会有所帮助
编辑:正如另一个答案所指出的,有平台、操作系统和指令集特定的替代方案可以比上面的要快得多。在 Linux 内核中有一些宏(例如 cpu_to_be32)可以很好地处理字节顺序。但是这些替代方案是特定于它们的环境的。在实践中,最好使用混合可用方法来处理字节顺序
通过包括:
#include <byteswap.h>
您可以获得与机器相关的字节交换函数的优化版本。然后,您可以轻松使用以下功能:
__bswap_32 (uint32_t input)
或者
__bswap_16 (uint16_t input)
#include <stdint.h>
//! Byte swap unsigned short
uint16_t swap_uint16( uint16_t val )
{
return (val << 8) | (val >> 8 );
}
//! Byte swap short
int16_t swap_int16( int16_t val )
{
return (val << 8) | ((val >> 8) & 0xFF);
}
//! Byte swap unsigned int
uint32_t swap_uint32( uint32_t val )
{
val = ((val << 8) & 0xFF00FF00 ) | ((val >> 8) & 0xFF00FF );
return (val << 16) | (val >> 16);
}
//! Byte swap int
int32_t swap_int32( int32_t val )
{
val = ((val << 8) & 0xFF00FF00) | ((val >> 8) & 0xFF00FF );
return (val << 16) | ((val >> 16) & 0xFFFF);
}
更新:添加了 64 位字节交换
int64_t swap_int64( int64_t val )
{
val = ((val << 8) & 0xFF00FF00FF00FF00ULL ) | ((val >> 8) & 0x00FF00FF00FF00FFULL );
val = ((val << 16) & 0xFFFF0000FFFF0000ULL ) | ((val >> 16) & 0x0000FFFF0000FFFFULL );
return (val << 32) | ((val >> 32) & 0xFFFFFFFFULL);
}
uint64_t swap_uint64( uint64_t val )
{
val = ((val << 8) & 0xFF00FF00FF00FF00ULL ) | ((val >> 8) & 0x00FF00FF00FF00FFULL );
val = ((val << 16) & 0xFFFF0000FFFF0000ULL ) | ((val >> 16) & 0x0000FFFF0000FFFFULL );
return (val << 32) | (val >> 32);
}
这是一个相当通用的版本;我还没有编译它,所以可能有错别字,但你应该明白,
void SwapBytes(void *pv, size_t n)
{
assert(n > 0);
char *p = pv;
size_t lo, hi;
for(lo=0, hi=n-1; hi>lo; lo++, hi--)
{
char tmp=p[lo];
p[lo] = p[hi];
p[hi] = tmp;
}
}
#define SWAP(x) SwapBytes(&x, sizeof(x));
注意:这没有针对速度或空间进行优化。它旨在清晰(易于调试)和可移植。
2018-04-04 更新 添加了 assert() 以捕获 n == 0 的无效情况,正如评论者 @chux 所发现的那样。
如果您需要宏(例如嵌入式系统):
#define SWAP_UINT16(x) (((x) >> 8) | ((x) << 8))
#define SWAP_UINT32(x) (((x) >> 24) | (((x) & 0x00FF0000) >> 8) | (((x) & 0x0000FF00) << 8) | ((x) << 24))
编辑:这些是库函数。跟随它们是手动的方法。
不知道__byteswap_ushort、__byteswap_ulong 和 __byteswap_uint64的人数之多令我震惊。当然它们是特定于 Visual C++ 的,但它们在 x86/IA-64 架构上编译成一些美味的代码。:)
这是从这个页面bswap
中提取的指令的显式用法。请注意,上面的内在形式总是比这更快,我只是添加它来给出没有库例程的答案。
uint32 cq_ntohl(uint32 a) {
__asm{
mov eax, a;
bswap eax;
}
}
开个玩笑:
#include <stdio.h>
int main (int argc, char *argv[])
{
size_t sizeofInt = sizeof (int);
int i;
union
{
int x;
char c[sizeof (int)];
} original, swapped;
original.x = 0x12345678;
for (i = 0; i < sizeofInt; i++)
swapped.c[sizeofInt - i - 1] = original.c[i];
fprintf (stderr, "%x\n", swapped.x);
return 0;
}
这是一种使用 SSSE3 指令 pshufb 使用其 Intel 内在函数的方法,假设您有 4 int
s 的倍数:
unsigned int *bswap(unsigned int *destination, unsigned int *source, int length) {
int i;
__m128i mask = _mm_set_epi8(12, 13, 14, 15, 8, 9, 10, 11, 4, 5, 6, 7, 0, 1, 2, 3);
for (i = 0; i < length; i += 4) {
_mm_storeu_si128((__m128i *)&destination[i],
_mm_shuffle_epi8(_mm_loadu_si128((__m128i *)&source[i]), mask));
}
return destination;
}
这会工作/更快吗?
uint32_t swapped, result;
((byte*)&swapped)[0] = ((byte*)&result)[3];
((byte*)&swapped)[1] = ((byte*)&result)[2];
((byte*)&swapped)[2] = ((byte*)&result)[1];
((byte*)&swapped)[3] = ((byte*)&result)[0];
此代码片段可以将 32 位小端数转换为大端数。
#include <stdio.h>
main(){
unsigned int i = 0xfafbfcfd;
unsigned int j;
j= ((i&0xff000000)>>24)| ((i&0xff0000)>>8) | ((i&0xff00)<<8) | ((i&0xff)<<24);
printf("unsigned int j = %x\n ", j);
}
这是我一直在使用的一个函数——经过测试并适用于任何基本数据类型:
// SwapBytes.h
//
// Function to perform in-place endian conversion of basic types
//
// Usage:
//
// double d;
// SwapBytes(&d, sizeof(d));
//
inline void SwapBytes(void *source, int size)
{
typedef unsigned char TwoBytes[2];
typedef unsigned char FourBytes[4];
typedef unsigned char EightBytes[8];
unsigned char temp;
if(size == 2)
{
TwoBytes *src = (TwoBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[1];
(*src)[1] = temp;
return;
}
if(size == 4)
{
FourBytes *src = (FourBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[3];
(*src)[3] = temp;
temp = (*src)[1];
(*src)[1] = (*src)[2];
(*src)[2] = temp;
return;
}
if(size == 8)
{
EightBytes *src = (EightBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[7];
(*src)[7] = temp;
temp = (*src)[1];
(*src)[1] = (*src)[6];
(*src)[6] = temp;
temp = (*src)[2];
(*src)[2] = (*src)[5];
(*src)[5] = temp;
temp = (*src)[3];
(*src)[3] = (*src)[4];
(*src)[4] = temp;
return;
}
}
编辑:这个函数只交换对齐的 16 位字的字节顺序。UTF-16/UCS-2 编码通常需要的功能。编辑结束。
如果你想改变内存块的字节序,你可以使用我的极快的方法。您的内存阵列的大小应该是 8 的倍数。
#include <stddef.h>
#include <limits.h>
#include <stdint.h>
void ChangeMemEndianness(uint64_t *mem, size_t size)
{
uint64_t m1 = 0xFF00FF00FF00FF00ULL, m2 = m1 >> CHAR_BIT;
size = (size + (sizeof (uint64_t) - 1)) / sizeof (uint64_t);
for(; size; size--, mem++)
*mem = ((*mem & m1) >> CHAR_BIT) | ((*mem & m2) << CHAR_BIT);
}
这种功能对于更改 Unicode UCS-2/UTF-16 文件的字节顺序很有用。
如果您在 x86 或 x86_64 处理器上运行,则大端是本机的。所以
对于 16 位值
unsigned short wBigE = value;
unsigned short wLittleE = ((wBigE & 0xFF) << 8) | (wBigE >> 8);
对于 32 位值
unsigned int iBigE = value;
unsigned int iLittleE = ((iBigE & 0xFF) << 24)
| ((iBigE & 0xFF00) << 8)
| ((iBigE >> 8) & 0xFF00)
| (iBigE >> 24);
这不是最有效的解决方案,除非编译器认识到这是字节级操作并生成字节交换代码。但它不依赖于任何内存布局技巧,并且可以很容易地转换为宏。