9

我有 3 个正整数的基本表示形式:

  1. 十进制,在 unsigned long 变量中(例如unsigned long int NumDec = 200)。
  2. 十六进制,在字符串变量中(例如字符串 NumHex = "C8"
  3. 二进制,在字符串变量中(例如string NumBin = "11001000"

我希望能够以最有效的方式在所有 3 种表示形式中的数字之间进行转换。即实现以下6个功能:

unsigned long int Binary2Dec(const string & Bin) {}
unsigned long int Hex2Dec(const string & Hex) {}
string Dec2Hex(unsigned long int Dec) {}
string Binary2Hex(const string & Bin) {}
string Dec2Binary(unsigned long int Dec) {}
string Hex2Binary(const string & Hex) {}

对于他们每个人来说,最有效的方法是什么?我可以使用 C 和 C++,但不能使用 boost。

编辑:“效率”是指时间效率:最短的执行时间。

4

7 回答 7

8

正如其他人指出的那样,我将从sscanf(),printf()和/或strtoul(). 它们对于大多数应用程序来说足够快,而且它们不太可能出现错误。然而,我要说的是,这些函数比你想象的更通用,因为它们必须处理非 ASCII 字符集,以及以任何基数表示的数字等等。对于某些领域,可以击败库函数。

因此,首先进行测量,如果这些转换的性能确实是一个问题,那么:

1) 在某些应用程序/领域中,某些数字经常出现,例如零、100、200、19.95,可能很常见,因此优化您的函数以使用一堆 if() 语句转换这些数字是有意义的,然后回退到通用库函数。2)如果最常见的 100 个数字使用表查找,然后回退到库函数。请记住,大型表可能不适合您的缓存,并且可能需要多个间接共享库,因此请仔细测量这些内容以确保不会降低性能。

您可能还想查看 boost lexical_cast 函数,尽管根据我的经验,后者与良好的旧 C 函数相比是相对的。

很多人都说过,值得一遍又一遍地重复:在你有证据证明它们是一个问题之前,不要优化这些转换。如果您进行优化,请测量您的新实现以确保它更快,并确保您为自己的版本进行大量单元测试,因为您将引入错误 :-(

于 2009-05-04T21:23:14.620 回答
4

我建议只使用sprintfsscanf

此外,如果您对它的实现方式感兴趣,可以查看 glibc 的源代码,即 GNU C 库

于 2009-05-04T10:04:18.903 回答
3

为什么这些例程必须如此省时?这种说法总是让我感到好奇。你确定像 strtol() 这样明显的转换方法太慢,还是你可以做得更好?系统功能通常非常有效。它们有时支持通用性和错误检查的速度较慢,但​​您需要考虑如何处理错误。如果一个bin参数的字符不是 '0' 和 '1',那又是什么呢?中止?传播大量错误?

为什么用“Dec”来表示内部表示?应该使用 Dec、Hex 和 Bin 来指代字符串表示。没有小数点unsigned long。您是否正在处理以十进制显示数字的字符串?如果不是,你会在这里混淆人们,并且会混淆更多人。

二进制和十六进制文本格式之间的转换可以通过查找表快速有效地完成,但涉及十进制文本格式的任何事情都会更加复杂。

于 2009-05-04T16:45:09.343 回答
2

这取决于您要优化什么,“高效”是什么意思?转换速度快、占用内存少、程序员时间少、其他程序员阅读代码的WTF少,或者什么重要吗?

为了可读性和易于实现,您至少应该Dec2Hex()通过Dec2Binary()调用strotul(). 这使它们成为单行,这对于至少上述单词的某些解释非常有效。

于 2009-05-04T09:49:09.093 回答
2

听起来很像一个家庭作业问题,但到底是什么......

简短的回答是使用两个查找表从 long int 转换为您的字符串。每个表应该有 256 个条目。一个将一个字节映射到一个十六进制字符串:0 ->“00”、1 ->“01”等。另一个将一个字节映射到一个位字符串:0 ->“00000000”、1 ->“00000001”。

然后对于 long int 中的每个字节,您只需查找正确的字符串,并将它们连接起来。

要将字符串转换回长字符串,您只需将每个字符的数值乘以 16 或 2 的适当幂,然后将结果相加,即可将十六进制字符串和位字符串转换回十进制数。

编辑:您还可以使用相同的查找表进行反向转换,方法是进行二进制搜索以找到正确的字符串。这将需要对您的字符串进行 log(256) = 8 次比较。不幸的是,我没有时间分析比较字符串是否比乘法和加法快得多。

于 2009-05-04T10:01:19.503 回答
1

让我们考虑一下任务的一半——从字符串化的基数 n 转换为无符号长整数,其中 n 是 2 的幂(二进制的基数为 2,十六进制的基数为 16)。

如果你的输入是理智的,那么这项工作只不过是一个比较、一个减法、一个移位和一个或每个数字。如果你的输入不健全,那么,这就是它变得丑陋的地方,不是吗?进行超快转换并不难。在所有情况下都做好是一项挑战。

因此,让我们假设您的输入是理智的,那么您转换的核心是:

unsigned long PowerOfTwoFromString(char *input, int shift)
{
    unsigned long val = 0;
    char upperLimit = 'a' + (1 << shift)
    while (*input) {
        char c = tolower(*input++);
        unsigned long digit = (c > 'a' && c < upperLimit) ? c - 'a' + 10 : c - '0';
        val = (val << shift) | digit;
    }
    return val;
 }

 #define UlongFromBinaryString(str) PowerOfTwoFromString(str, 1)
 #define UlongFromHexString(str) PowerOfTwoFromString(str, 4)

看看这有多容易?它会在非理智的输入上失败。你的大部分工作都是为了让你的输入变得理智,而不是表现。

现在,这段代码利用了两次移位的力量。很容易扩展到base 4,base 8,base 32等。它不适用于两个base的非幂。对于那些,你的数学必须改变。你得到

val = (val * base) + digit

这组操作在概念上是相同的。乘以基数将等同于移位。所以我很可能会使用一个完全通用的例程。并在清理输入的同时清理代码。到那时,strtoul 可能是你最好的选择。这是strtoul版本的链接。几乎所有的工作都在处理边缘条件——这应该让你知道你的精力应该集中在哪里:正确、有弹性的代码。与说不因输入错误而崩溃的节省相比,使用位移的节省将是最小的。

于 2009-05-04T17:28:53.263 回答
0

为什么不只使用宏也将格式作为输入。如果你至少在 C 中。

#define TO_STRING( string, format, data) \
sprintf( string, "##format##", data)
// Int
TO_STRING(buf,%d,i);
// Hex ( Two char representation )
TO_STRING(buf,%02x,i);
// Binary
TO_STRING(buf,%b,i);

或者你可以直接使用 sprintf:或者你可以有多个宏。

#define INT_STRING( buf, data) \
sprintf( buf, "%d", data)
#define HEX_STRING( buf, data) \
sprintf( buf, "%x", data)
#define BIN_TO_STRING( buf, data) \
sprintf( buf, "%b", data)

BIN_TO_STRING( loc_buf, my_bin );
于 2009-05-04T16:09:15.687 回答