2

我已经实现了 karatsuba 乘法算法。我想以这种方式改进它,我可以将 2 个 64 位数字相乘,但我不知道该怎么做。我得到一个提示,这两个数字都包含数字的个数,它是 2 的幂,但它什么也没告诉我。你能给出任何其他提示吗?数学提示或算法改进提示。

#include <iostream>
#include <math.h>
using namespace std;

int getLength(long long value);
long long multiply(long long x, long long y);

int getLength(long long value)
{
    int counter = 0;
    while (value != 0)
    {
        counter++;
        value /= 10;
    }
    return counter;
}

long long multiply(long long x, long long y)
{
    int xLength = getLength(x);
    int yLength = getLength(y);

    // the bigger of the two lengths
    int N = (int)(fmax(xLength, yLength));

    // if the max length is small it's faster to just flat out multiply the two nums
    if (N < 10)
        return x * y;

    //max length divided and rounded up
    N = (N / 2) + (N % 2);

    long long multiplier = pow(10, N);

    long long b = x / multiplier;
    long long a = x - (b * multiplier);
    long long d = y / multiplier;
    long long c = y - (d * N);

    long long z0 = multiply(a, c);
    long long z1 = multiply(a + b, c + d);
    long long z2 = multiply(b, d);


    return z0 + ((z1 - z0 - z2) * multiplier) + (z2 * (long long)(pow(10, 2 * N)));

}

int main()
{
    long long a;
    long long b;
    cin >> a;
    cout << '\n';
    cin >> b;
    cout << '\n' << multiply(a, b) << endl;
    return 0;
}
4

2 回答 2

6

这里有一个提示:

(A + kB) * (C + kD) = AC + k(BC + AD) + k^2(BD)

这有助于如果k您保留数字的基数的幂。例如,如果k是 1'000'000'000 并且您的数字是基数 10,则k只需将数字四处移动(添加零。)

不管怎样,考虑把你的 64 位数字分成两部分,每部分 32 位,然后像上面那样做数学运算。要计算AC, BC, AD, 并且BD您正在将一对 32 位数字相乘,这可以类似地完成。

由于您的位数是 2 的幂,因此您可以继续将您的数字分成两半,直到您达到可管理的数字大小(例如 1 位数字)。

顺便说一句,从您的问题中不清楚您是在谈论 64 位还是 64 位十进制数字。如果您要查找的只是 64 位数字相乘,请执行以下操作:

// I haven't actually run this code, so...

typedef unsigned long long u64;

u64 high32 (u64 x) {return x >> 32;}
u64 low32  (u64 x) {return x & 0xFFFFFFFF;}

u64 add_with_carry (u64 a, u64 b, u64 * carry)
{
    u64 result = a + b;
    *carry = (result < a ? 1 : 0);
    return result;
}

void mul (u64 a, u64 b, u64 * result_low, u64 * result_high)
{
    u64 a0 = low32(a), a1 = high32(a);
    u64 b0 = low32(b), b1 = high32(b);

    u64 a0b0 = a0 * b0;
    u64 a0b1 = a0 * b1;
    u64 a1b0 = a1 * b0;
    u64 a1b1 = a1 * b1;

    u64 c0 = 0, c1 = 0;
    u64 mid_part = add_with_carry(a0b1, a1b0, &c1);

    *result_low  = add_with_carry(a0b0, (low32(mid_part) << 32, &c0);
    *result_high = high32(mid_part) + a1b1 + (c1 << 32) + c0; // this won't overflow
}

此实现与上面概述的想法相同。由于在标准 C/C++ 中,我们可以在乘法结果中拥有的最大有意义的位数是 64,因此我们一次只能将两个 32 位数字相乘。这就是我们在这里所做的。

最终结果将是 128 位,我们以两个无符号 64 位数字返回。我们正在做一个 64 位乘 64 位乘法,通过做 4 个 32 位乘法和一些加法。

作为旁注,这是编写汇编程序通常比 C 更容易的少数情况之一。例如,在 x64 汇编程序中,这实际上是一条mul将两个 64 位无符号整数相乘并返回 128-位产生两个 64 位寄存器。

即使你没有 64 位到 128 位的乘法指令,在汇编中编写它仍然更容易(因为adc或类似的指令,例如上面的整个代码只是两个movs、四个muls、四个adds 和四个adcs 在普通的 x86 程序集中。)即使您不想用程序集编写,也应该检查编译器的“内在”。它可能有一个用于大乘法(但您将依赖于平台。)

于 2017-01-18T11:58:58.230 回答
2

要在较低位宽算术上应用 Karatsuba 或任何其他乘法,您需要将您的数字分成较小的“数字”。在任何其他事情之前,您需要访问这些“数字”,所以这里是如何做到的:

你有号码1234,想把它分成10^1数字,所以

1234 = 1*1000 + 2*100 + 3*10 + 4

您可以获得这样的数字:

x=1234;
a0=x%10; x/=10; // 4
a1=x%10; x/=10; // 3
a2=x%10; x/=10; // 2
a3=x%10; x/=10; // 1

如果你想要10^2数字,那么:

x=1234;
a0=x%100; x/=100; // 34
a1=x%100; x/=100; // 12

现在的问题是,要做到这一点,您需要对您没有的完整数字进行除法。如果您将数字作为字符串,那么它很容易完成,但假设您没有。计算机基于二进制计算,因此最好使用 2 的幂作为“数字”的基础,因此:

x = 1234 = 0100 1101 0010 bin

现在,如果我们想要例如2^4=16基数,那么:

a0=x%16; x/=16; // 0010
a1=x%16; x/=16; // 1101
a2=x%16; x/=16; // 0100

现在,如果您意识到除以 2 的幂只是右移,余数可以表示为 AND,那么:

a0=x&15; x>>=4; // 0010
a1=x&15; x>>=4; // 1101
a2=x&15; x>>=4; // 0100

位移可以堆叠到任何位宽数字,所以现在你得到了你需要的一切。但这还不是全部,例如2^8,如果您选择“数字”,BYTE那么您可以使用指针来代替,例如:

DWORD x=0x12345678; // 32 bit number
BYTE *db=(BYTE*)(&x); // 8bit pointer that points to x

a0=db[0]; // 0x78
a1=db[1]; // 0x56
a2=db[2]; // 0x34
a3=db[3]; // 0x12

因此您可以直接访问数字或从数字重构 x:

DWORD x; // 32 bit number
BYTE *db=(BYTE*)(&x); // 8bit pointer that points to x
db[0]=0x78;
db[1]=0x56;
db[2]=0x34;
db[3]=0x12;
// here x should be 0x12345678

请注意,顺序取决于平台 MSB 或 LSB 第一顺序。现在您可以应用乘法。例如,在 16 位乘法上完成的 32*32=64 位是通过简单的O(n^2)方法完成的:

x(a0+a1<<16) * y(b0+b1<<16) = a0*b0 + a0*b1<<16 + a1*b0<<16 + a1*b1<<32

其中 a0,a1,b0,b1 是操作数的位数。请注意,每个ai*bj乘法的结果是 2 位宽,因此您需要将其拆分为数字并存储到位移位寻址的结果数字中。请注意,添加可能会导致溢出到更高的数字。要处理这个问题,您需要使用至少两倍的算术宽度进行加法(16*16 位 mul -> 32 位加法)或使用进位标志。可悲的是,除了在 C++ 中使用汇编之外,您无法访问进位标志。幸运的是它可以模拟看到:

现在您可以构建 Karatsuba 或更高级的乘法以获取更多信息,请参阅:

于 2017-01-18T13:11:22.347 回答