c++ - C++ BigInt 乘法概念问题

Question

我正在用 C++ 构建一个小型 BigInt 库，用于我的编程语言。

结构如下：

short digits[ 1000 ];
int   len;

我有一个函数，通过将字符串拆分为单个字符并将它们放入digits.

数字中的数字都是相反的，所以数字 123 如下所示：

digits[0]=3 digits[1]=3 digits[2]=1

我已经设法编写了添加功能的代码，效果很好。

它的工作原理有点像这样：

overflow = 0
for i ++ until length of both numbers exceeded:
  add numberA[ i ] to numberB[ i ]
  add overflow to the result
  set overflow to 0
  if the result is bigger than 10:
    substract 10 from the result
    overflow = 1
  put the result into numberReturn[ i ]

（在这种情况下，当我将 1 加到 9 时会发生溢出：从 10 中减去 10，溢出加 1，溢出被添加到下一位）

所以想想两个数字是如何存储的，比如：

   0 | 1 | 2
   ---------
A  2   -   -
B  0   0   1

以上代表了digitsbigints 2 (A) 和 100 (B) 的。 -表示未初始化的数字，它们不被访问。

所以添加上面的数字可以正常工作：从 0 开始，加 2 + 0，到 1，加 0，到 2，加 1

但：

当我想用上述结构进行乘法运算时，我的程序最终会执行以下操作：

从 0 开始，将 2 与 0 (eek) 相乘，然后到 1，...

所以很明显，对于乘法，我必须得到这样的顺序：

   0 | 1 | 2
   ---------
A  -   -   2
B  0   0   1

然后，一切都清楚了：从 0 开始，将 0 与 0 相乘，到 1，将 0 与 0 相乘，再到 2，将 1 与 2 相乘

我怎样才能设法digits进入正确的乘法形式？
我不想做任何阵列移动/翻转 - 我需要性能！

score 4 · Accepted Answer

你为什么用在ashort中存储数字就足够了[0..9]char
您对乘法的思考不正确。在乘法的情况下，您需要一个 double for 循环，该循环B与每个数字相乘，A并将它们相加，并以正确的 10 次幂移位。

编辑：由于一些匿名者在没有评论的情况下对此进行了投票，这基本上是乘法算法：

bigint prod = 0
for i in A
    prod += B * A[i] * (10 ^ i)

Bwith的乘法A[i]是通过一个额外的 for 循环完成的，您还可以在其中跟踪进位。这(10 ^ i)是通过偏移目标索引来实现的，因为 bigint 以 10 为底。

score 4 · Accepted Answer

在我看来，你在问题中的例子是过度设计。由于涉及的乘法和加法的剪切数量，您的方法最终会比正常的长乘法更慢。当您一次可以乘以大约 9 时，不要限制自己一次只使用一个基数！将base10字符串转换为hugeval，然后对其进行操作。不要直接对字符串进行操作。你会发疯的。这是一些演示加法和乘法的代码。更改M为使用更大的类型。你也可以使用 std::vector，但是你会错过一些优化。

#include <iostream>
#include <string>
#include <algorithm>
#include <sstream>
#include <cstdlib>
#include <cstdio>
#include <iomanip>

#ifdef _DEBUG
#include <assert.h>
#define ASSERT(x) assert(x)
#else
#define ASSERT(x)
#endif

namespace Arithmetic
{
    const int M = 64;
    const int B = (M-1)*32;

    struct Flags
    {
        Flags() : C(false),Z(false),V(false),N(false){}
        void Clear()
        {
            C = false;
            Z = false;
            V = false;
            N = false;
        }
        bool C,Z,V,N;
    };

    static unsigned int hvAdd(unsigned int a, unsigned int b, Flags& f)
    {
        unsigned int c;
        f.Clear();
        //b = -(signed)b;
        c = a + b;

        f.N = (c >> 31UL) & 0x1;
        f.C = (c < a) && (c < b);
        f.Z = !c;
        f.V = (((signed)a < (signed)b) != f.N);

        return c;
    }

    static unsigned int hvSub(unsigned int a, unsigned int b, Flags& f)
    {
        unsigned int c;
        f.Clear();
        c = a - b;

        //f.N = ((signed)c < 0);
        f.N = (c >> 31UL) & 0x1;
        f.C = (c < a) && (c < b);
        f.Z = !c;
        f.V = (((signed)a < (signed)b) != f.N);

        return c;
    }


    struct HugeVal
    {
        HugeVal()
        {
            std::fill(part, part + M, 0);
        }
        HugeVal(const HugeVal& h)
        {
            std::copy(h.part, h.part + M, part);
        }
        HugeVal(const std::string& str)
        {
            Flags f;
            unsigned int tmp = 0;

            std::fill(part, part + M, 0);

            for(unsigned int i=0; i < str.length(); ++i){
                unsigned int digit = (unsigned int)str[i] - 48UL;
                unsigned int carry_last = 0;
                unsigned int carry_next = 0;
                for(int i=0; i<M; ++i){
                    tmp = part[i]; //the value *before* the carry add
                    part[i] = hvAdd(part[i], carry_last, f);
                    carry_last = 0;
                    if(f.C)
                        ++carry_last;
                    for(int j=1; j<10; ++j){
                        part[i] = hvAdd(part[i], tmp, f);
                        if(f.C)
                            ++carry_last;
                    }
                }
                part[0] = hvAdd(part[0], digit, f);
                int index = 1;
                while(f.C && index < M){
                    part[index] = hvAdd(part[index], 1, f);
                    ++index;
                }
            }
        }
        /*
        HugeVal operator= (const HugeVal& h)
        {
            *this = HugeVal(h);
        }
        */
        HugeVal operator+ (const HugeVal& h) const
        {
            HugeVal tmp;
            Flags f;
            int index = 0;
            unsigned int carry_last = 0;
            for(int j=0; j<M; ++j){
                if(carry_last){
                    tmp.part[j] = hvAdd(tmp.part[j], carry_last, f);
                    carry_last = 0;
                }
                tmp.part[j] = hvAdd(tmp.part[j], part[j], f);
                if(f.C)
                    ++carry_last;
                tmp.part[j] = hvAdd(tmp.part[j], h.part[j], f);
                if(f.C)
                    ++carry_last;
            }
            return tmp;
        }
        HugeVal operator* (const HugeVal& h) const
        {
            HugeVal tmp;

            for(int j=0; j<M; ++j){
                unsigned int carry_next = 0;
                for(int i=0;i<M; ++i){

                    Flags f;

                    unsigned int accum1 = 0;
                    unsigned int accum2 = 0;
                    unsigned int accum3 = 0;
                    unsigned int accum4 = 0;

                    /* Split into 16-bit values */
                    unsigned int j_LO = part[j]&0xFFFF;
                    unsigned int j_HI = part[j]>>16;
                    unsigned int i_LO = h.part[i]&0xFFFF;
                    unsigned int i_HI = h.part[i]>>16;

                    size_t index = i+j;
                    size_t index2 = index+1;

                    /* These multiplications are safe now. Can't overflow */
                    accum1 = j_LO * i_LO;
                    accum2 = j_LO * i_HI;
                    accum3 = j_HI * i_LO;
                    accum4 = j_HI * i_HI;


                    if(carry_next){ //carry from last iteration
                        accum1 = hvAdd(accum1, carry_next, f); //add to LSB
                        carry_next = 0;
                        if(f.C) //LSB produced carry
                            ++carry_next;
                    }

                    /* Add the lower 16-bit parts of accum2 and accum3 to accum1 */
                    accum1 = hvAdd(accum1, (accum2 << 16), f);
                    if(f.C)
                        ++carry_next;
                    accum1 = hvAdd(accum1, (accum3 << 16), f);
                    if(f.C)
                        ++carry_next;



                    if(carry_next){ //carry from LSB
                        accum4 = hvAdd(accum4, carry_next, f); //add to MSB
                        carry_next = 0;
                        ASSERT(f.C == false);
                    }

                    /* Add the higher 16-bit parts of accum2 and accum3 to accum4 */
                    /* Can't overflow */
                    accum4 = hvAdd(accum4, (accum2 >> 16), f);
                    ASSERT(f.C == false);
                    accum4 = hvAdd(accum4, (accum3 >> 16), f);
                    ASSERT(f.C == false);
                    if(index < M){
                        tmp.part[index] = hvAdd(tmp.part[index], accum1, f);
                        if(f.C)
                            ++carry_next;
                    }
                    carry_next += accum4;
                }
            }
            return tmp;
        }
        void Print() const
        {
            for(int i=(M-1); i>=0; --i){

                printf("%.8X", part[i]);
            }
            printf("\n");
        }
        unsigned int part[M];
    };

}


int main(int argc, char* argv[])
{

    std::string a1("273847238974823947823941");
    std::string a2("324230432432895745949");

    Arithmetic::HugeVal a = a1;
    Arithmetic::HugeVal b = a2;

    Arithmetic::HugeVal d = a + b;
    Arithmetic::HugeVal e = a * b;

    a.Print();
    b.Print();
    d.Print();
    e.Print();
    system("pause");
}

score 1 · Accepted Answer

安德烈亚斯是对的，你必须将一个数字乘以另一个数字并相应地求和结果。我认为最好将较长的数字乘以较短的数字。如果您将十进制数字存储在您的数组 char 中确实就足够了，但是如果您想要性能，也许您应该考虑更大的类型。我不知道您的平台是什么，但在 x86 的情况下，您可以使用 32 位整数和硬件支持来提供 32 位乘法的 64 位结果。

score 1 · Accepted Answer

好吧，看到这个问题在 11 年前就得到了回答，我想我会为正在编写自己的 BigInt 库的人提供一些指导。

首先，如果您想要纯粹的性能而不是学习如何实际编写高性能代码，请学习如何使用 GMP 或 OpenSSL。要达到 GMP 的性能水平，有一条非常陡峭的学习曲线。

好的，让我们开始吧。

当您可以使用更大的基数时，不要使用基数 10。 CPU在加减乘除方面都是神级的，好好利用吧。

假设你有两个 BigInt

a = {9,7,4,2,6,1,6,8} // length 8
b = {3,6,7,2,4,6,7,8} // length 8
// Frustrating writing for-loops to calculate a*b

当他们可以进行 1 次以 2^32 为底的计算时，不要让他们以 10 为底进行 50 次计算：

a = {97426168}
b = {36724678}
// Literally only need to type a*b

如果您的计算机可以表示的最大数是 2^64-1，请使用 2^32-1 作为 BigInt 的基数，因为它可以解决乘法时实际溢出的问题。

使用支持动态内存的结构。缩放您的程序以处理两个 100 万位数字的乘法可能会破坏您的程序，因为它在堆栈上没有足够的内存。在 C 中使用 std::vector 而不是 std::array 或 raw int[] 来利用您的内存。
了解SIMD以提高您的计算性能。菜鸟代码中的典型循环不能同时处理多个数据。学习这一点应该可以将速度从 3 倍提高到 12 倍。
了解如何编写自己的内存分配器。如果您使用 std::vector 来存储无符号整数，那么稍后您可能会遇到性能问题，因为 std::vector 仅用于一般目的。尝试根据自己的需要定制分配器，以避免每次执行计算时都进行分配和重新分配。
了解您的计算机架构和内存布局。编写您自己的汇编代码以适应特定的 CPU 架构肯定会提高您的性能。这也有助于编写您自己的内存分配器和 SIMD。
算法。对于小型 BigInt，您可以依靠您的小学乘法，但随着输入的增长，一定要好好看看 Karatsuba、Toom-Cook，最后是在您的库中实施的 FFT。

如果您遇到困难，请访问我的BigInt库。它没有自定义分配器、SIMD 代码或自定义汇编代码，但对于 BigInteger 的初学者来说应该足够了。

score 0 · Accepted Answer

我正在用 C++ 构建一个小型 BigInt 库，用于我的编程语言。

为什么？那里有一些优秀的现有 bigint 库（例如gmp、tommath），您可以直接使用它们，而无需从头开始编写自己的库。制作自己的作品需要大量工作，而且在性能方面不太可能有那么好。（特别是，编写快速代码来执行乘法和除法比乍看之下要复杂得多。）

c++ - C++ BigInt 乘法概念问题

5 回答 5

Related

Reference