我在 C++ / CUDA 中创建了一个内核,我需要将两个 128 位数字相加,如下所示:
struct Int128 {
unsigned int bit0_31;
unsigned int bit32_63;
unsigned int bit64_95;
unsigned int bit96_127;
};
Int128 sum(Int128 a, Int128 b) {
...?
}
实现这一目标的最有效的 C++ 方法是什么?谢谢。
PS溢出到129bit可以忽略。