这是我能想到的最节省内存的布局。显然,我正在使用的向量将被您正在使用的数据 blob 替换,假设 endian-ness 都处理得很好。下面代码的前提很简单。
成对生成 1024 个随机值,每对包含 1 到 500 之间的第一个数字,1 到 50 之间的第二个数字。
迭代整个列表,将所有偶数索引值及其以下奇数索引兄弟翻转。
将整个事物发送到std::qsort
,项目宽度为两(2) 个int32_t
值,计数为原始向量的一半。
比较器函数首先对立即值进行排序,如果第一个值相等,则对第二个值进行排序。
下面的示例对 1024 个项目执行此操作。我已经对 134217728 个项目(恰好 536870912 字节)进行了无输出测试,结果对于一台微不足道的 macbook air 笔记本电脑来说非常令人印象深刻,大约 15 秒,实际排序中只有大约 10 秒。理想情况下最重要的是除了数据向量之外不需要额外的内存分配。是的,对于纯粹主义者来说,我确实使用了调用堆栈空间,但这只是因为 q-sort 使用了。
我希望你能从中有所收获。
注意:我只显示输出的第一部分,但我希望它显示您正在寻找的内容。
#include <iostream>
#include <fstream>
#include <algorithm>
#include <iterator>
#include <cstdint>
// a most-wacked-out random generator. every other call will
// pull from a rand modulo either the first, or second template
// parameter, in alternation.
template<int N,int M>
struct randN
{
int i = 0;
int32_t operator ()()
{
i = (i+1)%2;
return (i ? rand() % N : rand() % M) + 1;
}
};
// compare to integer values by address.
int pair_cmp(const void* arg1, const void* arg2)
{
const int32_t *left = (const int32_t*)arg1;
const int32_t *right = (const int32_t *)arg2;
return (left[0] == right[0]) ? left[1] - right[1] : left[0] - right[0];
}
int main(int argc, char *argv[])
{
// a crapload of int values
static const size_t N = 1024;
// seed rand()
srand((unsigned)time(0));
// get a huge array of random crap from 1..50
vector<int32_t> data;
data.reserve(N);
std::generate_n(back_inserter(data), N, randN<500,50>());
// flip all the values
for (size_t i=0;i<data.size();i+=2)
{
int32_t tmp = data[i];
data[i] = data[i+1];
data[i+1] = tmp;
}
// now sort in pairs. using qsort only because it lends itself
// *very* nicely to performing block-based sorting.
std::qsort(&data[0], data.size()/2, sizeof(data[0])*2, pair_cmp);
cout << "After sorting..." << endl;
std::copy(data.begin(), data.end(), ostream_iterator<int32_t>(cout,"\n"));
cout << endl << endl;
return EXIT_SUCCESS;
}
输出
After sorting...
1
69
1
83
1
198
1
343
1
367
2
12
2
30
2
135
2
169
2
185
2
284
2
323
2
325
2
347
2
367
2
373
2
382
2
422
2
492
3
286
3
321
3
364
3
377
3
400
3
418
3
441
4
24
4
97
4
153
4
210
4
224
4
250
4
354
4
356
4
386
4
430
5
14
5
26
5
95
5
145
5
302
5
379
5
435
5
436
5
499
6
67
6
104
6
135
6
164
6
179
6
310
6
321
6
399
6
409
6
425
6
467
6
496
7
18
7
65
7
71
7
84
7
116
7
201
7
242
7
251
7
256
7
324
7
325
7
485
8
52
8
93
8
156
8
193
8
285
8
307
8
410
8
456
8
471
9
27
9
116
9
137
9
143
9
190
9
190
9
293
9
419
9
453