假设您有一个无符号整数列表。假设某些元素等于 0,并且您想将它们推回。目前我使用此代码(列表是指向大小为 n 的无符号整数列表的指针

for (i = 0; i < n; ++i) 
    if (list[i])
    int j;
    for (j = i + 1; j < n && !list[j]; ++j);
    int z;
    for (z = j + 1; z < n && list[z]; ++z);
    if (j == n)
    memmove(&(list[i]), &(list[j]), sizeof(unsigned int) * (z - j)));
    int s = z - j + i;
    for(j = s; j < z; ++j) 
        list[j] = 0;
    i = s - 1;


该片段纯属理论,在生产代码中,列表的每个元素都是一个 64 字节的结构


void RemoveDeadParticles(int * list, int * n)
    int i, j = *n - 1;
    for (; j >= 0 && list[j] == 0; --j);
    for (i = 0; i <= j; ++i)
        if (list[i])
        memcpy(&(list[i]), &(list[j]), sizeof(int));
        list[j] = 0;
        for (; j >= 0 && list[j] == 0; --j);
        if (i == j)

    *n = i;

4 回答 4



如果你小心的话,有一个直线 O(N) 算法;你的是 O(N 2 )。鉴于该顺序无关紧要,每次您在数组中遇到一个零时,您都将它与最后一个可能不是零的元素交换。这是通过数组的一次。需要注意边界条件。

需要小心;测试代码中的酸测试list3[]引起了悲伤,直到我得到了正确的边界条件。请注意,大小为 0 或 1 的列表的顺序已经正确。

#include <stdio.h>
#define DIM(x)  (sizeof(x)/sizeof(*(x)))

extern void shunt_zeroes(int *list, size_t n);

void shunt_zeroes(int *list, size_t n)
    if (n > 1)
        size_t tail = n;
        for (size_t i = 0; i < tail - 1; i++)
            if (list[i] == 0)
                while (--tail > i + 1 && list[tail] == 0)
                if (tail > i)
                    int t = list[i];
                    list[i] = list[tail];
                    list[tail] = t;

static void dump_list(const char *tag, int *list, size_t n)
    printf("%-8s", tag);
    for (size_t i = 0; i < n; i++)
        printf("%d ", list[i]);

static void test_list(int *list, size_t n)
    dump_list("Before:", list, n);
    shunt_zeroes(list, n);
    dump_list("After:", list, n);

int main(void)
    int list1[] = { 1, 0, 2, 0, 3, 0, 4, 0, 5 };
    int list2[] = { 1, 2, 2, 0, 3, 0, 4, 0, 0 };
    int list3[] = { 0, 0, 0, 0, 0, 0, 0, 0, 0 };
    int list4[] = { 0, 1 };
    int list5[] = { 0, 0 };
    int list6[] = { 0 };
    test_list(list1, DIM(list1));
    test_list(list2, DIM(list2));
    test_list(list3, DIM(list3));
    test_list(list4, DIM(list4));
    test_list(list5, DIM(list5));
    test_list(list6, DIM(list6));


$ shuntzeroes
Before: 1 0 2 0 3 0 4 0 5 
After:  1 5 2 4 3 0 0 0 0 
Before: 1 2 2 0 3 0 4 0 0 
After:  1 2 2 4 3 0 0 0 0 
Before: 0 0 0 0 0 0 0 0 0 
After:  0 0 0 0 0 0 0 0 0 
Before: 0 1 
After:  1 0 
Before: 0 0 
After:  0 0 
Before: 0 
After:  0 


我已经断言问题和UmNyobe的答案中的原始代码是 O(N 2 ),但这是 O(N)。但是,在所有三种情况下,循环中都有一个循环。当其他答案为 O(N 2 )时,为什么这个答案是线性的?




UmNyobe 和 Argeman 都断言UmNyobe的答案中的代码是线性的,O(N),而不是二次的,O(N 2 ),正如我在对答案的评论中断言的那样。鉴于两种相反的观点,我编写了一个程序来检查我的断言。

这是一个充分证明了这一点的测试结果。所描述的代码"timer.h"是我的平台中立定时接口;可根据要求提供其代码(请参阅我的个人资料)。该测试是在配备 2.3 GHz Intel Core i7、Mac OS X 10.7.5、GCC 4.7.1 的 MacBook Pro 上进行的。

我对 UmNyobe 的代码所做的唯一更改是将数组索引从 更改为intsize_t以便外部函数接口与我的相同,并保持内部一致性。

测试代码包括一个热身练习,以显示这些函数产生相同的答案;UmNyobe 的答案保留了数组中的顺序,而我的则没有。我已经从计时数据中省略了这些信息。

$ make on2
gcc -O3 -g -I/Users/jleffler/inc -std=c99 -Wall -Wextra -L/Users/jleffler/lib/64 on2.c -ljl -o on2


第 1 组:在没有 UmNyobe 修正算法的旧版本测试工具上。

shunt_zeroes:        100    0.000001
shunt_zeroes:       1000    0.000005
shunt_zeroes:      10000    0.000020
shunt_zeroes:     100000    0.000181
shunt_zeroes:    1000000    0.001468
pushbackzeros:       100    0.000001
pushbackzeros:      1000    0.000086
pushbackzeros:     10000    0.007003
pushbackzeros:    100000    0.624870
pushbackzeros:   1000000   46.928721
shunt_zeroes:        100    0.000000
shunt_zeroes:       1000    0.000002
shunt_zeroes:      10000    0.000011
shunt_zeroes:     100000    0.000113
shunt_zeroes:    1000000    0.000923
pushbackzeros:       100    0.000001
pushbackzeros:      1000    0.000097
pushbackzeros:     10000    0.007077
pushbackzeros:    100000    0.628327
pushbackzeros:   1000000   41.512151

机器上最多只有非常轻的背景负载;例如,我暂停了通常在后台运行的 Boinc 计算。详细的时间安排并没有我想的那么稳定,但结论很清楚。

  • 我的算法是 O(N)
  • UmNyobe 的(原始)算法为 O(N 2 )

第 2 组:使用 UmNyobe 的修正算法

还包括 Patrik 的前后算法,以及 Wildplasser 的算法(参见下面的源代码);测试程序从 重命名on2timezeromoves

$ ./timezeromoves -c -m 100000 -n 1
shunt_zeroes: (Jonathan)
shunt_zeroes:        100    0.000001
shunt_zeroes:       1000    0.000003
shunt_zeroes:      10000    0.000018
shunt_zeroes:     100000    0.000155
RemoveDead: (Patrik)
RemoveDead:          100    0.000001
RemoveDead:         1000    0.000004
RemoveDead:        10000    0.000018
RemoveDead:       100000    0.000159
pushbackzeros2: (UmNyobe)
pushbackzeros2:      100    0.000001
pushbackzeros2:     1000    0.000005
pushbackzeros2:    10000    0.000031
pushbackzeros2:   100000    0.000449
list_compact: (Wildplasser)
list_compact:        100    0.000004
list_compact:       1000    0.000005
list_compact:      10000    0.000036
list_compact:     100000    0.000385
shufflezeroes: (Patrik)
shufflezeroes:       100    0.000003
shufflezeroes:      1000    0.000069
shufflezeroes:     10000    0.006685
shufflezeroes:    100000    0.504551
pushbackzeros: (UmNyobe)
pushbackzeros:       100    0.000003
pushbackzeros:      1000    0.000126
pushbackzeros:     10000    0.011719
pushbackzeros:    100000    0.480458

这表明 UmNyobe 的修正算法是 O(N),其他解决方案也是如此。原始代码显示为 O(N 2 ),UmNyobe 的原始算法也是如此。


这是修改后的测试程序(重命名为testzeromoves.c)。算法实现位于顶部。测试工具在评论“测试工具”之后。该命令可以进行检查或计时或两者(默认);它默认进行两次迭代;默认情况下,它的大小可达一百万个条目。您可以使用-c标志省略检查,使用-t标志省略计时,使用-n标志指定迭代次数,使用-m标志指定最大大小。过百万要谨慎;您可能会遇到 VLA(可变长度数组)炸毁堆栈的问题。修改代码以使用它会很malloc()容易free();不过,这似乎没有必要。

#include <string.h>

#define MAX(x, y)   (((x) > (y)) ? (x) : (y))

extern void shunt_zeroes(int *list, size_t n);
extern void pushbackzeros(int *list, size_t n);
extern void pushbackzeros2(int *list, size_t n);
extern void shufflezeroes(int *list, size_t n);
extern void RemoveDead(int *list, size_t n);
extern void list_compact(int *arr, size_t cnt);

void list_compact(int *arr, size_t cnt)
    size_t dst,src,pos;

    /* Skip leading filled area; find start of blanks */
    for (pos=0; pos < cnt; pos++) {
        if ( !arr[pos] ) break;
    if (pos == cnt) return;

    for(dst= pos; ++pos < cnt; ) { 
        /* Skip blanks; find start of filled area */
        if ( !arr[pos] ) continue;

        /* Find end of filled area */
        for(src = pos; ++pos < cnt; ) {
            if ( !arr[pos] ) break;
        if (pos > src) {
            memmove(arr+dst, arr+src, (pos-src) * sizeof arr[0] );
            dst += pos-src;

/* Cannot change j to size_t safely; algorithm relies on it going negative */
void RemoveDead(int *list, size_t n)
    int i, j = n - 1;
    for (; j >= 0 && list[j] == 0; --j)
    for (i = 0; i <= j; ++i)
        if (list[i])
        memcpy(&(list[i]), &(list[j]), sizeof(int));
        list[j] = 0;
        for (; j >= 0 && list[j] == 0; --j);
        if (i == j)

void shufflezeroes(int *list, size_t n)
    for (size_t i = 0; i < n; ++i) 
        if (list[i])
        size_t j;
        for (j = i + 1; j < n && !list[j]; ++j)
        size_t z;
        for (z = j + 1; z < n && list[z]; ++z)
        if (j == n)
        memmove(&(list[i]), &(list[j]), sizeof(int) * (z - j));
        size_t s = z - j + i;
        for(j = s; j < z; ++j) 
            list[j] = 0;
        i = s - 1;

static int nextZero(int* list, size_t start, size_t n){
   size_t i = start;
   while(i < n && list[i])
   return i;

static int nextNonZero(int* list, size_t start, size_t n){
   size_t i = start;
   while(i < n && !list[i])
   return i;

void pushbackzeros(int* list, size_t n){
    size_t i = 0;
    size_t j = 0;
    while(i < n && j < n){
         i = nextZero(list,i, n);
         j = nextNonZero(list,i, n);
         if(i >= n || j >=n)
         list[i] = list[j];
         list[j] = 0;

/* Amended algorithm */
void pushbackzeros2(int* list, size_t n){
    size_t i = 0;
    size_t j = 0;
    while(i < n && j < n){
         i = nextZero(list, i, n);
         j = nextNonZero(list, MAX(i,j), n);
         if(i >= n || j >=n)
         list[i] = list[j];
         list[j] = 0;

void shunt_zeroes(int *list, size_t n)
    if (n > 1)
        size_t tail = n;
        for (size_t i = 0; i < tail - 1; i++)
            if (list[i] == 0)
                while (--tail > i + 1 && list[tail] == 0)
                if (tail > i)
                    int t = list[i];
                    list[i] = list[tail];
                    list[tail] = t;

/* Test Harness */

#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include "timer.h"

#define DIM(x)      (sizeof(x)/sizeof(*(x)))

typedef void (*Shunter)(int *list, size_t n);

typedef struct FUT      /* FUT = Function Under Test */
    Shunter function;
    const char *name;
    const char *author;
} FUT;

static int tflag = 1;   /* timing */
static int cflag = 1;   /* checking */
static size_t maxsize = 1000000;

static void dump_list(const char *tag, int *list, size_t n)
    printf("%-8s", tag);
    for (size_t i = 0; i < n; i++)
        printf("%d ", list[i]);

static void test_list(int *list, size_t n, Shunter s)
    dump_list("Before:", list, n);
    (*s)(list, n);
    dump_list("After:", list, n);

static void list_of_tests(const FUT *f)
    int list1[] = { 1, 0, 2, 0, 3, 0, 4, 0, 5 };
    int list2[] = { 1, 2, 2, 0, 3, 0, 4, 0, 0 };
    int list3[] = { 0, 0, 0, 0, 0, 0, 0, 0, 0 };
    int list4[] = { 0, 1 };
    int list5[] = { 0, 0 };
    int list6[] = { 0 };

    test_list(list1, DIM(list1), f->function);
    test_list(list2, DIM(list2), f->function);
    test_list(list3, DIM(list3), f->function);
    test_list(list4, DIM(list4), f->function);
    test_list(list5, DIM(list5), f->function);
    test_list(list6, DIM(list6), f->function);

static void test_timer(int *list, size_t n, const FUT *f)
    Clock t;
    f->function(list, n);
    char buffer[32];
    printf("%-15s  %7zu  %10s\n", f->name, n, clk_elapsed_us(&t, buffer, sizeof(buffer)));

static void gen_test(size_t n, const FUT *f)
    int list[n];
    for (size_t i = 0; i < n/2; i += 2)
        list[2*i+0] = i;
        list[2*i+1] = 0;
    test_timer(list, n, f);

static void timed_run(const FUT *f)
    printf("%s (%s)\n", f->name, f->author);
    if (cflag)
    if (tflag)
        for (size_t n = 100; n <= maxsize; n *= 10)
            gen_test(n, f);

static const char optstr[] = "cm:n:t";
static const char usestr[] = "[-ct][-m maxsize][-n iterations]";

int main(int argc, char **argv)
    FUT functions[] =
        { shunt_zeroes,   "shunt_zeroes:",   "Jonathan"    },   /* O(N) */
        { RemoveDead,     "RemoveDead:",     "Patrik"      },   /* O(N) */
        { pushbackzeros2, "pushbackzeros2:", "UmNyobe"     },   /* O(N) */
        { list_compact,   "list_compact:",   "Wildplasser" },   /* O(N) */
        { shufflezeroes,  "shufflezeroes:",  "Patrik"      },   /* O(N^2) */
        { pushbackzeros,  "pushbackzeros:",  "UmNyobe"     },   /* O(N^2) */
    enum { NUM_FUNCTIONS = sizeof(functions)/sizeof(functions[0]) };
    int opt;
    int itercount = 2;

    while ((opt = getopt(argc, argv, optstr)) != -1)
        switch (opt)
        case 'c':
            cflag = 0;
        case 't':
            tflag = 0;
        case 'n':
            itercount = atoi(optarg);
        case 'm':
            maxsize = strtoull(optarg, 0, 0);
            fprintf(stderr, "Usage: %s %s\n", argv[0], usestr);

    for (int i = 0; i < itercount; i++)
        for (int j = 0; j < NUM_FUNCTIONS; j++)
        if (tflag == 0)
        cflag = 0;  /* Don't check on subsequent iterations */

    return 0;
于 2012-09-20T16:46:49.450 回答


int nextZero(int* list, int start, int n){
   int i = start;
   while(i < n && list[i])
   return i;

int nextNonZero(int* list, int start, int n){
   int i = start;
   while(i < n && !list[i])
   return i;

void pushbackzeros(int* list, int n){
    int i = 0;
    int j = 0;
    while(i < n && j < n){
         i = nextZero(list,i, n);
         j = nextNonZero(list,i, n);
         if(i >= n || j >=n)
         list[i] = list[j];
         list[j] = 0;


  • 您找到第一个零位 ( i)
  • 你找到下一个非零位置( j)
  • 如果订购不正确,您交换
  • 您从当前位置重新开始(或找到一个新的非零元素进行交换)

复杂度:O(n). 在最坏的情况下,每个索引最多访问 4 次(一次 by i,一次 by jin 函数),然后在交换期间访问。



上面代码的复杂度是 O(n^2),因为索引 j 可以“返回”以查找非零项目,即检查它已经拥有的项目。它发生在下一个零在下一个非零之前。修复比较简单,

  j = nextNonZero(list,MAX(i,j), n);


  j = nextNonZero(list,i, n);
于 2012-09-20T15:31:12.480 回答


#include <stdio.h>
#include <string.h>

size_t list_compact(int *arr, size_t cnt);

size_t list_compact(int *arr, size_t cnt)
    size_t dst,src,pos;

    /* Skip leading filled area; find start of blanks */
    for (pos=0; pos < cnt; pos++) {
        if ( !arr[pos] ) break;
    if (pos == cnt) return pos;

    for(dst= pos; ++pos < cnt; ) { 
        /* Skip blanks; find start of filled area */
        if ( !arr[pos] ) continue;

        /* Find end of filled area */
        for(src = pos; ++pos < cnt; ) {
            if ( !arr[pos] ) break;
        if (pos > src) {
            memcpy(arr+dst, arr+src, (pos-src) * sizeof arr[0] );
            dst += pos-src;
     if (cnt > src) memset( arr + src, 0, (cnt-src) * sizeof arr[0] );
    return dst;

更新:这是 Jonathan Leffler shuffle 方法的紧凑版本(不保持原始顺序):

size_t list_compact(int *arr, size_t cnt)
    int *beg,*end;
    if (!cnt) return 0;

    for (beg = arr, end=arr+cnt-1; beg <= end; ) {
        if ( *beg ) { beg++; continue; }
        if ( !*end ) { end--; continue; }
        *beg++ = *end--;

        if (beg < arr+cnt) memset(beg, 0, (arr+cnt-beg) *sizeof *arr);
        return cnt;
    return beg - arr;

更新:(感谢 Jonathan Leffler)memmove() 确实应该是 memcpy(),因为缓冲区不可能重叠。

GCC 4.6.1 需要 -minline-all-stringops 来内联 memcpy()。memmove() 从不内联,所以看起来。


于 2012-09-20T22:20:05.823 回答

一个非常简单的 O(n) 算法是遍历列表,每次遇到零条目时删除它,记录您在此过程中删除的条目数 M,当您完成遍历列表时添加该数字列表末尾的 M 个零条目。

这需要对连续元素进行 N 次检查,其中 N 是列表的长度,M 次删除,M 次插入到列表的末尾。最坏的情况是,如果整个列表被零个条目填充,您将执行 N 次读取、N 次删除和 N 次插入。

于 2012-09-20T19:17:14.833 回答