arrays - 数组中的差异总和

Question

有没有更有效的方法来实现这一点：给定一个A大小数组n和两个正整数a和b，找到floor(abs(A[i]-A[j])*a/b)所有对的总和，(i, j)其中0 <= i < j < n。

int A[n];
int a, b; // assigned some positive integer values
...
int total = 0;
for (int i = 0; i < n; i++) {
    for (int j = i+1; j < n; j++) {
        total += abs(A[i]-A[j])*a/b; // want integer division here
    }
}

为了稍微优化这一点，我对数组 ( O(nlogn)) 进行了排序，然后没有使用abs函数。此外，我在内部 for 循环之前缓存了该值a[i]，因此我可以A按顺序读取内容。我正在考虑预先计算a/b并将其存储在一个浮点数中，但是额外的转换只会让它变慢（特别是因为我想占用结果的地板）。

我想不出比O(n^2).

score 2 · Accepted Answer

是的，有一个更有效的算法。它可以在 O(n*log n) 中完成。我不希望有一种渐近更快的方法，但我对证明的想法还很遥远。

算法

首先在 O(n*log n) 时间内对数组进行排序。

现在，让我们看看条款

floor((A[j]-A[i])*a/b) = floor ((A[j]*a - A[i]*a)/b)

为0 <= i < j < n. 对于每一个0 <= k < n，写A[k]*a = q[k]*b + r[k]上0 <= r[k] < b。

对于A[k] >= 0，我们有q[k] = (A[k]*a)/b和r[k] = (A[k]*a)%b整数除法，对于A[k] < 0，我们有q[k] = (A[k]*a)/b - 1和r[k] = b + (A[k]*a)%b除非b除法，A[k]*a在这种情况下，我们有q[k] = (A[k]*a)/b和r[k] = 0。

现在我们重写条款：

floor((A[j]*a - A[i]*a)/b) = floor(q[j] - q[i] + (r[j] - r[i])/b)
                           = q[j] - q[i] + floor((r[j] - r[i])/b)

每个q[k]出现k次数为正号 (for i = 0, 1, .. , k-1) 和n-1-k次数为负号 (for j = k+1, k+2, ..., n-1)，因此其对总和的总贡献为

(k - (n-1-k))*q[k] = (2*k+1-n)*q[k]

其余部分仍需计算。现在，因为0 <= r[k] < b，我们有

-b < r[j] - r[i] < b

并且floor((r[j]-r[i])/b)是 0 时r[j] >= r[i]和-1时r[j] < r[i]。所以

                            n-1
 ∑ floor((A[j]-A[i])*a/b) =  ∑ (2*k+1-n)*q[k] - inversions(r)
i<j                         k=0

其中一个反转是一对具有和(i,j)的索引。0 <= i < j < nr[j] < r[i]

计算q[k]和r[k]求和(2*k+1-n)*q[k]是在 O(n) 时间内完成的。

它仍然有效地计算r[k]数组的反转。

对于每个索引0 <= k < n，让c(k)是i < k这样的数量r[k] < r[i]，即k作为较大索引出现的反转次数。

那么显然反转的次数是∑ c(k)。

另一方面，是在稳定排序c(k)中被移到后面的元素的数量（稳定性在这里很重要）。r[k]

计算这些移动，因此数组的反转很容易在合并排序时完成。

因此，反演也可以计算在 O(n*log n) 中，给出 O(n*log n) 的整体复杂度。

代码

具有简单不科学基准的示例实现（但朴素二次算法与上述算法之间的差异如此之大，以至于不科学的基准足以决定性）。

#include <stdlib.h>
#include <stdio.h>
#include <time.h>

long long mergesort(int *arr, unsigned elems);
long long merge(int *arr, unsigned elems, int *scratch);
long long nosort(int *arr, unsigned elems, long long a, long long b);
long long withsort(int *arr, unsigned elems, long long a, long long b);

int main(int argc, char *argv[]) {
    unsigned count = (argc > 1) ? strtoul(argv[1],NULL,0) : 1000;
    srand(time(NULL)+count);
    long long a, b;
    b = 1000 + 9000.0*rand()/(RAND_MAX+1.0);
    a = b/3 + (b-b/3)*1.0*rand()/(RAND_MAX + 1.0);
    int *arr1, *arr2;
    arr1 = malloc(count*sizeof *arr1);
    arr2 = malloc(count*sizeof *arr2);
    if (!arr1 || !arr2) {
        fprintf(stderr,"Allocation failed\n");
        exit(EXIT_FAILURE);
    }
    unsigned i;
    for(i = 0; i < count; ++i) {
        arr1[i] = 20000.0*rand()/(RAND_MAX + 1.0) - 2000;
    }
    for(i = 0; i < count; ++i) {
        arr2[i] = arr1[i];
    }
    long long res1, res2;
    double start = clock();
    res1 = nosort(arr1,count,a,b);
    double stop = clock();
    printf("Naive:   %lld in %.3fs\n",res1,(stop-start)/CLOCKS_PER_SEC);
    start = clock();
    res2 = withsort(arr2,count,a,b);
    stop = clock();
    printf("Sorting: %lld in %.3fs\n",res2,(stop-start)/CLOCKS_PER_SEC);
    return EXIT_SUCCESS;
}

long long nosort(int *arr, unsigned elems, long long a, long long b) {
    long long total = 0;
    unsigned i, j;
    long long m;
    for(i = 0; i < elems-1; ++i) {
        m = arr[i];
        for(j = i+1; j < elems; ++j) {
            long long d = (arr[j] < m) ? (m-arr[j]) : (arr[j]-m);
            total += (d*a)/b;
        }
    }
    return total;
}

long long withsort(int *arr, unsigned elems, long long a, long long b) {
    long long total = 0;
    unsigned i;
    mergesort(arr,elems);
    for(i = 0; i < elems; ++i) {
        long long q, r;
        q = (arr[i]*a)/b;
        r = (arr[i]*a)%b;
        if (r < 0) {
            r += b;
            q -= 1;
        }
        total += (2*i+1LL-elems)*q;
        arr[i] = (int)r;
    }
    total -= mergesort(arr,elems);
    return total;
}

long long mergesort(int *arr, unsigned elems) {
    if (elems < 2) return 0;
    int *scratch = malloc((elems + 1)/2*sizeof *scratch);
    if (!scratch) {
        fprintf(stderr,"Alloc failure\n");
        exit(EXIT_FAILURE);
    }
    return merge(arr, elems, scratch);
}

long long merge(int *arr, unsigned elems, int *scratch) {
    if (elems < 2) return 0;
    unsigned left = (elems + 1)/2, right = elems-left, i, j, k;
    long long inversions = 0;
    inversions += merge(arr, left, scratch);
    inversions += merge(arr+left,right,scratch);
    if (arr[left] < arr[left-1]) {
        for(i = 0; i < left; ++i) {
            scratch[i] = arr[i];
        }
        i = 0; j = 0; k = 0;
        int *lptr = scratch, *rptr = arr+left;
        while(i < left && j < right) {
            if (rptr[j] < lptr[i]) {
                arr[k++] = rptr[j++];
                inversions += (left-i);
            } else {
                arr[k++] = lptr[i++];
            }
        }
        while(i < left) arr[k++] = lptr[i++];
    }
    return inversions;
}

arrays - 数组中的差异总和

1 回答 1

算法

代码

Related

Reference