是的,有一个更有效的算法。它可以在 O(n*log n) 中完成。我不希望有一种渐近更快的方法,但我对证明的想法还很遥远。
算法
首先在 O(n*log n) 时间内对数组进行排序。
现在,让我们看看条款
floor((A[j]-A[i])*a/b) = floor ((A[j]*a - A[i]*a)/b)
为0 <= i < j < n
. 对于每一个0 <= k < n
,写A[k]*a = q[k]*b + r[k]
上0 <= r[k] < b
。
对于A[k] >= 0
,我们有q[k] = (A[k]*a)/b
和r[k] = (A[k]*a)%b
整数除法,对于A[k] < 0
,我们有q[k] = (A[k]*a)/b - 1
和r[k] = b + (A[k]*a)%b
除非b
除法,A[k]*a
在这种情况下,我们有q[k] = (A[k]*a)/b
和r[k] = 0
。
现在我们重写条款:
floor((A[j]*a - A[i]*a)/b) = floor(q[j] - q[i] + (r[j] - r[i])/b)
= q[j] - q[i] + floor((r[j] - r[i])/b)
每个q[k]
出现k
次数为正号 (for i = 0, 1, .. , k-1
) 和n-1-k
次数为负号 (for j = k+1, k+2, ..., n-1
),因此其对总和的总贡献为
(k - (n-1-k))*q[k] = (2*k+1-n)*q[k]
其余部分仍需计算。现在,因为0 <= r[k] < b
,我们有
-b < r[j] - r[i] < b
并且floor((r[j]-r[i])/b)
是 0 时r[j] >= r[i]
和-1
时r[j] < r[i]
。所以
n-1
∑ floor((A[j]-A[i])*a/b) = ∑ (2*k+1-n)*q[k] - inversions(r)
i<j k=0
其中一个反转是一对具有和(i,j)
的索引。0 <= i < j < n
r[j] < r[i]
计算q[k]
和r[k]
求和(2*k+1-n)*q[k]
是在 O(n) 时间内完成的。
它仍然有效地计算r[k]
数组的反转。
对于每个索引0 <= k < n
,让c(k)
是i < k
这样的数量r[k] < r[i]
,即k
作为较大索引出现的反转次数。
那么显然反转的次数是∑ c(k)
。
另一方面,是在稳定排序c(k)
中被移到后面的元素的数量(稳定性在这里很重要)。r[k]
计算这些移动,因此数组的反转很容易在合并排序时完成。
因此,反演也可以计算在 O(n*log n) 中,给出 O(n*log n) 的整体复杂度。
代码
具有简单不科学基准的示例实现(但朴素二次算法与上述算法之间的差异如此之大,以至于不科学的基准足以决定性)。
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
long long mergesort(int *arr, unsigned elems);
long long merge(int *arr, unsigned elems, int *scratch);
long long nosort(int *arr, unsigned elems, long long a, long long b);
long long withsort(int *arr, unsigned elems, long long a, long long b);
int main(int argc, char *argv[]) {
unsigned count = (argc > 1) ? strtoul(argv[1],NULL,0) : 1000;
srand(time(NULL)+count);
long long a, b;
b = 1000 + 9000.0*rand()/(RAND_MAX+1.0);
a = b/3 + (b-b/3)*1.0*rand()/(RAND_MAX + 1.0);
int *arr1, *arr2;
arr1 = malloc(count*sizeof *arr1);
arr2 = malloc(count*sizeof *arr2);
if (!arr1 || !arr2) {
fprintf(stderr,"Allocation failed\n");
exit(EXIT_FAILURE);
}
unsigned i;
for(i = 0; i < count; ++i) {
arr1[i] = 20000.0*rand()/(RAND_MAX + 1.0) - 2000;
}
for(i = 0; i < count; ++i) {
arr2[i] = arr1[i];
}
long long res1, res2;
double start = clock();
res1 = nosort(arr1,count,a,b);
double stop = clock();
printf("Naive: %lld in %.3fs\n",res1,(stop-start)/CLOCKS_PER_SEC);
start = clock();
res2 = withsort(arr2,count,a,b);
stop = clock();
printf("Sorting: %lld in %.3fs\n",res2,(stop-start)/CLOCKS_PER_SEC);
return EXIT_SUCCESS;
}
long long nosort(int *arr, unsigned elems, long long a, long long b) {
long long total = 0;
unsigned i, j;
long long m;
for(i = 0; i < elems-1; ++i) {
m = arr[i];
for(j = i+1; j < elems; ++j) {
long long d = (arr[j] < m) ? (m-arr[j]) : (arr[j]-m);
total += (d*a)/b;
}
}
return total;
}
long long withsort(int *arr, unsigned elems, long long a, long long b) {
long long total = 0;
unsigned i;
mergesort(arr,elems);
for(i = 0; i < elems; ++i) {
long long q, r;
q = (arr[i]*a)/b;
r = (arr[i]*a)%b;
if (r < 0) {
r += b;
q -= 1;
}
total += (2*i+1LL-elems)*q;
arr[i] = (int)r;
}
total -= mergesort(arr,elems);
return total;
}
long long mergesort(int *arr, unsigned elems) {
if (elems < 2) return 0;
int *scratch = malloc((elems + 1)/2*sizeof *scratch);
if (!scratch) {
fprintf(stderr,"Alloc failure\n");
exit(EXIT_FAILURE);
}
return merge(arr, elems, scratch);
}
long long merge(int *arr, unsigned elems, int *scratch) {
if (elems < 2) return 0;
unsigned left = (elems + 1)/2, right = elems-left, i, j, k;
long long inversions = 0;
inversions += merge(arr, left, scratch);
inversions += merge(arr+left,right,scratch);
if (arr[left] < arr[left-1]) {
for(i = 0; i < left; ++i) {
scratch[i] = arr[i];
}
i = 0; j = 0; k = 0;
int *lptr = scratch, *rptr = arr+left;
while(i < left && j < right) {
if (rptr[j] < lptr[i]) {
arr[k++] = rptr[j++];
inversions += (left-i);
} else {
arr[k++] = lptr[i++];
}
}
while(i < left) arr[k++] = lptr[i++];
}
return inversions;
}