[英]Can quicksort be implemented in C without stack and recursion?
参考页面中的代码做出了大胆的声明:
堆栈我的实现不使用堆栈来存储数据...
然而,函数定义有许多自动存储的变量,其中有 2 个具有 1000 个条目的数组,最终将使用固定但大量的堆栈空间:
// quickSort
//
// This public-domain C implementation by Darel Rex Finley.
//
// * Returns YES if sort was successful, or NO if the nested
// pivots went too deep, in which case your array will have
// been re-ordered, but probably not sorted correctly.
//
// * This function assumes it is called with valid parameters.
//
// * Example calls:
// quickSort(&myArray[0],5); // sorts elements 0, 1, 2, 3, and 4
// quickSort(&myArray[3],5); // sorts elements 3, 4, 5, 6, and 7
bool quickSort(int *arr, int elements) {
#define MAX_LEVELS 1000
int piv, beg[MAX_LEVELS], end[MAX_LEVELS], i=0, L, R ;
beg[0]=0; end[0]=elements;
while (i>=0) {
L=beg[i]; R=end[i]-1;
if (L<R) {
piv=arr[L]; if (i==MAX_LEVELS-1) return NO;
while (L<R) {
while (arr[R]>=piv && L<R) R--; if (L<R) arr[L++]=arr[R];
while (arr[L]<=piv && L<R) L++; if (L<R) arr[R--]=arr[L]; }
arr[L]=piv; beg[i+1]=L+1; end[i+1]=end[i]; end[i++]=L; }
else {
i--; }}
return YES; }
缩进样式非常混乱。 这是重新格式化的版本:
#define MAX_LEVELS 1000
bool quickSort(int *arr, int elements) {
int piv, beg[MAX_LEVELS], end[MAX_LEVELS], i = 0, L, R;
beg[0] = 0;
end[0] = elements;
while (i >= 0) {
L = beg[i];
R = end[i] - 1;
if (L < R) {
piv = arr[L];
if (i == MAX_LEVELS - 1)
return NO;
while (L < R) {
while (arr[R] >= piv && L < R)
R--;
if (L < R)
arr[L++] = arr[R];
while (arr[L] <= piv && L < R)
L++;
if (L < R)
arr[R--] = arr[L];
}
arr[L] = piv;
beg[i + 1] = L + 1;
end[i + 1] = end[i];
end[i++] = L;
} else {
i--;
}
}
return YES;
}
请注意, 1000
很大,但对于已经排序的中等大数组上的病理病例来说还不够。 该函数对此类大小仅为 1000 的数组返回NO
,这是不可接受的。
对于算法的改进版本,更低的值就足够了,其中较大的范围被推送到数组中,并且循环在较小的范围上进行迭代。 这确保了 N 个条目的数组可以处理一组 2 N个条目。 它在排序数组上仍然具有二次时间复杂度,但至少可以对所有可能大小的数组进行排序。
这是一个修改和检测的版本:
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define MAX_LEVELS 64
int quickSort(int *arr, size_t elements) {
size_t beg[MAX_LEVELS], end[MAX_LEVELS], L, R;
int i = 0;
beg[0] = 0;
end[0] = elements;
while (i >= 0) {
L = beg[i];
R = end[i];
if (L + 1 < R--) {
int piv = arr[L];
if (i == MAX_LEVELS - 1)
return -1;
while (L < R) {
while (arr[R] >= piv && L < R)
R--;
if (L < R)
arr[L++] = arr[R];
while (arr[L] <= piv && L < R)
L++;
if (L < R)
arr[R--] = arr[L];
}
arr[L] = piv;
if (L - beg[i] > end[i] - R) {
beg[i + 1] = L + 1;
end[i + 1] = end[i];
end[i++] = L;
} else {
beg[i + 1] = beg[i];
end[i + 1] = L;
beg[i++] = L + 1;
}
} else {
i--;
}
}
return 0;
}
int testsort(int *a, size_t size, const char *desc) {
clock_t t = clock();
size_t i;
if (quickSort(a, size)) {
printf("%s: quickSort failure\n", desc);
return 1;
}
for (i = 1; i < size; i++) {
if (a[i - 1] > a[i]) {
printf("%s: sorting error: a[%zu]=%d > a[%zu]=%d\n",
desc, i - 1, a[i - 1], i, a[i]);
return 2;
}
}
t = clock() - t;
printf("%s: %zu elements sorted in %.3fms\n",
desc, size, t * 1000.0 / CLOCKS_PER_SEC);
return 0;
}
int main(int argc, char *argv[]) {
size_t i, size = argc > 1 ? strtoull(argv[1], NULL, 0) : 1000;
int *a = malloc(sizeof(*a) * size);
if (a != NULL) {
for (i = 0; i < size; i++)
a[i] = rand();
testsort(a, size, "random");
for (i = 0; i < size; i++)
a[i] = i;
testsort(a, size, "sorted");
for (i = 0; i < size; i++)
a[i] = size - i;
testsort(a, size, "reverse sorted");
for (i = 0; i < size; i++)
a[i] = 0;
testsort(a, size, "constant");
free(a);
}
return 0;
}
输出:
random: 100000 elements sorted in 7.379ms
sorted: 100000 elements sorted in 2799.752ms
reverse sorted: 100000 elements sorted in 2768.844ms
constant: 100000 elements sorted in 2786.612ms
这是一个更能抵抗病理情况的轻微修改版本:
#define MAX_LEVELS 48
int quickSort(int *arr, size_t elements) {
size_t beg[MAX_LEVELS], end[MAX_LEVELS], L, R;
int i = 0;
beg[0] = 0;
end[0] = elements;
while (i >= 0) {
L = beg[i];
R = end[i];
if (R - L > 1) {
size_t M = L + ((R - L) >> 1);
int piv = arr[M];
arr[M] = arr[L];
if (i == MAX_LEVELS - 1)
return -1;
R--;
while (L < R) {
while (arr[R] >= piv && L < R)
R--;
if (L < R)
arr[L++] = arr[R];
while (arr[L] <= piv && L < R)
L++;
if (L < R)
arr[R--] = arr[L];
}
arr[L] = piv;
M = L + 1;
while (L > beg[i] && arr[L - 1] == piv)
L--;
while (M < end[i] && arr[M] == piv)
M++;
if (L - beg[i] > end[i] - M) {
beg[i + 1] = M;
end[i + 1] = end[i];
end[i++] = L;
} else {
beg[i + 1] = beg[i];
end[i + 1] = L;
beg[i++] = M;
}
} else {
i--;
}
}
return 0;
}
输出:
random: 10000000 elements sorted in 963.973ms
sorted: 10000000 elements sorted in 167.621ms
reverse sorted: 10000000 elements sorted in 167.375ms
constant: 10000000 elements sorted in 9.335ms
作为结论:
嗯,它可以,因为我在 fortran IV 中实现了快速排序(很久以前,并且在语言支持递归之前 - 这是一个赌注)。 但是,您确实需要某个地方(一个大数组可以)来记住您在执行个别工作时的状态。
递归要容易得多......
可以在没有堆栈和递归的情况下在 C 中实现快速排序吗?
快速排序需要从每个非平凡分区向前遵循两条路径:每个(子)分区的新分区。 有关先前分区的信息(结果分区之一的边界)需要传递到每个新分区。 那么,问题是这些信息在哪里? 特别是,当程序在另一个分区上工作时,有关一个分区的信息在哪里?
对于串行算法,答案是信息存储在堆栈或队列或其中之一的功能等价物上。 总是,因为这些是我们为所需目的服务的数据结构的名称。 特别是,递归是一种特殊情况,而不是替代方案。 在递归快速排序中,数据存储在调用堆栈中。 对于迭代实现,您可以在正式意义上实现堆栈,但也可以使用简单且相对较小的数组作为临时堆栈。
但是堆栈和队列等价物可以走得更远。 例如,您可以将数据附加到文件中,以便稍后回读。 您可以将其写入管道。 您可以通过通信网络将其异步传输给您自己。
如果你想发疯,你甚至可以嵌套迭代来代替递归。 这将对可以处理的数组的大小强加一个硬上限,但并不像您想象的那么严格。 稍加注意并掌握一些技巧,您就可以使用 25 个循环嵌套处理十亿个元素的数组。 如此深的巢穴虽然丑陋而疯狂,但还是可以想象的。 人类可以手写。 在这种情况下,一系列嵌套循环作用域及其块作用域变量充当堆栈等效项。
因此,答案取决于“无堆栈”的确切含义:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.