繁体   English   中英

可以在没有堆栈和递归的情况下在 C 中实现快速排序吗?

[英]Can quicksort be implemented in C without stack and recursion?

我发现这篇文章如何在 c 中不使用堆栈进行迭代快速排序? 但建议的答案确实使用了内联堆栈数组! (只允许恒定量的额外空间)

参考页面中的代码做出了大胆的声明:

堆栈我的实现不使用堆栈来存储数据...

然而,函数定义有许多自动存储的变量,其中有 2 个具有 1000 个条目的数组,最终将使用固定但大量的堆栈空间:

//  quickSort
//
//  This public-domain C implementation by Darel Rex Finley.
//
//  * Returns YES if sort was successful, or NO if the nested
//    pivots went too deep, in which case your array will have
//    been re-ordered, but probably not sorted correctly.
//
//  * This function assumes it is called with valid parameters.
//
//  * Example calls:
//    quickSort(&myArray[0],5); // sorts elements 0, 1, 2, 3, and 4
//    quickSort(&myArray[3],5); // sorts elements 3, 4, 5, 6, and 7

bool quickSort(int *arr, int elements) {

  #define  MAX_LEVELS  1000

  int  piv, beg[MAX_LEVELS], end[MAX_LEVELS], i=0, L, R ;

  beg[0]=0; end[0]=elements;
  while (i>=0) {
    L=beg[i]; R=end[i]-1;
    if (L<R) {
      piv=arr[L]; if (i==MAX_LEVELS-1) return NO;
      while (L<R) {
        while (arr[R]>=piv && L<R) R--; if (L<R) arr[L++]=arr[R];
        while (arr[L]<=piv && L<R) L++; if (L<R) arr[R--]=arr[L]; }
      arr[L]=piv; beg[i+1]=L+1; end[i+1]=end[i]; end[i++]=L; }
    else {
      i--; }}
  return YES; }

缩进样式非常混乱。 这是重新格式化的版本:

#define MAX_LEVELS  1000

bool quickSort(int *arr, int elements) {
    int piv, beg[MAX_LEVELS], end[MAX_LEVELS], i = 0, L, R;

    beg[0] = 0;
    end[0] = elements;
    while (i >= 0) {
        L = beg[i];
        R = end[i] - 1;
        if (L < R) {
            piv = arr[L];
            if (i == MAX_LEVELS - 1)
                return NO;
            while (L < R) {
                while (arr[R] >= piv && L < R)
                    R--;
                if (L < R)
                    arr[L++] = arr[R];
                while (arr[L] <= piv && L < R)
                    L++;
                if (L < R)
                    arr[R--] = arr[L];
            }
            arr[L] = piv;
            beg[i + 1] = L + 1;
            end[i + 1] = end[i];
            end[i++] = L;
        } else {
            i--;
        }
    }
    return YES;
}

请注意, 1000很大,但对于已经排序的中等大数组上的病理病例来说还不够。 该函数对此类大小仅为 1000 的数组返回NO ,这是不可接受的。

对于算法的改进版本,更低的值就足够了,其中较大的范围被推送到数组中,并且循环在较小的范围上进行迭代。 这确保了 N 个条目的数组可以处理一组 2 N个条目。 它在排序数组上仍然具有二次时间复杂度,但至少可以对所有可能大小的数组进行排序。

这是一个修改和检测的版本:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAX_LEVELS  64

int quickSort(int *arr, size_t elements) {
    size_t beg[MAX_LEVELS], end[MAX_LEVELS], L, R;
    int i = 0;

    beg[0] = 0;
    end[0] = elements;
    while (i >= 0) {
        L = beg[i];
        R = end[i];
        if (L + 1 < R--) {
            int piv = arr[L];
            if (i == MAX_LEVELS - 1)
                return -1;
            while (L < R) {
                while (arr[R] >= piv && L < R)
                    R--;
                if (L < R)
                    arr[L++] = arr[R];
                while (arr[L] <= piv && L < R)
                    L++;
                if (L < R)
                    arr[R--] = arr[L];
            }
            arr[L] = piv;
            if (L - beg[i] > end[i] - R) { 
                beg[i + 1] = L + 1;
                end[i + 1] = end[i];
                end[i++] = L;
            } else {
                beg[i + 1] = beg[i];
                end[i + 1] = L;
                beg[i++] = L + 1;
            }
        } else {
            i--;
        }
    }
    return 0;
}

int testsort(int *a, size_t size, const char *desc) {
    clock_t t = clock();
    size_t i;

    if (quickSort(a, size)) {
        printf("%s: quickSort failure\n", desc);
        return 1;
    }
    for (i = 1; i < size; i++) {
        if (a[i - 1] > a[i]) {
            printf("%s: sorting error: a[%zu]=%d > a[%zu]=%d\n",
                   desc, i - 1, a[i - 1], i, a[i]);
            return 2;
        }
    }
    t = clock() - t;
    printf("%s: %zu elements sorted in %.3fms\n",
           desc, size, t * 1000.0 / CLOCKS_PER_SEC);
    return 0;
}

int main(int argc, char *argv[]) {
    size_t i, size = argc > 1 ? strtoull(argv[1], NULL, 0) : 1000;
    int *a = malloc(sizeof(*a) * size);
    if (a != NULL) {
        for (i = 0; i < size; i++)
            a[i] = rand();
        testsort(a, size, "random");
        for (i = 0; i < size; i++)
            a[i] = i;
        testsort(a, size, "sorted");
        for (i = 0; i < size; i++)
            a[i] = size - i;
        testsort(a, size, "reverse sorted");
        for (i = 0; i < size; i++)
            a[i] = 0;
        testsort(a, size, "constant");
        free(a);
    }
    return 0;
}

输出:

random: 100000 elements sorted in 7.379ms
sorted: 100000 elements sorted in 2799.752ms
reverse sorted: 100000 elements sorted in 2768.844ms
constant: 100000 elements sorted in 2786.612ms

这是一个更能抵抗病理情况的轻微修改版本:

#define MAX_LEVELS  48

int quickSort(int *arr, size_t elements) {
    size_t beg[MAX_LEVELS], end[MAX_LEVELS], L, R;
    int i = 0;

    beg[0] = 0;
    end[0] = elements;
    while (i >= 0) {
        L = beg[i];
        R = end[i];
        if (R - L > 1) {
            size_t M = L + ((R - L) >> 1);
            int piv = arr[M];
            arr[M] = arr[L];

            if (i == MAX_LEVELS - 1)
                return -1;
            R--;
            while (L < R) {
                while (arr[R] >= piv && L < R)
                    R--;
                if (L < R)
                    arr[L++] = arr[R];
                while (arr[L] <= piv && L < R)
                    L++;
                if (L < R)
                    arr[R--] = arr[L];
            }
            arr[L] = piv;
            M = L + 1;
            while (L > beg[i] && arr[L - 1] == piv)
                L--;
            while (M < end[i] && arr[M] == piv)
                M++;
            if (L - beg[i] > end[i] - M) {
                beg[i + 1] = M;
                end[i + 1] = end[i];
                end[i++] = L;
            } else {
                beg[i + 1] = beg[i];
                end[i + 1] = L;
                beg[i++] = M;
            }
        } else {
            i--;
        }
    }
    return 0;
}

输出:

random: 10000000 elements sorted in 963.973ms
sorted: 10000000 elements sorted in 167.621ms
reverse sorted: 10000000 elements sorted in 167.375ms
constant: 10000000 elements sorted in 9.335ms

作为结论:

  • 是的,无需递归即可实现快速排序,
  • 不,没有任何本地自动存储就无法实现,
  • 是的,只需要恒定数量的额外空间,但这仅仅是因为我们生活在一个小世界,数组的最大大小受可用内存的限制。 大小为 64 的本地对象处理的数组大于 Internet 的大小,远大于当前 64 位系统可以处理的大小。

显然,这是可以实现的非递归快速仅有的额外空间不变量规定在这里 这建立在 Sedgewick 对快速排序的非递归公式的 工作之上。 它不是保留边界值(低和高),而是执行线性扫描来确定这些边界。

嗯,它可以,因为我在 fortran IV 中实现了快速排序(很久以前,并且在语言支持递归之前 - 这是一个赌注)。 但是,您确实需要某个地方(一个大数组可以)来记住您在执行个别工作时的状态。

递归要容易得多......

根据定义,快速排序是一种“分而治之”的搜索算法,其思想是将给定的数组拆分为更小的分区。 所以你把问题分成子问题,这样更容易解决。 在不使用递归的情况下使用快速排序时,您需要某种结构来存储您当时不使用的分区。 这就是为什么帖子答案使用数组来使快速排序非递归的原因。

可以在没有堆栈和递归的情况下在 C 中实现快速排序吗?

快速排序需要从每个非平凡分区向前遵循两条路径:每个(子)分区的新分区。 有关先前分区的信息(结果分区之一的边界)需要传递到每个新分区。 那么,问题是这些信息在哪里? 特别是,当程序在另一个分区上工作时,有关一个分区的信息在哪里?

对于串行算法,答案是信息存储在堆栈或队列或其中之一的功能等价物上。 总是,因为这些是我们为所需目的服务的数据结构的名称。 特别是,递归是一种特殊情况,而不是替代方案。 在递归快速排序中,数据存储在调用堆栈中。 对于迭代实现,您可以在正式意义上实现堆栈,但也可以使用简单且相对较小的数组作为临时堆栈。

但是堆栈和队列等价物可以走得更远。 例如,您可以将数据附加到文件中,以便稍后回读。 您可以将其写入管道。 您可以通过通信网络将其异步传输给您自己。

如果你想发疯,你甚至可以嵌套迭代来代替递归。 这将对可以处理的数组的大小强加一个硬上限,但并不像您想象的那么严格。 稍加注意并掌握一些技巧,您就可以使用 25 个循环嵌套处理十亿个元素的数组。 如此深的巢穴虽然丑陋而疯狂,但还是可以想象的。 人类可以手写。 在这种情况下,一系列嵌套循环作用域及其块作用域变量充当堆栈等效项。

因此,答案取决于“无堆栈”的确切含义:

  • 是的,您可以改用队列,尽管它需要具有与要排序的元素大致相同的容量;
  • 是的,您可以使用数组或其他某种顺序数据存储来模拟正式的堆栈或队列;
  • 是的,您可以将合适的堆栈等价物直接编码到您的程序结构中;
  • 是的,您可能会想出其他更深奥的堆栈和队列版本;
  • 但是不,如果没有填充传统上使用堆栈或堆栈等效项的多级数据存储角色,您就无法执行快速排序。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM