亲宝软件园·资讯

展开

Java数据结构之常见排序算法(上)

程序猿教你打篮球 人气:0

认识排序

在学校中,如果我们要参加运动会,或者军训的时候,会按照身高从矮到高进行站队,比如上课老师手上拿的考勤表,通常是按照学号从低到高进行排序的。再比如编程语言排行榜,也是在排序。

生活中有相当多的排序场景,由此可知,排序还是很重要的, 本章就会介绍常见的一些排序算法。

所谓排序呢,就拿我们上面的举例来说,会按照某个或某些关键字的大小,递增或者递减排列起来的操作,这就是排序,这里面也涉及到排序的稳定性,举个例子:

比如有这样的一组数据:B  D  A  C  A  F,要按照他们的 ascll 码来排序,这里出现了两个 A,我们把第一个出现的 A 称为 A1,第二个出现的 A 称为 A2。

假定排序后结果为:A1  A2  B  C  D  F,那么这个排序算法就是稳定的。

假设排序后结果为:A2  A1  B  C  D  F,那么这个排序算法就是不稳定的。

简而言之,如果待排序的数据中,有两个相同的元素,排序结束后,这两个元素的关系没有发生改变,比如 A1 排序前在 A2 前面,排完序后,A1 还在 A2 前面,这就是稳定的排序算法。

注意:一个不稳定的排序算法,天生就是不稳定的,但是一个稳定的排序算法,你可以把它设计成不稳定的。 

常见排序的分类

这张图,概括了我们后续要讲的排序算法,接着正式进入本章的学习吧!(排序算法章节,默认都是升序排序

注:后续所说的复杂度 log,都是以2为底,特殊的会标注出来。

直接插入排序

现在想请各位小伙伴,想象一下自己在摸扑克牌,摸了第一张牌放在了自己的手中,接着再摸一张,把这张牌跟手上的一张牌进行比较,把它放到合适的位置, 接着再摸一张,把这张牌跟手上的两张牌进行比较,放到合适的位置。

这就是直接插入排序,简单来说,我们每次取的元素,会往一个有序的序列中插入,也就是每次摸牌之前,手上的牌都是排好序的,我们只需要把新摸到的牌,依次与手上有序的牌进行比较,把它放入合适的位置就行!

这里我们用一副静态的图来简单演示下:

public void insertSort(int[] array) {
    // 外循环控制趟数, 第一张牌默认有序, 所以 i 从 1 开始
    for (int i = 1; i < array.length; i++) {
        int tmp = array[i]; //当前摸到的牌
        // 每次从手中牌的最后一张牌开始比较, 一直比到第一张牌
        int j = i - 1;
        for (; j >= 0; j--) {
            //如果当前位置的牌,大于我摸到的牌,就往后挪
            if (array[j] > tmp) {
                array[j + 1] = array[j];
            } else {
                break;
            }
        }
        // 把摸到的牌放到对应位置上
        array[j + 1] = tmp;
    }
}
  • 时间复杂度分析:外循环一共要 n - 1 次,内循环每次最差的情况下要比较 1....n 次,那么去掉 n 前面的小项,也就是 (n - 1) * n 次,即 n^2 - n,去掉最小项,最后的时间复杂度为 O(n^2)
  • 空间复杂度分析:只是开辟了一个 tmp 的变量 i,j,常数,即空间复杂度:O(1)
  • 稳定性:稳定 该排序再数据越接近有序的情况,时间效率越高。

希尔排序(缩小增量排序)

这个排序是直接插入排序的一种优化,你可以想象一下,你面前有并排放好的 8 个爱心号码牌,但是它们是无序的,我们要给号码牌分组,按要求,第一次间隔为 4 个号码牌的为一组,分完组后进行直接插入排序,第二次间隔为 2 个号码牌的为一组,进行直接插入排序,第三次间隔为 1 个号码牌为一组,进行直接插入排序。

听到这有点没理解,没关系,我们就通过画图来把我上述说的内容再次理解下:

由上图我们可以发现,当间隔 > 1 的时候,都是预排序,也就是让我们的数据更接近有序,但是当间隔为 1 的时候,就是直接插入排序了,前面我们说过,直接插入排序,再数据接近有序的时候时间效率是很快的。

由此可见,希尔排序,是直接插入排序的优化版。

如何在代码中实现呢?间隔的值如何取呢?

代码中把这个间隔的值称为 gap,这个 gap 的取值方法有很多,有的人提出 gap 为奇数好,有的提出 gap 为偶数好,我们就采取一种比较简单的方法来取 gap 值,首次取数组长度一半的值为 gap,后续 gap /= 2,即可。当 gap 为 1,也就是直接插入排序了。

代码实现如下:

public void shellSort(int[] array) {
    // gap初始值设置成数组长度的一半
    int gap = array.length >> 1;
    // gap 为 1 的时候直接插入排序
    while (gap >= 1) {
        shell(array, gap);
        gap >>= 1; // 更新 gap 值 等价于 -> gap /= 2;
    }
}
private void shell(int[] array, int gap) {
    for (int i = gap; i < array.length; i++) {
        int tmp = array[i];
        int j = i - gap;
        for (; j >= 0; j -= gap) {
            if (array[j] > tmp) {
                array[j + gap] = array[j];
            } else {
                break;
            }
        }
        array[j + gap] = tmp;
    }
}

如果实在是不好理解,就结合上边讲的直接插入排序来理解,相信你能理解到的。

  • 时间复杂度分析:希尔排序的时间复杂度不好分析, 这里我们就大概记一下,约为 O(n^1.3),感兴趣的话,可以查阅一下相关书籍。
  • 空间复杂度分析:仍然开辟的是常数个变量,空间复杂度为 O(1)
  • 稳定性:不稳定

选择排序

这个排序是个很简单的排序,你想象一下,有个小屁孩,喜欢玩小球,我给他安排了个任务,把这一排小球从小到大排列起来,摆给我看,于是小屁孩就找,每次从一排小球中找出最大的,放到最后,固定不动,那是不是也就是说,每次能确定一个最大的石子的最终位置了。我们来看图:

通过图片我们也能看出来,每次找到最大值于最后一个值交换,所以每趟都能把最大的放到最后固定不动,每趟能排序一个元素出来,那这样用代码来实现就很简单了:

public void selectSort(int[] array) {
    int end = array.length - 1;
    // 剩最后一个元素的时候, 不用比较了, 已经有序了
    // 所以 i < array.length - 1
    for (int i = 0; i < array.length - 1; i++) {
        int max = 0;
        int j = 0;
        while (j <= end) {
            if (array[j] > array[max]) {
                max = j;
            }
            j++;
        }
        //找到了最大值的下标, 把最大值与最后一个值交换
        swap(array, max, end--); // end-- 最后一个元素固定了, 不用参与比较
    }
}

这个算法有没有可以优化的空间呢?

有!那么既然小屁孩能一次找出最大的球,那能不能让小屁孩一次找出两个球出来呢?

分别是这些球中,最大的和最小的,最大的放在最右边,最小的放在最左边,那么我们每次就能确定两个球的最终位置,也就是我们一次能排序两个元素。

图解:

代码实现如下:

public void selectSort(int[] array) {
    int left = 0;
    int right = array.length - 1;
    while (left < right) {
        int maxIndex = left;
        int minIndex = left;
        // i = left + 1 -> 每次找最大最小值下标的时候, 可以不用算默认给的最大值和最小值下标
        for (int i = left + 1; i <= right; i++) {
            if (array[i] > array[maxIndex]) {
                maxIndex = i;
            }
            if (array[i] < array[minIndex]) {
                minIndex = i;
            }
        }
        swap(array, minIndex, left);
        // 如果最大值为 left 的位置情况的话, 走到这, 最大值已经被交换到 min 位置上了
        if (maxIndex == left) {
            // 更新最大值的位置
            maxIndex = minIndex;
        }
        swap(array, maxIndex, right);
        left++;
        right--;
    }
}
  • 时间复杂度分析:虽然是优化了,但去小项之后,还是 O(n^2)
  • 空间复杂度分析:O(1)
  • 稳定性:不稳定实际开发中用的不多

堆排序

如果你有学习过优先级队列,或者看过博主优先级队列的文章,那么这个排序对于你来说还是很轻松的,当然在堆排序的讲解中,不会过多的去介绍堆的概念,如果对这部分概念还不理解,可以移至博主的上一篇文章进行学习。 

堆排序,简单来说,就是把一组数据,看成一个完全二叉树,再把这棵树,建大堆或者建小堆,接着进行排序的一种思路。至于如何建大堆或小堆,和向上调整算法以及向下调整算法。

这里我们来分析一下,排升序应该建什么堆?大堆!排降序建小堆!

这里我们来排升序,建大堆,因为大堆堆顶元素一定是堆中最大的,所以我们可以把堆顶元素和最后一个元素进行交换,这样我们就确认了最大值的位置,接着将交换后的堆顶元素进行向下调整,仍然使得该数组满足大堆的特性!

图解如下:

如上图步骤也很简单,先是将数组建成大堆,然后利用大堆来进行堆排序,首先将堆顶元素和最后一个元素交换,由此最大的元素就有序了,接着将该堆进行向下调整,使继续满足大堆性质,依次进行下去即可。

代码实现:

public void heapSort(int[] array) {
    // 建大堆 从最后一个非叶子节点开始向下调整
    // 非叶子节点下标 = (孩子节点下标 - 1) / 2
    for (int parent = (array.length - 1 - 1) / 2; parent >= 0; parent--) {
        shiftDown(array, parent, array.length);
    }
    // 建大堆完成后, 每次堆顶元素与最后一个元素交换, 锁定最大元素的位置
    for (int len = array.length - 1; len > 0; len--) {
        swap(array, 0, len); //根节点与最后一个元素交换
        shiftDown(array, 0, len); //根节点位置向下调整
    }
}
private void shiftDown(int[] array, int parent, int len) {
    int child = parent * 2 + 1;
    while (child < len) {
        if (child + 1 < len && array[child + 1] > array[child]) {
            child++;
        }
        // 判断父节点是否大于较大的孩子节点
        if (array[parent] < array[child]) {
            swap(array, parent, child);
            // 更新下标的位置
            parent = child;
            child = parent * 2 + 1;
        } else {
            return;
        }
    }
}
  • 时间复杂度分析:建堆的时间复杂度优先级队列那期有说过为 O(n),排序调整堆的时候,一共要调整 n-1 次,每次向下调整的时间复杂度是 logn,所以即 logn(n - 1),即 O(n*logn),加上面建堆的时间复杂度:O(n) + O(n*logn),最终时间复杂度也就是:O(n*logn)。
  • 空间复杂度分析:O(1)
  • 稳定性:不稳定

下期预告:【Java 数据结构】常见排序算法(下)

加载全部内容

相关教程
猜你喜欢
用户评论