详解三种排序算法及其比较

算法爱好者 · 公众号 · 算法 · 2017-11-28 21:16

正文

（点击上方公众号，可快速关注）

转自：刘毅

https://61mon.com/index.php/archives/193/

好文投稿，请点击 → 这里了解详情

直接插入排序

直接插入排序（Insertion Sort）可以说是排序里最简单的了。为简化问题，我们下面只讨论升序排序。

代码如下：

void InsertSort ( int array [], int left , int right )

{

int temp ;

int j ;

for ( int i = left + 1 ; i <= right ; i ++ )

{

temp = array [ i ];

j = i - 1 ;

while ( j >= left && array [ j ] > temp )

array [ j + 1 ] = array [ j -- ];

array [ j + 1 ] = temp ;

}

}

那么它的算法复杂度如下：

时间复杂度

1、最好情况，序列是升序排列，在这种情况下，只需进行 n-1 比较，即 Tbest(n)=O(n)；

2、最坏情况，序列是降序排列，那么此时需要进行的比较共有 12n(n−1) 次，即 Tworse(n)=O(n2)；

3、平均情况，为 Tavg(n)=O(n2)。

空间复杂度

由程序很容易得 S(n)=O(1)。

直接插入排序不适合对于数据量比较大的排序应用。但是，如果需要排序的数据量很小，例如量级小于千，那么直接插入排序还是一个不错的选择，因此在 STL 的 sort 算法和 stdlib 的 qsort 算法中，都将直接插入排序作为快速排序的补充，用于少量元素的排序（通常为 8 个或以下）。

此外直接插入排序有两个常用的优化：二分查找插入排序，希尔排序。下面分别介绍。

二分查找插入排序

因为在一个有序序列中查找一个插入位置，所以可使用二分查找，减少元素比较次数提高效率。

/* 给定一个有序的数组，查找第一个大于等于 value 的下标，不存在返回 -1 */

int BinarySearch ( int array [], int n , int value )

{

int left = 0 ;

int right = n - 1 ;

while ( left <= right )

{

int middle = left + (( right - left ) >> 1 );

if ( array [ middle ] >= value )

right = middle - 1 ;

else

left = middle + 1 ;

}

return ( left < n ) ? left : - 1 ;

}

void BinaryInsertSort ( int array [], int left , int right )

{

for ( int i = left + 1 ; i <= right ; i ++ )

{

int insert_index = BinarySearch ( array , i , array [ i ]);

if ( insert_index != - 1 ) // 如果可以插入到前面的有序序列中

{

int temp = array [ i ];

int j = i - 1 ;

while ( j >= insert_index )

{

array [ j + 1 ] = array [ j ];

j -- ;

}

array [ j + 1 ] = temp ;

}

}

}

最好情况下，即序列为升序时，时间复杂度为O(logn)。

其它情况下，除了找到插入点所需的操作数从 O(n) 降为 O(logn) 外，其它的操作并未减小，其时间复杂度依旧是 O(n2)。

希尔排序

希尔排序，也称递减增量排序算法，以其设计者希尔（Donald Shell）的名字命名，该算法由 1959 年公布。

我们举个例子来描述算法流程（以下摘自维基百科）：

假设有这样一组数 {13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10}，如果我们以步长为 5 开始进行排序：

然后我们对每列进行排序：

将上述四行数字，依序接在一起时我们得到：{10, 14, 73, 25, 23, 13, 27, 94, 33, 39, 25, 59, 94, 65, 82, 45}，然后再以 3 为步长：

排序之后变为：

最后以 1 为步长进行排序（此时就是简单的插入排序了）。

可想而知，步长的选择是希尔排序的重要部分。

算法最开始以一定的步长进行排序，然后会继续以更小的步长进行排序，最终算法以步长为 1 进行排序。当步长为 1 时，算法变为直接插入排序，这就保证了数据一定会被全部排序。

Donald Shell 最初建议步长选择为 n2，并且对步长取半直到步长达到 1。虽然这样取可以比 O(n2) 类的算法（直接插入排序）更好，但这样仍然有减少平均时间和最差时间的余地。

可能希尔排序最重要的地方在于当用较小步长排序后，以前用的较大步长仍然是有序的。比如，如果一个数列以步长 5 进行了排序然后再以步长 3 进行排序，那么该数列不仅是以步长 3 有序，而且是以步长 5 有序。

如果不是这样，那么算法在迭代过程中会打乱以前的顺序，那就不会以如此短的时间完成排序了。

已知的最好步长序列是由 Sedgewick 提出的 {1, 5, 19, 41, 109, ...}，该序列的项来自 9⋅4i−9⋅2i+1 和 2i+2⋅(2i+2−3)+1 这两个算式。

这项研究也表明比较在希尔排序中是最主要的操作，而不是交换。

用这样步长序列的希尔排序比插入排序要快，甚至在小数组中比快速排序和堆排序还快，但是在涉及大量数据时希尔排序还是比快速排序慢。

另一个在大数组中表现优异的步长序列是：{1, 9, 34, 182, 836, 4025, 19001, 90358, 428481, 2034035, 9651787, 45806244, 217378076, 1031612713, …}（斐波那契数列除去 0 和 1，将剩余的数以黄金分区比的两倍的幂进行运算得到的数列）

void ShellSort ( int array [], int n )

{

详解三种排序算法及其比较

正文

（点击 (adsbygoogle = window.adsbygoogle || []).push({}); 上方公众号 ，可快速关注）

请到「今天看啥」查看全文

（点击上方公众号，可快速关注）