1. 归并排序介绍
归并排序(Merge Sort)是将两个有序的序列合并成一个有序的序列,采用分治法(Divide and Conquer)思想,先将待排序序列分为若干个子序列,对每个子序列进行排序,再将排好序的子序列合并成一个有序的序列。
归并排序时间复杂度为 O(nlogn),它的优点是能够处理大规模数据,其缺点是需要额外的空间来合并两个有序序列。
2. 归并排序原理及步骤
2.1 归并排序原理
归并排序采用分治法(Divide and Conquer)思想,将待排序序列分为若干个子序列,对每个子序列进行排序,再将排好序的子序列合并成一个有序的序列。具体实现步骤如下:
将待排序序列递归地分成两半,直到序列中只剩下一个元素,此时认为该序列已经有序。
按顺序将两个有序子序列合并,得到一个新的有序序列,再递归地将新的有序序列分成两半,重复前两步操作,直到整个序列排序完成。
2.2 归并排序步骤
归并排序的具体实现步骤如下:
将待排序序列递归地分成两半,直到序列中只剩下一个元素。
将两个有序子序列合并,得到一个新的有序序列。
递归地将新的有序序列分成两半,重复前两步操作,直到整个序列排序完成。
归并排序的代码如下:
void merge_sort(int arr[], int l, int r){
if(l >= r) return;
int mid = (l + r) / 2;
merge_sort(arr, l, mid);
merge_sort(arr, mid + 1, r);
int tmp[MAX_N];
int i = l, j = mid + 1, k = 0;
while(i <= mid && j <= r){
if(arr[i] <= arr[j]) tmp[k++] = arr[i++];
else tmp[k++] = arr[j++];
}
while(i <= mid) tmp[k++] = arr[i++];
while(j <= r) tmp[k++] = arr[j++];
for(int i = l; i <= r; ++i) arr[i] = tmp[i - l];
}
其中,arr 为待排序的数组,l 表示数组的左边界,r 表示数组的右边界,mid 表示数组的中间位置。
3. 归并排序时间复杂度分析
归并排序的时间复杂度为 O(nlogn)。
对于归并排序,每次将序列分成两半,需要的时间复杂度为 O(logn);每次将两个有序序列合并为一个有序序列,需要的时间复杂度为 O(n)。对于一个长度为 n 的序列,需要进行 logn 次划分,每次划分需要 O(n) 的时间来将两个有序序列合并,因此总时间复杂度为 O(nlogn)。
4. 归并排序优化
归并排序是一个稳定的排序算法,但由于其需要额外的空间来合并两个有序序列,因此在实际应用中需要考虑空间的限制。以下是归并排序的两种优化方式:
4.1 自底向上归并排序
自底向上归并排序是一种将递归算法转化为迭代算法的方法,在此方法中,数组先被分割成若干个单元素的小数组,然后按照顺序两两合并。
自底向上归并排序的代码如下:
void merge_sort(int arr[], int len) {
int *a = arr;
int *b = (int *) malloc(len * sizeof(int));
int seg, start;
for (seg = 1; seg < len; seg += seg) {
for (start = 0; start < len; start += seg + seg) {
int low = start, mid = MIN(start + seg, len), high = MIN(start + seg + seg, len);
int k = low;
int start1 = low, end1 = mid, start2 = mid, end2 = high;
while (start1 < end1 && start2 < end2)
b[k++] = a[start1] < a[start2] ? a[start1++] : a[start2++];
while (start1 < end1)
b[k++] = a[start1++];
while (start2 < end2)
b[k++] = a[start2++];
}
int *temp = a;
a = b;
b = temp;
}
if (a != arr) {
int i;
for (i = 0; i < len; i++)
b[i] = a[i];
b = a;
}
free(b);
}
其中,a 和 b 分别为待排序和临时数组,seg 表示序列的长度,start 表示起始位置,low、mid 和 high 表示归并区间的左、中、右端点,start1、end1、start2 和 end2 表示归并区间。
4.2 原地归并排序
原地归并排序是指在归并排序过程中,只需要使用 O(1) 的额外空间来进行排序。
原地归并排序的代码如下:
void merge_sort(int arr[], int l, int r) {
if (l >= r) return;
int mid = l + (r - l) / 2;
merge_sort(arr, l, mid);
merge_sort(arr, mid + 1, r);
int i = l, j = mid + 1;
while (i < j && j <= r) {
while (i < j && arr[i] <= arr[j]) i++;
int tmp = arr[j];
int k = j;
while (k > i) {
arr[k] = arr[k - 1];
k--;
}
arr[i] = tmp;
j++;
}
}
其中,arr 为待排序的数组,l 表示数组的左边界,r 表示数组的右边界,mid 表示数组的中间位置。
5. 总结
归并排序是一种高效稳定的排序算法,其时间复杂度为 O(nlogn)。
在实际应用中,可以采用自底向上归并排序或原地归并排序的方法来对归并排序进行优化,以节省额外的空间。