每天都在叫囂自己會什么技術(shù),什么框架,可否意識到你每天都在被這些新名詞、新技術(shù)所迷惑,.NET、XML等等技術(shù)固然誘人,可是如果自己的基礎(chǔ)不扎實(shí),就像是在云里霧里行走一樣,只能看到眼前,不能看到更遠(yuǎn)的地方。這些新鮮的技術(shù)掩蓋了許多底層的原理,要想真正的學(xué)習(xí)技術(shù)還是走下云端,扎扎實(shí)實(shí)的把基礎(chǔ)知識學(xué)好,有了這些基礎(chǔ),要掌握那些新技術(shù)也就很容易了。
要編寫出優(yōu)秀的代碼同樣要扎實(shí)的基礎(chǔ),如果排序和查找算法學(xué)的不好,怎么對程序的性能進(jìn)行優(yōu)化?廢話不多說,本文要介紹的這些排序算法就是基礎(chǔ)中的基礎(chǔ),程序員必知!
1、直接插入排序
(1)基本思想:在要排序的一組數(shù)中,假設(shè)前面(n-1) [n>=2] 個數(shù)已經(jīng)是排
好順序的,現(xiàn)在要把第n個數(shù)插到前面的有序數(shù)中,使得這n個數(shù)
也是排好順序的。如此反復(fù)循環(huán),直到全部排好順序。
(2)實(shí)例
2、希爾排序(也稱最小增量排序)
(1)基本思想:算法先將要排序的一組數(shù)按某個增量d(n/2,n為要排序數(shù)的個數(shù))分成若干組,每組中記錄的下標(biāo)相差d.對每組中全部元素進(jìn)行直接插入排序,然后再用一個較小的增量(d/2)對它進(jìn)行分組,在每組中再進(jìn)行直接插入排序。當(dāng)增量減到1時,進(jìn)行直接插入排序后,排序完成。
(2)實(shí)例:
3、簡單選擇排序
(1)基本思想:在要排序的一組數(shù)中,選出最小的一個數(shù)與第一個位置的數(shù)交換;
然后在剩下的數(shù)當(dāng)中再找最小的與第二個位置的數(shù)交換,如此循環(huán)到倒數(shù)第二個數(shù)和最后一個數(shù)比較為止。
(2)實(shí)例:
4、堆排序
(1)基本思想:堆排序是一種樹形選擇排序,是對直接選擇排序的有效改進(jìn)。
堆的定義如下:具有n個元素的序列(h1,h2,...,hn),當(dāng)且僅當(dāng)滿足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1)(i=1,2,...,n/2)時稱之為堆。在這里只討論滿足前者條件的堆。由堆的定義可以看出,堆頂元素(即第一個元素)必為最大項(xiàng)(大頂堆)。完全二叉樹可以很直觀地表示堆的結(jié)構(gòu)。堆頂為根,其它為左子樹、右子樹。初始時把要排序的數(shù)的序列看作是一棵順序存儲的二叉樹,調(diào)整它們的存儲序,使之成為一個堆,這時堆的根節(jié)點(diǎn)的數(shù)最大。然后將根節(jié)點(diǎn)與堆的最后一個節(jié)點(diǎn)交換。然后對前面(n-1)個數(shù)重新調(diào)整使之成為堆。依此類推,直到只有兩個節(jié)點(diǎn)的堆,并對它們作交換,最后得到有n個節(jié)點(diǎn)的有序序列。從算法描述來看,堆排序需要兩個過程,一是建立堆,二是堆頂與堆的最后一個元素交換位置。所以堆排序有兩個函數(shù)組成。一是建堆的滲透函數(shù),二是反復(fù)調(diào)用滲透函數(shù)實(shí)現(xiàn)排序的函數(shù)。
(2)實(shí)例:
初始序列:46,79,56,38,40,84
建堆:
交換,從堆中踢出最大數(shù)
剩余結(jié)點(diǎn)再建堆,再交換踢出最大數(shù)
依次類推:最后堆中剩余的最后兩個結(jié)點(diǎn)交換,踢出一個,排序完成。
5、冒泡排序
(1)基本思想:在要排序的一組數(shù)中,對當(dāng)前還未排好序的范圍內(nèi)的全部數(shù),自上而下對相鄰的兩個數(shù)依次進(jìn)行比較和調(diào)整,讓較大的數(shù)往下沉,較小的往上冒。即:每當(dāng)兩相鄰的數(shù)比較后發(fā)現(xiàn)它們的排序與排序要求相反時,就將它們互換。
(2)實(shí)例:
6、快速排序
(1)基本思想:選擇一個基準(zhǔn)元素,通常選擇第一個元素或者最后一個元素,通過一趟掃描,將待排序列分成兩部分,一部分比基準(zhǔn)元素小,一部分大于等于基準(zhǔn)元素,此時基準(zhǔn)元素在其排好序后的正確位置,然后再用同樣的方法遞歸地排序劃分的兩部分。
(2)實(shí)例:
上圖中將待排序列分成兩部分,一部分比基準(zhǔn)元素小,一部分大于基準(zhǔn)元素,然后對這兩部分重復(fù)上圖的求解過程。
(這只是快速排序的一種實(shí)現(xiàn)方式,個人認(rèn)為比較容易理解)
7、歸并排序
(1)基本排序:歸并(Merge)排序法是將兩個(或兩個以上)有序表合并成一個新的有序表,即把待排序序列分為若干個子序列,每個子序列是有序的。然后再把有序子序列合并為整體有序序列。
(2)實(shí)例:
8、基數(shù)排序
(1)基本思想:將所有待比較數(shù)值(正整數(shù))統(tǒng)一為同樣的數(shù)位長度,數(shù)位較短的數(shù)前面補(bǔ)零。然后,從最低位開始,依次進(jìn)行一次排序。這樣從最低位排序一直到最高位排序完成以后,數(shù)列就變成一個有序序列。
(2)實(shí)例:
穩(wěn)定性說明:排序前,2(或者更多)個相等的數(shù)在序列的前后位置順序和排序后它們在序列中的前后位置順序一樣。
實(shí)例:
待排序數(shù)列:5,4,8,6,1,8,7,9
排序結(jié)果:1,4,5,6,7,8,8,9
穩(wěn)定:1,4,5,6,7,8,8,9
不穩(wěn)定:1,4,5,6,7,8,8,9
說明:對比紅色的8和紫色的8,看他們排序前后的位置。排序前,紅8在紫8前面,如果排序后紅8仍然在紫8前面,則排序算法穩(wěn)定,否則不穩(wěn)定。
現(xiàn)在我們分析一下8種排序算法的穩(wěn)定性。
(請網(wǎng)友結(jié)合前面的排序基本思想來理解排序的穩(wěn)定性(8種排序的基本思想已經(jīng)在前面說過,這里不再贅述)不然可能有些模糊)
(1)直接插入排序:一般插入排序,比較是從有序序列的最后一個元素開始,如果比它大則直接插入在其后面,否則一直往前比。如果找到一個和插入元素相等的,那么就插入到這個相等元素的后面。插入排序是穩(wěn)定的。
(2)希爾排序:希爾排序是按照不同步長對元素進(jìn)行插入排序,一次插入排序是穩(wěn)定的,不會改變相同元素的相對順序,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,穩(wěn)定性就會被破壞,所以希爾排序不穩(wěn)定。
(3)簡單選擇排序:在一趟選擇,如果當(dāng)前元素比一個元素小,而該小的元素又出現(xiàn)在一個和當(dāng)前元素相等的元素后面,那么交換后穩(wěn)定性就被破壞了。光說可能有點(diǎn)模糊,來看個小實(shí)例:858410,第一遍掃描,第1個元素8會和4交換,那么原序列中2個8的相對前后順序和原序列不一致了,所以選擇排序不穩(wěn)定。
(4)堆排序:堆排序的過程是從第n/2開始和其子節(jié)點(diǎn)共3個值選擇最大(大頂堆)或者最小(小頂堆),這3個元素之間的選擇當(dāng)然不會破壞穩(wěn)定性。但當(dāng)為n/2-1, n/2-2, ...這些父節(jié)點(diǎn)選擇元素時,有可能第n/2個父節(jié)點(diǎn)交換把后面一個元素交換過去了,而第n/2-1個父節(jié)點(diǎn)把后面一個相同的元素沒有交換,所以堆排序并不穩(wěn)定。
(5)冒泡排序:由前面的內(nèi)容可知,冒泡排序是相鄰的兩個元素比較,交換也發(fā)生在這兩個元素之間,如果兩個元素相等,不用交換。所以冒泡排序穩(wěn)定。
(6)快速排序:在中樞元素和序列中一個元素交換的時候,很有可能把前面的元素的穩(wěn)定性打亂。還是看一個小實(shí)例:6 4 4 5 4 7 8 9,第一趟排序,中樞元素6和第三個4交換就會把元素4的原序列破壞,所以快速排序不穩(wěn)定。
(7)歸并排序:在分解的子列中,有1個或2個元素時,1個元素不會交換,2個元素如果大小相等也不會交換。在序列合并的過程中,如果兩個當(dāng)前元素相等時,我們把處在前面的序列的元素保存在結(jié)果序列的前面,所以,歸并排序也是穩(wěn)定的。
(8)基數(shù)排序:是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次類推,直到最高位。有時候有些屬性是有優(yōu)先級順序的,先按低優(yōu)先級排序,再按高優(yōu)先級排序,最后的次序就是高優(yōu)先級高的在前,高優(yōu)先級相同的低優(yōu)先級高的在前;鶖(shù)排序基于分別排序,分別收集,所以是穩(wěn)定的。
8種排序的分類,穩(wěn)定性,時間復(fù)雜度和空間復(fù)雜度總結(jié):
三種查找算法:順序查找,二分法查找(折半查找),分塊查找,散列表(以后談)
一、順序查找的基本思想:
從表的一端開始,順序掃描表,依次將掃描到的結(jié)點(diǎn)關(guān)鍵字和給定值(假定為a)相比較,若當(dāng)前結(jié)點(diǎn)關(guān)鍵字與a相等,則查找成功;若掃描結(jié)束后,仍未找到關(guān)鍵字等于a的結(jié)點(diǎn),則查找失敗。
說白了就是,從頭到尾,一個一個地比,找著相同的就成功,找不到就失敗。很明顯的缺點(diǎn)就是查找效率低。
適用于線性表的順序存儲結(jié)構(gòu)和鏈?zhǔn)酱鎯Y(jié)構(gòu)。
計算平均查找長度。
例如上表,查找1,需要1次,查找2需要2次,依次往下推,可知查找16需要16次,
可以看出,我們只要將這些查找次數(shù)求和(我們初中學(xué)的,上底加下底乘以高除以2),然后除以結(jié)點(diǎn)數(shù),即為平均查找長度。
設(shè)n=節(jié)點(diǎn)數(shù)
平均查找長度=(n+1)/2
二、二分法查找(折半查找)的基本思想:
前提:
(1)確定該區(qū)間的中點(diǎn)位置:mid=(low+high)/2
min代表區(qū)間中間的結(jié)點(diǎn)的位置,low代表區(qū)間最左結(jié)點(diǎn)位置,high代表區(qū)間最右結(jié)點(diǎn)位置
(2)將待查a值與結(jié)點(diǎn)mid的關(guān)鍵字(下面用R[mid].key)比較,若相等,則查找成功,否則確定新的查找區(qū)間:
如果R[mid].key>a,則由表的有序性可知,R[mid].key右側(cè)的值都大于a,所以等于a的關(guān)鍵字如果存在,必然在R[mid].key左邊的表中。這時high=mid-1
如果R[mid].key<a,則等于a的關(guān)鍵字如果存在,必然在R[mid].key右邊的表中。這時low=mid
如果R[mid].key=a,則查找成功。
(3)下一次查找針對新的查找區(qū)間,重復(fù)步驟(1)和(2)
(4)在查找過程中,low逐步增加,high逐步減少,如果high<low,則查找失敗。
平均查找長度=Log2(n+1)-1
注:雖然二分法查找的效率高,但是要將表按關(guān)鍵字排序。而排序本身是一種很費(fèi)時的運(yùn)算,所以二分法比較適用于順序存儲結(jié)構(gòu)。為保持表的有序性,在順序結(jié)構(gòu)中插入和刪除都必須移動大量的結(jié)點(diǎn)。因此,二分查找特別適用于那種一經(jīng)建立就很少改動而又經(jīng)常需要查找的線性表。
三、分塊查找的基本思想:
二分查找表使分塊有序的線性表和索引表(抽取各塊中的最大關(guān)鍵字及其起始位置構(gòu)成索引表
)組成,由于表是分塊有序的,所以索引表是一個遞增有序表,因此采用順序或二分查找索引表,以確定待查結(jié)點(diǎn)在哪一塊,由于塊內(nèi)無序,只能用順序查找。
設(shè)表共n個結(jié)點(diǎn),分b塊,s=n/b
(分塊查找索引表)平均查找長度=Log2(n/s+1)+s/2
(順序查找索引表)平均查找長度=(S2+2S+n)/(2S)
注:分塊查找的優(yōu)點(diǎn)是在表中插入或刪除一個記錄時,只要找到該記錄所屬塊,就在該塊中進(jìn)行插入或刪除運(yùn)算(因塊內(nèi)無序,所以不需要大量移動記錄)。它主要代價是增加一個輔助數(shù)組的存儲控件和將初始表分塊排序的運(yùn)算。
它的性能介于順序查找和二分查找之間。
四、最近比較忙,后續(xù)找個時間還會談?wù)勆⒘斜恚ü1恚┘夹g(shù),希望大家關(guān)注!
散列表查找技術(shù)不同于順序查找、二分查找、分塊查找。它不以關(guān)鍵字的比較為基本操作,采用直接尋址技術(shù)。在理想情況下,無須任何比較就可以找到待查關(guān)鍵字,查找的期望時間為O(1)。