為了讓更多的新手受益,我抽空把SQL語句優(yōu)化部分進(jìn)行了整理,希望大家一起進(jìn)步。
一、操作符優(yōu)化
1、IN 操作符
用IN寫出來的SQL的優(yōu)點是比較容易寫及清晰易懂,這比較適合現(xiàn)代軟件開發(fā)的風(fēng)格。但是用IN的SQL性能總是比較低的,從Oracle執(zhí)行的步驟來分析用IN的SQL與不用IN的SQL有以下區(qū)別:
ORACLE試圖將其轉(zhuǎn)換成多個表的連接,如果轉(zhuǎn)換不成功則先執(zhí)行IN里面的子查詢,再查詢外層的表記錄,如果轉(zhuǎn)換成功則直接采用多個表的連接方式查詢。由此可見用IN的SQL至少多了一個轉(zhuǎn)換的過程。一般的SQL都可以轉(zhuǎn)換成功,但對于含有分組統(tǒng)計等方面的SQL就不能轉(zhuǎn)換了。
推薦方案:在業(yè)務(wù)密集的SQL當(dāng)中盡量不采用IN操作符,用EXISTS 方案代替。
2、NOT IN操作符
此操作是強(qiáng)列不推薦使用的,因為它不能應(yīng)用表的索引。
推薦方案:用NOT EXISTS 方案代替
3、IS NULL 或IS NOT NULL操作(判斷字段是否為空)
判斷字段是否為空一般是不會應(yīng)用索引的,因為索引是不索引空值的。
推薦方案:用其它相同功能的操作運算代替,如:a is not null 改為 a>0 或a>’’等。不允許字段為空,而用一個缺省值代替空值,如申請中狀態(tài)字段不允許為空,缺省為申請。
4、> 及 < 操作符(大于或小于操作符)
大于或小于操作符一般情況下是不用調(diào)整的,因為它有索引就會采用索引查找,但有的情況下可以對它進(jìn)行優(yōu)化,如一個表有100萬記錄,一個數(shù)值型字段A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那么執(zhí)行A>2與A>=3的效果就有很大的區(qū)別了,因為A>2時ORACLE會先找出為2的記錄索引再進(jìn)行比較,而A>=3時ORACLE則直接找到=3的記錄索引。
5、LIKE操作符
LIKE操作符可以應(yīng)用通配符查詢,里面的通配符組合可能達(dá)到幾乎是任意的查詢,但是如果用得不好則會產(chǎn)生性能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用范圍索引。
一個實際例子:用YW_YHJBQK表中營業(yè)編號后面的戶標(biāo)識號可來查詢營業(yè)編號 YY_BH LIKE ‘%5400%’ 這個條件會產(chǎn)生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進(jìn)行兩個范圍的查詢,性能肯定大大提高。
6、UNION操作符
UNION在進(jìn)行表鏈接后會篩選掉重復(fù)的記錄,所以在表鏈接后會對所產(chǎn)生的結(jié)果集進(jìn)行排序運算,刪除重復(fù)的記錄再返回結(jié)果。實際大部分應(yīng)用中是不會產(chǎn)生重復(fù)的記錄,最常見的是過程表與歷史表UNION。如: select * from gc_dfys union select * from ls_jg_dfys 這個SQL在運行時先取出兩個表的結(jié)果,再用排序空間進(jìn)行排序刪除重復(fù)的記錄,最后返回結(jié)果集,如果表數(shù)據(jù)量大的話可能會導(dǎo)致用磁盤進(jìn)行排序。
推薦方案:采用UNION ALL操作符替代UNION,因為UNION ALL操作只是簡單的將兩個結(jié)果合并后就返回。
select * from gc_dfys union all select * from ls_jg_dfys
二、SQL書寫的影響
1、同一功能同一性能不同寫法SQL的影響。
如一個SQL在A程序員寫的為 Select * from zl_yhjbqk
B程序員寫的為 Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)
C程序員寫的為 Select * from DLYX.ZLYHJBQK(大寫表名)
D程序員寫的為 Select * from DLYX.ZLYHJBQK(中間多了空格)
以上四個SQL在ORACLE分析整理之后產(chǎn)生的結(jié)果及執(zhí)行的時間是一樣的,但是從ORACLE共享內(nèi)存SGA的原理,可以得出ORACLE對每個SQL 都會對其進(jìn)行一次分析,并且占用共享內(nèi)存,如果將SQL的字符串及格式寫得完全相同,則ORACLE只會分析一次,共享內(nèi)存也只會留下一次的分析結(jié)果,這不僅可以減少分析SQL的時間,而且可以減少共享內(nèi)存重復(fù)的信息,ORACLE也可以準(zhǔn)確統(tǒng)計SQL的執(zhí)行頻率。
2、WHERE后面的條件順序影響
WHERE子句后面的條件順序?qū)Υ髷?shù)據(jù)量表的查詢會產(chǎn)生直接的影響。如: Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1 Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下' 以上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標(biāo)志)兩個字段都沒進(jìn)行索引,所以執(zhí)行的時候都是全表掃描,第一條SQL的dy_dj = '1KV以下'條件在記錄集內(nèi)比率為99%,而xh_bz=1的比率只為0.5%,在進(jìn)行第一條SQL的時候99%條記錄都進(jìn)行dy_dj及xh_bz的比較,而在進(jìn)行第二條SQL的時候0.5%條記錄都進(jìn)行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU占用率明顯比第一條低。
3、查詢表順序的影響
在FROM后面的表中的列表順序會對SQL執(zhí)行性能影響,在沒有索引及ORACLE沒有對表進(jìn)行統(tǒng)計分析的情況下,ORACLE會按表出現(xiàn)的順序進(jìn)行鏈接,由此可見表的順序不對時會產(chǎn)生十分耗服物器資源的數(shù)據(jù)交叉。(注:如果對表進(jìn)行了統(tǒng)計分析,ORACLE會自動先進(jìn)小表的鏈接,再進(jìn)行大表的鏈接)
三、SQL語句索引的利用
1、操作符優(yōu)化(同上)
2、對條件字段的一些優(yōu)化
采用函數(shù)處理的字段不能利用索引,如:
substr(hbs_bh,1,4)=’5400’,優(yōu)化處理:hbs_bh like ‘5400%’
trunc(sk_rq)=trunc(sysdate), 優(yōu)化處理:sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)
進(jìn)行了顯式或隱式的運算的字段不能進(jìn)行索引,如:ss_df+20>50,優(yōu)化處理:ss_df>30
‘X’ || hbs_bh>’X5400021452’,優(yōu)化處理:hbs_bh>’5400021542’
sk_rq+5=sysdate,優(yōu)化處理:sk_rq=sysdate-5
hbs_bh=5401002554,優(yōu)化處理:hbs_bh=’ 5401002554’,注:此條件對hbs_bh 進(jìn)行隱式的to_number轉(zhuǎn)換,因為hbs_bh字段是字符型。
條件內(nèi)包括了多個本表的字段運算時不能進(jìn)行索引,如:ys_df>cx_df,無法進(jìn)行優(yōu)化 qc_bh || kh_bh=’5400250000’,優(yōu)化處理:qc_bh=’5400’ and kh_bh=’250000’
四、其他
ORACLE的提示功能是比較強(qiáng)的功能,也是比較復(fù)雜的應(yīng)用,并且提示只是給ORACLE執(zhí)行的一個建議,有時如果出于成本方面的考慮ORACLE也可能不會按提示進(jìn)行。根據(jù)實踐應(yīng)用,一般不建議開發(fā)人員應(yīng)用ORACLE提示,因為各個數(shù)據(jù)庫及服務(wù)器性能情況不一樣,很可能一個地方性能提升了,但另一個地方卻下降了,ORACLE在SQL執(zhí)行分析方面已經(jīng)比較成熟,如果分析執(zhí)行的路徑不對首先應(yīng)在數(shù)據(jù)庫結(jié)構(gòu)(主要是索引)、服務(wù)器當(dāng)前性能(共享內(nèi)存、磁盤文件碎片)、數(shù)據(jù)庫對象(表、索引)統(tǒng)計信息是否正確這幾方面分析。