52條SQL語句性能優化策略,快速收藏
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
1、對查詢進行優化,應盡量避免全表掃描,首先應考慮在 where 及 ORDER BY 涉及的列上建立索引。 2、應盡量避免在 where 子句中對字段進行 NULL 值判斷,創建表時 NULL 是默認值,但大多數時候應該使用 NOT NULL,或者使用一個特殊的值,如 0,-1 作為默認值。 3、應盡量避免在 where 子句中使用 != 或 <> 操作符。MySQL 只有對以下操作符才使用索引:<,<=,=,>,>=,BETWEEN,IN,以及某些時候的 LIKE。 4、應盡量避免在 where 子句中使用 OR 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,可以使用 union 合并查詢:select id from t where num=10 union all select id from t where num=20。 5、IN 和 NOT IN 也要慎用,否則會導致全表掃描。對于連續的數值,能用 BETWEEN 就不要用 IN:select id from t where num between 1 and 3。 6、下面的查詢也將導致全表掃描:select id from t where name like‘%abc%’ 或者select id from t where name like‘%abc’若要提高效率,可以考慮全文檢索。而select id from t where name like‘abc%’才用到索引。 7、如果在 where 子句中使用參數,也會導致全表掃描。 8、應盡量避免在 where 子句中對字段進行表達式操作,應盡量避免在 where 子句中對字段進行函數操作。 9、很多時候用 EXISTS 代替 IN 是一個好的選擇:select num from a where num in(select num from b)。用下面的語句替換:select num from a where exists(select 1 from b where num=a.num)。 10、索引固然可以提高相應的 select 的效率,但同時也降低了 insert 及 update 的效。因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過 6 個,若太多則應考慮一些不常使用到的列上建的索引是否有必要。 11、應盡可能的避免更新 clustered 索引數據列, 因為 clustered 索引數據列的順序就是表記錄的物理存儲順序,一旦該列值改變將導致整個表記錄的順序的調整,會耗費相當大的資源。若應用系統需要頻繁更新 clustered 索引數據列,那么需要考慮是否應將該索引建為 clustered 索引。 12、盡量使用數字型字段,若只含數值信息的字段盡量不要設計為字符型,這會降低查詢和連接的性能,并會增加存儲開銷。 13、盡可能的使用 varchar, nvarchar 代替 char, nchar。因為首先變長字段存儲空間小,可以節省存儲空間,其次對于查詢來說,在一個相對較小的字段內搜索效率顯然要高些。 14、最好不要使用返回所有:select from t ,用具體的字段列表代替 “*”,不要返回用不到的任何字段。 15、盡量避免向客戶端返回大數據量,若數據量過大,應該考慮相應需求是否合理。 16、使用表的別名(Alias):當在 SQL 語句中連接多個表時,請使用表的別名并把別名前綴于每個 Column 上。這樣一來,就可以減少解析的時間并減少那些由 Column 歧義引起的語法錯誤。 17、使用“臨時表”暫存中間結果 : 簡化 SQL 語句的重要方法就是采用臨時表暫存中間結果。但是臨時表的好處遠遠不止這些,將臨時結果暫存在臨時表,后面的查詢就在 tempdb 中了,這可以避免程序中多次掃描主表,也大大減少了程序執行中“共享鎖”阻塞“更新鎖”,減少了阻塞,提高了并發性能。 18、一些 SQL 查詢語句應加上 nolock,讀、寫是會相互阻塞的,為了提高并發性能。對于一些查詢,可以加上 nolock,這樣讀的時候可以允許寫,但缺點是可能讀到未提交的臟數據。 使用 nolock 有3條原則:
19、常見的簡化規則如下: 不要有超過 5 個以上的表連接(JOIN),考慮使用臨時表或表變量存放中間結果。少用子查詢,視圖嵌套不要過深,一般視圖嵌套不要超過 2 個為宜。 20、將需要查詢的結果預先計算好放在表中,查詢的時候再select。這在SQL7.0以前是最重要的手段,例如醫院的住院費計算。 21、用 OR 的字句可以分解成多個查詢,并且通過 union 連接多個查詢。他們的速度只同是否使用索引有關,如果查詢需要用到聯合索引,用 union all 執行的效率更高。多個 OR 的字句沒有用到索引,改寫成 union 的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。 22、在IN后面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最后面,減少判斷的次數。 23、盡量將數據的處理工作放在服務器上,減少網絡的開銷,如使用存儲過程。 存儲過程是編譯好、優化過、并且被組織到一個執行規劃里、且存儲在數據庫中的 SQL 語句,是控制流語言的集合,速度當然快。反復執行的動態 SQL,可以使用臨時存儲過程,該過程(臨時表)被放在 Tempdb 中。 24、當服務器的內存夠多時,配制線程數量 = 最大連接數+5,這樣能發揮最大的效率;否則使用配制線程數量< 最大連接數,啟用 SQL SERVER 的線程池來解決,如果還是數量 = 最大連接數+5,嚴重的損害服務器的性能。 25、查詢的關聯同寫的順序 : select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' (A = B, B = '號碼') select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' and b.referenceid = 'JCNPRH39681' (A = B, B = '號碼', A = '號碼') select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = 'JCNPRH39681' and a.personMemberID = 'JCNPRH39681' (B = '號碼', A = '號碼') 26、盡量使用 EXISTS 代替 select count(1) 來判斷是否存在記錄。count 函數只有在統計表中所有行數時使用,而且 count(1) 比 count(*) 更有效率。 27、盡量使用 “>=”,不要使用 “>”。 28、索引的使用規范:
29、下列 SQL 條件語句中的列都建有恰當的索引,但執行速度卻非常慢: select * from record where substrINg(card_no, 1, 4) = '5378' --13秒 select * from record where amount/30 < 1000 --11秒 select * from record where convert(char(10), date, 112) = '19991201' --10秒 分析: where 子句中對列的任何操作結果都是在 SQL 運行時逐列計算得到的,因此它不得不進行表搜索,而沒有使用該列上面的索引。 如果這些結果在查詢編譯時就能得到,那么就可以被 SQL 優化器優化,使用索引,避免表搜索,因此將 SQL 重寫成下面這樣: select * from record where card_no like '5378%' -- < 1秒 select * from record where amount < 1000*30 -- < 1秒 select * from record where date = '1999/12/01' -- < 1秒 30、當有一批處理的插入或更新時,用批量插入或批量更新,絕不會一條條記錄的去更新。 31、在所有的存儲過程中,能夠用 SQL 語句的,我絕不會用循環去實現。 例如:列出上個月的每一天,我會用 connect by 去遞歸查詢一下,絕不會去用循環從上個月第一天到最后一天。 32、選擇最有效率的表名順序(只在基于規則的優化器中有效): Oracle 的解析器按照從右到左的順序處理 from 子句中的表名,from 子句中寫在最后的表(基礎表 driving table)將被最先處理,在 from 子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。 如果有 3 個以上的表連接查詢,那就需要選擇交叉表(intersection table)作為基礎表,交叉表是指那個被其他表所引用的表。 33、提高 GROUP BY 語句的效率,可以通過將不需要的記錄在 GROUP BY 之前過濾掉。下面兩個查詢返回相同結果,但第二個明顯就快了許多。 低效: select JOB, AVG(SAL) from EMP GROUP BY JOB HAVING JOB = 'PRESIDENT' OR JOB = 'MANAGER' 高效: select JOB, AVG(SAL) from EMP where JOB = 'PRESIDENT' OR JOB = 'MANAGER' GROUP BY JOB 34、SQL 語句用大寫,因為 Oracle 總是先解析 SQL 語句,把小寫的字母轉換成大寫的再執行。 35、別名的使用,別名是大型數據庫的應用技巧,就是表名、列名在查詢中以一個字母為別名,查詢速度要比建連接表快 1.5 倍。 36、避免死鎖,在你的存儲過程和觸發器中訪問同一個表時總是以相同的順序;事務應經可能地縮短,在一個事務中應盡可能減少涉及到的數據量;永遠不要在事務中等待用戶輸入。 37、避免使用臨時表,除非卻有需要,否則應盡量避免使用臨時表,相反,可以使用表變量代替。大多數時候(99%),表變量駐扎在內存中,因此速度比臨時表更快,臨時表駐扎在 TempDb 數據庫中,因此臨時表上的操作需要跨數據庫通信,速度自然慢。 38、最好不要使用觸發器:
39、索引創建規則:
40、MySQL 查詢優化總結: 使用慢查詢日志去發現慢查詢,使用執行計劃去判斷查詢是否正常運行,總是去測試你的查詢看看是否他們運行在最佳狀態下。 久而久之性能總會變化,避免在整個表上使用 count(*),它可能鎖住整張表,使查詢保持一致以便后續相似的查詢可以使用查詢緩存,在適當的情形下使用 GROUP BY 而不是 DISTINCT,在 where、GROUP BY 和 ORDER BY 子句中使用有索引的列,保持索引簡單,不在多個索引中包含同一個列。 有時候 MySQL 會使用錯誤的索引,對于這種情況使用 USE INDEX,檢查使用 SQL_MODE=STRICT 的問題,對于記錄數小于5的索引字段,在 union 的時候使用LIMIT不是是用OR。 為了避免在更新前 select,使用 insert ON DUPLICATE KEY 或者 insert IGNORE;不要用 update 去實現,不要使用 MAX;使用索引字段和 ORDER BY子句 LIMIT M,N 實際上可以減緩查詢在某些情況下,有節制地使用,在 where 子句中使用 union 代替子查詢,在重新啟動的 MySQL,記得來溫暖你的數據庫,以確保數據在內存和查詢速度快,考慮持久連接,而不是多個連接,以減少開銷。 基準查詢,包括使用服務器上的負載,有時一個簡單的查詢可以影響其他查詢,當負載增加在服務器上,使用 SHOW PROCESSLIST 查看慢的和有問題的查詢,在開發環境中產生的鏡像數據中測試的所有可疑的查詢。 41、MySQL 備份過程:
42、查詢緩沖并不自動處理空格,因此,在寫 SQL 語句時,應盡量減少空格的使用,尤其是在 SQL 首和尾的空格(因為查詢緩沖并不自動截取首尾空格)。 43、member 用 mid 做標準進行分表方便查詢么?一般的業務需求中基本上都是以 username 為查詢依據,正常應當是 username 做 hash 取模來分表。 而分表的話 MySQL 的 partition 功能就是干這個的,對代碼是透明的;在代碼層面去實現貌似是不合理的。 44、我們應該為數據庫里的每張表都設置一個 ID 做為其主鍵,而且最好的是一個 INT 型的(推薦使用 UNSIGNED),并設置上自動增加的 AUTO_INCREMENT 標志。 45、在所有的存儲過程和觸發器的開始處設置 SET NOCOUNT ON,在結束時設置 SET NOCOUNT OFF。無需在執行存儲過程和觸發器的每個語句后向客戶端發送 DONE_IN_PROC 消息。 46、MySQL 查詢可以啟用高速查詢緩存。這是提高數據庫性能的有效MySQL優化方法之一。當同一個查詢被執行多次時,從緩存中提取數據和直接從數據庫中返回數據快很多。 47、EXPLAIN select 查詢用來跟蹤查看效果: 使用 EXPLAIN 關鍵字可以讓你知道 MySQL 是如何處理你的 SQL 語句的。這可以幫你分析你的查詢語句或是表結構的性能瓶頸。EXPLAIN 的查詢結果還會告訴你你的索引主鍵被如何利用的,你的數據表是如何被搜索和排序的。 48、當只要一行數據時使用 LIMIT 1 : 當你查詢表的有些時候,你已經知道結果只會有一條結果,但因為你可能需要去fetch游標,或是你也許會去檢查返回的記錄數。 在這種情況下,加上 LIMIT 1 可以增加性能。這樣一來,MySQL 數據庫引擎會在找到一條數據后停止搜索,而不是繼續往后查少下一條符合記錄的數據。 49、選擇表合適存儲引擎:
50、優化表的數據類型,選擇合適的數據類型: 原則:更小通常更好,簡單就好,所有字段都得有默認值,盡量避免 NULL。 例如:數據庫表設計時候更小的占磁盤空間盡可能使用更小的整數類型。(mediumint 就比 int 更合適) 比如時間字段:datetime 和 timestamp。datetime 占用8個字節,timestamp 占用4個字節,只用了一半。而 timestamp 表示的范圍是 1970—2037 適合做更新時間。 MySQL可以很好的支持大數據量的存取,但是一般說來,數據庫中的表越小,在它上面執行的查詢也就會越快。 因此,在創建表的時候,為了獲得更好的性能,我們可以將表中字段的寬度設得盡可能小。 例如:在定義郵政編碼這個字段時,如果將其設置為 CHAR(255),顯然給數據庫增加了不必要的空間。甚至使用VARCHAR 這種類型也是多余的,因為 CHAR(6) 就可以很好的完成任務了。 同樣的,如果可以的話,我們應該使用 MEDIUMINT 而不是 BIGIN 來定義整型字段,應該盡量把字段設置為 NOT NULL,這樣在將來執行查詢的時候,數據庫不用去比較 NULL 值。 對于某些文本字段,例如“省份”或者“性別”,我們可以將它們定義為 ENUM 類型。因為在 MySQL 中,ENUM 類型被當作數值型數據來處理,而數值型數據被處理起來的速度要比文本類型快得多。這樣,我們又可以提高數據庫的性能。 51、字符串數據類型:char, varchar, text 選擇區別。 52、任何對列的操作都將導致表掃描,它包括數據庫函數、計算表達式等等,查詢時要盡可能將操作移至等號右邊。 該文章在 2023/5/17 11:20:14 編輯過 |
關鍵字查詢
相關文章
正在查詢... |