[轉帖]SQL Server中存儲過程比直接運行SQL語句慢的原因
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
:SQL Server中存儲過程比直接運行SQL語句慢的原因 在很多的資料中都描述說SQLSERVER的存儲過程較普通的SQL語句有以下優點: 1. 存儲過程只在創造時進行編譯即可,以后每次執行存儲過程都不需再重新編譯,而我們通常使用的SQL語句每執行一次就編譯一次,所以使用存儲過程可提高數據庫執行速度。 2. 經常會遇到復雜的業務邏輯和對數據庫的操作,這個時候就會用SP來封裝數據庫操作。當對數據庫進行復雜操作時(如對多個表進行 Update,Insert,Query,Delete時),可將此復雜操作用存儲過程封裝起來與數據庫提供的事務處理結合一起使用。可以極大的提高數據 庫的使用效率,減少程序的執行時間,這一點在較大數據量的數據庫的操作中是非常重要的。在代碼上看,SQL語句和程序代碼語句的分離,可以提高程序代碼的 可讀性。 3. 存儲過程可以設置參數,可以根據傳入參數的不同重復使用同一個存儲過程,從而高效的提高代碼的優化率和可讀性。 4. 安全性高,可設定只有某此用戶才具有對指定存儲過程的使用權存儲過程的種類: A. 系統存儲過程:以sp_開頭,用來進行系統的各項設定.取得信息.相關管理工作,如 sp_help就是取得指定對象的相關信息。 B. 擴展存儲過程 以XP_開頭,用來調用操作系統提供的功能 C. 用戶自定義的存儲過程,這是我們所指的存儲過程常用格式 模版:Create procedure procedue_name [@parameter data_type][output] 解釋:output:表示此參數是可傳回的 with {recompile|encryption} recompile:表示每次執行此存儲過程時都重新編譯一次;encryption:所創建的存儲過程的內容會被加密。
但是最近我們項目組中有人寫了一個存儲過程,其計算時間為1個小時47分鐘,而有的時候運行時間都超過了兩個小時,同事描述說如果將存儲過程中的語句拿出來直接運行也就10分鐘左右就運行完畢,我沒當回事,但是今天我自己寫的存儲過程也遇到了這個問題,在查找資料后原因終于找到了原因,原來是Parameter sniffing問題。 下面看我是如何將運行一個小時以上的存儲過程優化成在一分鐘之內完成的: 原存儲過程 CREATE PROCEDURE [dbo].[pro_ImAnalysis_daily] @THEDATE VARCHAR(30) AS BEGIN IF @THEDATE IS NULL BEGIN SET @THEDATE=CONVERT(VARCHAR(30),GETDATE()-1,112); END
DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;
INSERT RPT_IM_USERINFO_DAILY (THEDATE,ALLUSER,NEWUSER) SELECT AA.THEDATE,ALLUSER,NEWUSER FROM ( ( SELECT THEDATE,COUNT(DISTINCT USERID) ALLUSER FROM FACT WHERE THEDATE=@THEDATE GROUP BY THEDATE ) AA LEFT JOIN (SELECT THEDATE,COUNT(DISTINCT USERID) NEWUSER FROM FACT T1 WHERE NOT EXISTS( SELECT 1 FROM FACT T2 WHERE T2.THEDATE<@THEDATE AND T1.USERID=T2.USERID) AND T1.THEDATE=@THEDATE GROUP BY THEDATE ) BB ON AA.THEDATE=BB.THEDATE); GO 每日執行:exec pro_ImAnalysis_daily @thedate=null 經 過查找資料,原因如下(由于源文是一篇英文,有些地方寫的我不是特別清楚,原文見http://groups.google.com/group /microsoft.public.sqlserver.server/msg/ad37d8aec76e2b8f?hl=en&lr=& amp;ie=UTF-8&oe=UTF-8): 在SQL Server中有一個叫做 “Parameter sniffing”的特性。SQL Server在存儲過程執行之前都會制定一個執行計劃。在上面的例子中,SQL在編譯的時候并不知道@thedate的值是多少,所以它在執行執行計劃的時候就要進行大量的猜測。假設傳遞給@thedate的參數大部分都是非空字符串,而FACT表中有40%的thedate字段都是null,那么SQL Server就會選擇全表掃描而不是索引掃描來對參數@thedate制定執行計劃。全表掃描是在參數為空或為0的時候最好的執行計劃。但是全表掃描嚴重影響了性能。 假設你第一次使用了Exec pro_ImAnalysis_daily @thedate=’20080312’那么SQL Server就會使用20080312這個值作為下次參數@thedate的執行計劃的參考值,而不會進行全表掃描了,但是如果使用@thedate=null,則下次執行計劃就要根據全表掃描進行了。 有兩種方式能夠避免出現“Parameter sniffing”問題: (1)通過使用declare聲明的變量來代替參數:使用set @variable=@thedate的方式,將出現@thedate的sql語句全部用@variable來代替。 (2) 將受影響的sql語句隱藏起來,比如: a) 將受影響的sql語句放到某個子存儲過程中,比如我們在@thedate設置成為今天后再調用一個字存儲過程將@thedate作為參數傳入就可以了。 b) 使用sp_executesql來執行受影響的sql。執行計劃不會被執行,除非sp_executesql語句執行完。 c) 使用動態sql(”EXEC(@sql)”來執行受影響的sql。 采用(1)的方法改造例子中的存儲過程,如下: ALTER PROCEDURE [dbo].[pro_ImAnalysis_daily] @var_thedate VARCHAR(30)
AS BEGIN declare @THEDATE VARCHAR(30) IF @var_thedate IS NULL BEGIN SET @var_thedate=CONVERT(VARCHAR(30),GETDATE()-1,112); END
SET @THEDATE=@var_thedate; DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;
INSERT RPT_IM_USERINFO_DAILY (THEDATE,ALLUSER,NEWUSER) SELECT AA.THEDATE,ALLUSER,NEWUSER FROM ( ( SELECT THEDATE,COUNT(DISTINCT USERID) ALLUSER FROM FACT WHERE THEDATE=@THEDATE GROUP BY THEDATE ) AA LEFT JOIN (SELECT THEDATE,COUNT(DISTINCT USERID) NEWUSER FROM FACT T1 WHERE NOT EXISTS( SELECT 1 FROM FACT T2 WHERE T2.THEDATE<@THEDATE AND T1.USERID=T2.USERID) AND T1.THEDATE=@THEDATE GROUP BY THEDATE ) BB ON AA.THEDATE=BB.THEDATE); GO
測試執行速度為10分鐘,我又檢查了一下這個SQL,發現這個SQL有問題,這個SQL使用了not exists,在一個大表里面使用not exists是不太明智的,所以,我又對這個sql進行了改進,改成如下: ALTER PROCEDURE [dbo].[pro_ImAnalysis_daily] @var_thedate VARCHAR(30)
AS BEGIN declare @THEDATE VARCHAR(30) IF @var_thedate IS NULL BEGIN SET @var_thedate=CONVERT(VARCHAR(30),GETDATE()-1,112); END
SET @THEDATE=@var_thedate; DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;
INSERT RPT_IM_USERINFO_DAILY(THEDATE,ALLUSER,NEWUSER) select @thedate as thedate, count(distinct case when today>0 then userid else null end) as alluser, count(distinct case when dates=0 then userid else null end) as newuser from ( select userid, count(CASE WHEN thedate>=@thedate then null else thedate end) as dates, count(case when thedate=@thedate then thedate else null end) as today from FACT group by userid )as fact GO 測試結果為30ms以下。 該文章在 2024/6/21 17:12:49 編輯過 |
關鍵字查詢
相關文章
正在查詢... |