SQL優化方法論與實戰
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
正文首先為什么要進行優化?說得直白點,無外乎是為了在現有資源情況下,不付出額外的成本,提升體驗,又曰——降本增效。 那么數據庫作為日常背鍋選手,有哪些可以衡量性能的指標呢?我大致列了以下幾項:
比如應用告警報錯閾值是 10 ms,如果某個時間段報錯數量急劇增加,這個時候可能數據庫的狀態就不太正常了,其次數據庫的緩存命中率其實也可以從側面反映出數據庫的狀態,大量 cache miss,性能注定好不到哪里去。 而延遲作為集中式數據庫的關鍵性黃金指標,延遲至關重要,假如我在某個商品界面上發起下單請求,等了許久才彈出一個付款界面,那么我會轉身就走,購買欲望瞬間降至冰點,延遲直接關系到用戶體驗。 那么作為 DBA 的我們,對于延遲也要有個大概的"尺度",比如稍微差一點的盤,尋道時間在 3 ~ 10 ms 左右,毫秒級別,L1 / L2 CPU 緩存則在納秒級別,內存訪問的話則是在 100 納秒的級別。那如果現在有個 redis ,延遲為 100 ms,你說慢不慢?當然是慢的摳腳。 爛 SQL 的危害如果真要一一列舉出來,可能到天黑都說不完,爛 SQL 往往是導致數據庫性能衰減的元兇,性能問題源于 SQL,之外可能源于并發 (居多) 或數據庫和操作系統自身維護性操作 (vacuum / freeze) 等等。 因此獲取現場就變得尤為重要,但 PostgreSQL 一直惱于沒有原生好用成熟的 AWR 工具,所以得借助一些第三方工具,此處我也簡單整理了一下常用工具和插件,比如類似于 cursor sharing 的 pg_shared_plans,執行計劃固化 sr_plan / pg_plan_guarentee 等,pg_stat_statements 肯定得裝上,基于 pg_stat_statements 實現丐版 AWR 也可以,關于這點可以抄作業 👉🏻 Using pg_stat_statements to Optimize Queries SQL 從客戶端發起,到數據庫執行,再到接收,中間的每一環節都至關重要,比如網絡帶寬直接就決定了數據庫的吞吐量,這里要提一句的是,和 fetchsize 類似的是 FETCH_COUNT,也是為了防止客戶端 OOM,當客戶端向數據庫發送請求時,如果結果集很大,可能會把客戶端的內存打爆,悠著點兒。 SQL 的邏輯順序不多說了,關于物理執行順序需要說明一下。 當一條查詢進來之后,會經過Parser → Analyzer → Rewriter → Planner → executor 這一系列步驟,生成各種各樣的"樹"。若是 DDL 語句,無需進行優化,到 utility 模塊處理,對于 DML 則需要按照完整的流程。(最近我正在看 "Journey of a DML query",后續也會分享給各位)。 對于數據庫來說,傳入的 SQL 語句不過是一串"文本",PostgreSQL 并不知曉也不理解這一串文本是什么意思,因此我們需要告訴數據庫該如何理解這一串文本,之后 SQL 語句就會被轉化為內部結構,即語法解析樹,再經過優化的處理,最終轉化為執行器可以高效執行的計劃樹。 而優化器作為數據庫的大腦,優化器的好壞直接決定了一個數據庫的"上限",決定了一個數據庫面對復雜語句的處理能力。說白了,邏輯優化就是盡量對查詢進行等價或者推倒變換,以達到更有效率的執行計劃。因為 SQL 是聲明式語言,我們只是指定了需要返回什么結果,而沒有指定它該怎么做。 在此也貼一個關于優化器涉及到的相關參數和系統表,以及核心代碼流程,之前有位讀者問過我這塊: 對于 Greenplum 來說,他既支持傳統 PostgreSQL 優化器,也有 ORCA。對于 GPORCA 不支持的特性,GPORCA 會自動回到 Planner。 其中 PostgreSQL 優化器采用了兩種方法:自底向上使用的是動態規劃,隨機方法使用的是遺傳算法,由geqo_threshold 參數控制何時使用遺傳算法,默認是 12。
對于 OUTER JOIN 來說,JOIN 順序是固定的,所以路徑數量相對較少 (只需要考慮不同 JOIN 算法組成的路徑);然而對于 INNER JOIN 來說,表之間的 JOIN 順序是可以不同的,這樣就可以由不同的 JOIN 組合、不同的 JOIN 順序組成非常多的不同路徑。如
等等。多表間的連接順序表示了查詢計劃樹的基本形態。一棵樹就是一種查詢路徑,SQL 的語義可以由多棵這樣的樹表達,從中選擇花費最少的樹,就是最優查詢計劃形成的過程。一棵樹包括左深連接樹、右深連接樹、緊密樹。PostgreSQL 優化器主要考慮將執行計劃樹生成以下三種形式,包括左深樹、右深樹和緊密型樹。不同的連接順序,會生成不同大小的中間關系,對應 CPU 和 IO 消耗不同。 PostgreSQL 中會嘗試多種連接方式存放到 "path" 上,以找出花費最小的路徑。 試想一下,如果A ⨝ B ⨝ C ⨝ D,那么有 N! ✕ (N-1)! 這么多種可能的計劃 (ABCD, ABDC, ADBC, DABC ...)。人們針對樹的形成及其花費代價最少的,提出了諸多算法。樹形成過程有以下兩種策略:
在數據庫實現中,多數數據庫采取了自底向上的策略。就 PostgreSQL 而言,查詢優化可以大體分為四個步驟:
如果看到這樣類似的關鍵字,則代表是 ORCA 優化器,其是基于自頂向下的查詢優化器,對于復雜 SQL 性能較好,但是生成執行計劃的時間也更久。 讓我們看一個實際的例子 (Greenplum 相較于 PostgreSQL 多了一些算子和術語) :
這里主要提一下 rows 的預估,各位可以參照我之前寫的執行計劃篇章,根據 pg_stats 統計信息計算而來,這也再次說明了統計信息的重要性,不然優化器無從下手。 當然還有各種各樣的輔助算子,用于執行某些特定操作,比如
掃描方式就不多說了,順序掃描 / 索引掃描 / bitmap scan,不過 Greenplum 是支持 bitmap 索引的。 對于向量化計算,各位可能也經常在各大產品 PR 里面聽到,此處推薦閱讀一下 PgSQL · 引擎介紹 · 向量化執行引擎簡介 “ 多表關聯的算法包括 NSL / HASH JOIN / MERGE JOIN,HASH JOIN 要關注批次 "batch" 的問題 讓我們回到 Greenplum,Greenplum 不同于集中式 PostgreSQL,由多個 segment + master 組成,master 僅僅是存放元信息,做結果的匯總 (Gather) 對于 JOIN,如果是基于分布鍵的等值連接 (因為同樣的數據都位于同一個數據節點),那么每個 segment 可以本地連接,最后通過 Gather Motion 收集結果即可。 相反,如果不是基于分布鍵的等值連接,那么需要重分布其中一個表,或重分布兩個表,或者廣播,因為我需要的數據位于其他節點上了,需要將數據傳輸到指定節點進行關聯。 比如這個計劃,就很明顯,沒有涉及到重分布 (redistribute),而第二個由于不是分布鍵,就涉及到了重分布。 對于冗長的 SQL,執行計劃可能滿滿一屏幕都看不完,人肉分析費時費力,因此我們需要借助一些工具將執行計劃可視化一下,這就是 PEV,一目了然,可以迅速發現高消耗節點,著重優化這些高消耗節點,用得較多的是 "大力波"。 現在,讓我們看一下實際的優化案例,老生常談的當然是索引失效了,各位就直接看 PPT 吧。 關于分區裁剪,Greenplum7 里看著無法裁剪 stable 的函數,有環境的讀者可以測一下,也歡迎讀者告訴下我結果。 內存對齊我也提及過很多次,由于 CPU 取址是按照"模子" 去取的,存在著對齊。由于 Greenplum 存在行存表,AOCO 和 AORO ,此處針對傳統堆表,推薦字段排放順序如下:
一個小小的規范,可能就讓你從原來需要 40C 資源,降低到了 35C,何樂而不為呢。 另外前面也提到了,SQL 是一種聲明式的語言,what to do,而不是 how to do。對于一條 SQL,數據庫可以有多種方式去執行,條條大路通羅馬,比如順序掃描、索引掃描,多表連接的話又有 nestloop、hashjoin、mergejoin 等,需要有一種機制告訴它如何去選擇一條最優的方式去生成執行計劃,這就是統計信息的作用,知道數據的一個分布情況,比如高頻值,非重復值數量,是否有空值等等。 如果統計信息過舊,那么優化器做出的決策可能就不準確,我們可以根據 pg_stat_all_tables.last_analyze和last_autoanalyze 查詢何時做了 analyze ,確保統計信息沒有過舊。 另外就是擴展統計信息了,Greenplum7 源自 12 的內核,所以也支持 由于 Greenplum 是分布式數據庫,分布鍵的設計至關重要,分布鍵的設計應遵循:數據均勻分布原則、本地操作原則和負載均衡原則。無特殊情況,不使用隨機分布。 比如下面這個例子,就存在著數據傾斜,另外兩個節點只能干瞪著另外一個節點熱火朝天,所以木桶效應的預防尤為重要,對于所有需要設計 shard key 的數據庫都是一樣。 關于聚集,有兩種方式:
另外 HashAggregatede 只能進行一些簡單的聚合,像count (distinct …) 這類聚合是做不了的 (針對原生PostgreSQL 的情況),大部分情況下 HashAggregatede 的效率都會比 GroupAggregatede 要好,主要是排序這個操作比較耗時,本質上 GroupAggregatede 是在用空間 (內存) 換時間,內存充足的情況下這種做可以,但是內存不足容易 OOM。 另外要尤其注意 sum(bigint) 的行為,會導致每一條數據都要轉換,盡量避免! 最后就是鮮為人知的 union all 了,關聯的數據類型最好保持一致!否則是無法做視圖展開的
可以看到這兩個查詢的效率天差地別,僅僅是因為數據類型的原因 小結以上便是關于 SQL 優化的一點小心得,希望各位讀者閱讀之后能夠有所收獲。 該文章在 2023/10/28 12:41:34 編輯過 |
關鍵字查詢
相關文章
正在查詢... |