SQL優(yōu)化方法論與實戰(zhàn)
當前位置:點晴教程→知識管理交流
→『 技術(shù)文檔交流 』
前言這兩天在團隊內(nèi)部分享了一篇 《SQL優(yōu)化方法論與實戰(zhàn)》,在此也簡單整理成文字稿分享給各位。 正文首先為什么要進行優(yōu)化?說得直白點,無外乎是為了在現(xiàn)有資源情況下,不付出額外的成本,提升體驗,又曰——降本增效。 那么數(shù)據(jù)庫作為日常背鍋選手,有哪些可以衡量性能的指標呢?我大致列了以下幾項:
比如應(yīng)用告警報錯閾值是 10 ms,如果某個時間段報錯數(shù)量急劇增加,這個時候可能數(shù)據(jù)庫的狀態(tài)就不太正常了,其次數(shù)據(jù)庫的緩存命中率其實也可以從側(cè)面反映出數(shù)據(jù)庫的狀態(tài),大量 cache miss,性能注定好不到哪里去。 而延遲作為集中式數(shù)據(jù)庫的關(guān)鍵性黃金指標,延遲至關(guān)重要,假如我在某個商品界面上發(fā)起下單請求,等了許久才彈出一個付款界面,那么我會轉(zhuǎn)身就走,購買欲望瞬間降至冰點,延遲直接關(guān)系到用戶體驗。 那么作為 DBA 的我們,對于延遲也要有個大概的"尺度",比如稍微差一點的盤,尋道時間在 3 ~ 10 ms 左右,毫秒級別,L1 / L2 CPU 緩存則在納秒級別,內(nèi)存訪問的話則是在 100 納秒的級別。那如果現(xiàn)在有個 redis ,延遲為 100 ms,你說慢不慢?當然是慢的摳腳。 爛 SQL 的危害如果真要一一列舉出來,可能到天黑都說不完,爛 SQL 往往是導致數(shù)據(jù)庫性能衰減的元兇,性能問題源于 SQL,之外可能源于并發(fā) (居多) 或數(shù)據(jù)庫和操作系統(tǒng)自身維護性操作 (vacuum / freeze) 等等。 因此獲取現(xiàn)場就變得尤為重要,但 PostgreSQL 一直惱于沒有原生好用成熟的 AWR 工具,所以得借助一些第三方工具,此處我也簡單整理了一下常用工具和插件,比如類似于 cursor sharing 的 pg_shared_plans,執(zhí)行計劃固化 sr_plan / pg_plan_guarentee 等,pg_stat_statements 肯定得裝上,基于 pg_stat_statements 實現(xiàn)丐版 AWR 也可以,關(guān)于這點可以抄作業(yè) 👉🏻 Using pg_stat_statements to Optimize Queries SQL 從客戶端發(fā)起,到數(shù)據(jù)庫執(zhí)行,再到接收,中間的每一環(huán)節(jié)都至關(guān)重要,比如網(wǎng)絡(luò)帶寬直接就決定了數(shù)據(jù)庫的吞吐量,這里要提一句的是,和 fetchsize 類似的是 FETCH_COUNT,也是為了防止客戶端 OOM,當客戶端向數(shù)據(jù)庫發(fā)送請求時,如果結(jié)果集很大,可能會把客戶端的內(nèi)存打爆,悠著點兒。 SQL 的邏輯順序不多說了,關(guān)于物理執(zhí)行順序需要說明一下。 當一條查詢進來之后,會經(jīng)過Parser → Analyzer → Rewriter → Planner → executor 這一系列步驟,生成各種各樣的"樹"。若是 DDL 語句,無需進行優(yōu)化,到 utility 模塊處理,對于 DML 則需要按照完整的流程。(最近我正在看 "Journey of a DML query",后續(xù)也會分享給各位)。 對于數(shù)據(jù)庫來說,傳入的 SQL 語句不過是一串"文本",PostgreSQL 并不知曉也不理解這一串文本是什么意思,因此我們需要告訴數(shù)據(jù)庫該如何理解這一串文本,之后 SQL 語句就會被轉(zhuǎn)化為內(nèi)部結(jié)構(gòu),即語法解析樹,再經(jīng)過優(yōu)化的處理,最終轉(zhuǎn)化為執(zhí)行器可以高效執(zhí)行的計劃樹。 而優(yōu)化器作為數(shù)據(jù)庫的大腦,優(yōu)化器的好壞直接決定了一個數(shù)據(jù)庫的"上限",決定了一個數(shù)據(jù)庫面對復雜語句的處理能力。說白了,邏輯優(yōu)化就是盡量對查詢進行等價或者推倒變換,以達到更有效率的執(zhí)行計劃。因為 SQL 是聲明式語言,我們只是指定了需要返回什么結(jié)果,而沒有指定它該怎么做。 在此也貼一個關(guān)于優(yōu)化器涉及到的相關(guān)參數(shù)和系統(tǒng)表,以及核心代碼流程,之前有位讀者問過我這塊: 對于 Greenplum 來說,他既支持傳統(tǒng) PostgreSQL 優(yōu)化器,也有 ORCA。對于 GPORCA 不支持的特性,GPORCA 會自動回到 Planner。 其中 PostgreSQL 優(yōu)化器采用了兩種方法:自底向上使用的是動態(tài)規(guī)劃,隨機方法使用的是遺傳算法,由geqo_threshold 參數(shù)控制何時使用遺傳算法,默認是 12。
對于 OUTER JOIN 來說,JOIN 順序是固定的,所以路徑數(shù)量相對較少 (只需要考慮不同 JOIN 算法組成的路徑);然而對于 INNER JOIN 來說,表之間的 JOIN 順序是可以不同的,這樣就可以由不同的 JOIN 組合、不同的 JOIN 順序組成非常多的不同路徑。如
等等。多表間的連接順序表示了查詢計劃樹的基本形態(tài)。一棵樹就是一種查詢路徑,SQL 的語義可以由多棵這樣的樹表達,從中選擇花費最少的樹,就是最優(yōu)查詢計劃形成的過程。一棵樹包括左深連接樹、右深連接樹、緊密樹。PostgreSQL 優(yōu)化器主要考慮將執(zhí)行計劃樹生成以下三種形式,包括左深樹、右深樹和緊密型樹。不同的連接順序,會生成不同大小的中間關(guān)系,對應(yīng) CPU 和 IO 消耗不同。 PostgreSQL 中會嘗試多種連接方式存放到 "path" 上,以找出花費最小的路徑。 試想一下,如果A ⨝ B ⨝ C ⨝ D,那么有 N! ✕ (N-1)! 這么多種可能的計劃 (ABCD, ABDC, ADBC, DABC ...)。人們針對樹的形成及其花費代價最少的,提出了諸多算法。樹形成過程有以下兩種策略:
在數(shù)據(jù)庫實現(xiàn)中,多數(shù)數(shù)據(jù)庫采取了自底向上的策略。就 PostgreSQL 而言,查詢優(yōu)化可以大體分為四個步驟:
如果看到這樣類似的關(guān)鍵字,則代表是 ORCA 優(yōu)化器,其是基于自頂向下的查詢優(yōu)化器,對于復雜 SQL 性能較好,但是生成執(zhí)行計劃的時間也更久。 讓我們看一個實際的例子 (Greenplum 相較于 PostgreSQL 多了一些算子和術(shù)語) :
這里主要提一下 rows 的預估,各位可以參照我之前寫的執(zhí)行計劃篇章,根據(jù) pg_stats 統(tǒng)計信息計算而來,這也再次說明了統(tǒng)計信息的重要性,不然優(yōu)化器無從下手。 當然還有各種各樣的輔助算子,用于執(zhí)行某些特定操作,比如
掃描方式就不多說了,順序掃描 / 索引掃描 / bitmap scan,不過 Greenplum 是支持 bitmap 索引的。 對于向量化計算,各位可能也經(jīng)常在各大產(chǎn)品 PR 里面聽到,此處推薦閱讀一下 PgSQL · 引擎介紹 · 向量化執(zhí)行引擎簡介 “ 多表關(guān)聯(lián)的算法包括 NSL / HASH JOIN / MERGE JOIN,HASH JOIN 要關(guān)注批次 "batch" 的問題 讓我們回到 Greenplum,Greenplum 不同于集中式 PostgreSQL,由多個 segment + master 組成,master 僅僅是存放元信息,做結(jié)果的匯總 (Gather) 對于 JOIN,如果是基于分布鍵的等值連接 (因為同樣的數(shù)據(jù)都位于同一個數(shù)據(jù)節(jié)點),那么每個 segment 可以本地連接,最后通過 Gather Motion 收集結(jié)果即可。 相反,如果不是基于分布鍵的等值連接,那么需要重分布其中一個表,或重分布兩個表,或者廣播,因為我需要的數(shù)據(jù)位于其他節(jié)點上了,需要將數(shù)據(jù)傳輸?shù)街付ü?jié)點進行關(guān)聯(lián)。 比如這個計劃,就很明顯,沒有涉及到重分布 (redistribute),而第二個由于不是分布鍵,就涉及到了重分布。 對于冗長的 SQL,執(zhí)行計劃可能滿滿一屏幕都看不完,人肉分析費時費力,因此我們需要借助一些工具將執(zhí)行計劃可視化一下,這就是 PEV,一目了然,可以迅速發(fā)現(xiàn)高消耗節(jié)點,著重優(yōu)化這些高消耗節(jié)點,用得較多的是 "大力波"。 現(xiàn)在,讓我們看一下實際的優(yōu)化案例,老生常談的當然是索引失效了,各位就直接看 PPT 吧。 關(guān)于分區(qū)裁剪,Greenplum7 里看著無法裁剪 stable 的函數(shù),有環(huán)境的讀者可以測一下,也歡迎讀者告訴下我結(jié)果。 內(nèi)存對齊我也提及過很多次,由于 CPU 取址是按照"模子" 去取的,存在著對齊。由于 Greenplum 存在行存表,AOCO 和 AORO ,此處針對傳統(tǒng)堆表,推薦字段排放順序如下:
一個小小的規(guī)范,可能就讓你從原來需要 40C 資源,降低到了 35C,何樂而不為呢。 另外前面也提到了,SQL 是一種聲明式的語言,what to do,而不是 how to do。對于一條 SQL,數(shù)據(jù)庫可以有多種方式去執(zhí)行,條條大路通羅馬,比如順序掃描、索引掃描,多表連接的話又有 nestloop、hashjoin、mergejoin 等,需要有一種機制告訴它如何去選擇一條最優(yōu)的方式去生成執(zhí)行計劃,這就是統(tǒng)計信息的作用,知道數(shù)據(jù)的一個分布情況,比如高頻值,非重復值數(shù)量,是否有空值等等。 如果統(tǒng)計信息過舊,那么優(yōu)化器做出的決策可能就不準確,我們可以根據(jù) pg_stat_all_tables.last_analyze和last_autoanalyze 查詢何時做了 analyze ,確保統(tǒng)計信息沒有過舊。 另外就是擴展統(tǒng)計信息了,Greenplum7 源自 12 的內(nèi)核,所以也支持 由于 Greenplum 是分布式數(shù)據(jù)庫,分布鍵的設(shè)計至關(guān)重要,分布鍵的設(shè)計應(yīng)遵循:數(shù)據(jù)均勻分布原則、本地操作原則和負載均衡原則。無特殊情況,不使用隨機分布。 比如下面這個例子,就存在著數(shù)據(jù)傾斜,另外兩個節(jié)點只能干瞪著另外一個節(jié)點熱火朝天,所以木桶效應(yīng)的預防尤為重要,對于所有需要設(shè)計 shard key 的數(shù)據(jù)庫都是一樣。 關(guān)于聚集,有兩種方式:
另外 HashAggregatede 只能進行一些簡單的聚合,像count (distinct …) 這類聚合是做不了的 (針對原生PostgreSQL 的情況),大部分情況下 HashAggregatede 的效率都會比 GroupAggregatede 要好,主要是排序這個操作比較耗時,本質(zhì)上 GroupAggregatede 是在用空間 (內(nèi)存) 換時間,內(nèi)存充足的情況下這種做可以,但是內(nèi)存不足容易 OOM。 另外要尤其注意 sum(bigint) 的行為,會導致每一條數(shù)據(jù)都要轉(zhuǎn)換,盡量避免! 最后就是鮮為人知的 union all 了,關(guān)聯(lián)的數(shù)據(jù)類型最好保持一致!否則是無法做視圖展開的
可以看到這兩個查詢的效率天差地別,僅僅是因為數(shù)據(jù)類型的原因 小結(jié)以上便是我個人關(guān)于 SQL 優(yōu)化的一點小心得,希望各位讀者閱讀之后能夠有所收獲。 該文章在 2023/11/15 22:20:58 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |