日韩欧美一二三,欧美在线不卡,毛片观看网站

【SQLServer】如何設(shè)計日增幾十萬數(shù)據(jù)量的業(yè)務(wù)分庫分表方案

2024年7月21日 21:46 本文熱度 1435

隨著公司的業(yè)務(wù)發(fā)展不斷的壯大，像一些核心的業(yè)務(wù)（如訂單）數(shù)據(jù)量會越來越大，此時就需要考慮分庫分表方案來應(yīng)對業(yè)務(wù)的發(fā)展。今天就來聊聊分庫分表的一些設(shè)計方案。

1、冷熱數(shù)據(jù)分離方案

在我們業(yè)務(wù)中有些數(shù)據(jù)只是最近一段時間使用比較頻繁，過著這段時間就基本上不用了，如龍蝦之前負(fù)責(zé)的物流系統(tǒng)中的物流軌跡數(shù)據(jù)，一條物流單號對應(yīng)著若干條物流軌跡數(shù)據(jù)，如下所示的物流軌跡：

一個物流單號（如YT20241234569）對應(yīng)的軌跡有6條數(shù)據(jù)數(shù)據(jù)了，假設(shè)一天的訂單量有2萬單，此時至少有12萬條物流軌跡產(chǎn)生，日復(fù)一日的數(shù)據(jù)量積累，那么物流軌跡表的數(shù)據(jù)也是非常的龐大的。

從業(yè)務(wù)角度分析，按照用戶的習(xí)慣來講，某個訂單待收貨與交易成功之間的這段時間中我們是比較關(guān)心物流的軌跡的，一旦收到貨之后基本很少再去看這單的物流軌跡信息，所以針對這種數(shù)據(jù)量大（物流軌跡數(shù)據(jù)）、只在某段時間內(nèi)頻繁關(guān)心的數(shù)據(jù)，我們可以使用冷熱數(shù)據(jù)隔離的方案來解決數(shù)據(jù)量大的問題。下圖使用物流軌跡數(shù)據(jù)冷熱分離方案為案例分析：

（1）物流單號訂閱物流系統(tǒng)，物流系統(tǒng)將物流單號訂閱三方快遞，一旦訂閱成功之后，三方快遞收到物流軌跡變動就會推送給物流系統(tǒng)，然后物流系統(tǒng)將數(shù)據(jù)存放到熱表中；

（2）用戶查詢的時候優(yōu)先從熱表先查詢數(shù)據(jù)，如果熱表有物流軌跡的數(shù)據(jù)就直接返回數(shù)據(jù)給用戶；如果熱表中不存在物流數(shù)據(jù)，那么再去冷表中查詢數(shù)據(jù)，將冷表的查詢結(jié)果給用戶；

（3）每天夜里（如凌晨兩點）采用定時任務(wù)將一個月之前的數(shù)據(jù)都遷移到冷表中，這樣可以保持熱表中都是最近的數(shù)據(jù)。

至此就完成了一套使用通過冷熱分離的方案實現(xiàn)對日增幾十萬條業(yè)務(wù)數(shù)據(jù)的處理。

2、分庫分表方案

公司現(xiàn)有的業(yè)務(wù)體量非常大的，在讀寫分離、主從架構(gòu)都無法滿足現(xiàn)有的業(yè)務(wù)的時候，我們就可以考慮分庫分表，為什么不優(yōu)先考慮分庫分表方案呢？因為業(yè)務(wù)數(shù)據(jù)越分散，開發(fā)和維護(hù)成本就越高，并且系統(tǒng)的不穩(wěn)定性又多一些威脅因素。

分庫分表是應(yīng)對業(yè)務(wù)數(shù)據(jù)量大、高并發(fā)的重要手段之一，我們要搞清楚何時分庫，何時分表，何時既分庫也分表呢？

（a）分庫的場景：在高并發(fā)下，數(shù)據(jù)庫的連接不夠用的時候，此時可以通過增加數(shù)據(jù)庫的實例來增加數(shù)據(jù)庫的連接數(shù)。如下所示的分庫方式：

（b）分表的場景：如果單表的數(shù)據(jù)量很龐大，此時數(shù)據(jù)庫的連接是夠用的，但是存儲和查詢的性能已經(jīng)成為業(yè)務(wù)瓶頸，那么就考慮分表。如下圖所示的分片：

（c）既分庫也分表的場景：數(shù)據(jù)庫的連接不夠，并且表數(shù)據(jù)量很龐大此時一般需要考慮既要分庫也要分表。但是具體分多少庫分多少表實際的業(yè)務(wù)預(yù)估數(shù)據(jù)量來做決定，如下圖所示的既分庫也分表的圖：

在確定了需要分庫分表后就需要考慮將數(shù)據(jù)分到哪個庫或者哪張表中，下面介紹4種主流的切分：

（1）Range法

此算法是按照某個字段（如訂單id、用戶id）的數(shù)據(jù)區(qū)間來進(jìn)行切分的，可以將數(shù)據(jù)切分到同一個數(shù)據(jù)庫的不同表中，如下所示：

也可以將數(shù)據(jù)切分到不同庫的不同表中，如下所示：

Range算法對于需要擴(kuò)容來說是非常的友好的，因為只需要添加一張數(shù)據(jù)表，通過算法就可以自動實現(xiàn)擴(kuò)容機(jī)制。同時Range算法也存在寫偏移和熱點數(shù)據(jù)問題。

（2）hash分片算法

該方案是通過對分表鍵key進(jìn)行某種運算（如取模運算），然后通過運算結(jié)果來決定路由的庫和表，如下圖所示：

hash分片方案可以使得數(shù)據(jù)分片比較均勻，大大降低數(shù)據(jù)傾斜和熱點數(shù)據(jù)的問題； hash分片方案的缺點也很明顯，如后期擴(kuò)容存在一定的難度，需要遷移數(shù)據(jù)；數(shù)據(jù)被切分到不同的庫和表中，存在查詢和分頁等問題；

（3）查表映射法

此方案的實現(xiàn)原理是將決定某個sharding key落在哪個分片上靠人為的預(yù)先制定的策略（策略記錄在數(shù)據(jù)表中）來分配，如下所示的分配流程：