IdGenerator:雪花算法中非常好用的純數字自增長ID生成器
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
:IdGenerator:雪花算法中非常好用的純數字自增長ID生成器 💎 最佳實踐針對大家在測試過程中,經常出現的性能問題,以下給出3組最佳實踐配置: ❄ 如果生成ID速度不超過5W/s,不用修改任何配置參數 ❄ 如果生成ID速度超過5W/s,低于50W,推薦修改:SeqBitLength=10 ❄ 如果生成ID速度超過50W/s,接近500W,推薦修改:SeqBitLength=12 總之,增加 SeqBitLength 會讓性能更高,但生成的 ID 也會更長。 💎 算法介紹❄ 這是優化的雪花算法(雪花漂移),它生成的ID更短、速度更快。 ❄ 支持 k8s 等容器環境自動擴容(自動注冊 WorkerId),可在單機或分布式環境生成數字型唯一ID。 ❄ 原生支持 C#/Java/Go/C/Rust/Python/Node.js/PHP(C擴展)/SQL/ 等語言,并提供多線程安全調用動態庫(FFI)。 ❄ 兼容所有雪花算法(號段模式或經典模式,大廠或小廠),將來你可做任意的升級切換。 ❄ 這是計算機歷史上最全面的雪花ID生成工具。【截至2022年8月】 需求來源💧 作為架構設計的你,想要解決數據庫主鍵唯一的問題,特別是在分布式系統多數據庫中。 💧 你希望數據表主鍵用最少的存儲空間,索引速度更快,select、insert 和 update 更迅速。 💧 你要考慮在分庫分表(合庫合表)時,主鍵值可直接使用,并能反映業務時序。 💧 如果這樣的主鍵值太長,超過前端 js Number 類型最大值,須把 Long 型轉換為 String 型,你會覺得有點沮喪。 💧 盡管 Guid 能自增,但占用空間大,索引速度慢,你不想用它。 💧 應用實例可能超過50個,每個并發請求可達10W/s。 💧 要在容器環境部署應用,支持水平復制、自動擴容。 💧 不想依賴 redis 的自增操作獲得連續的主鍵ID,因為連續的ID存在業務數據安全風險。 💧 你希望系統運行 100 年以上。 傳統算法問題❌ 生成的ID太長。 ❌ 瞬時并發量不夠。 ❌ 不能解決時間回撥問題。 ❌ 不支持后補生成前序ID。 ❌ 可能依賴外部存儲系統。 新算法特點✔ 整形數字,隨時間單調遞增(不一定連續),長度更短,用50年都不會超過 js Number類型最大值。(默認配置) ✔ 速度更快,是傳統雪花算法的2-5倍,0.1秒可生成50萬個(基于8代低壓i7)。 ✔ 支持時間回撥處理。比如服務器時間回撥1秒,本算法能自動適應生成臨界時間的唯一ID。 ✔ 支持手工插入新ID。當業務需要在歷史時間生成新ID時,用本算法的預留位能生成5000個每秒。 ✔ 不依賴任何外部緩存和數據庫。(k8s環境下自動注冊 WorkerId 的動態庫依賴 redis) ✔ 基礎功能,開箱即用,無需配置文件、數據庫連接等。 性能數據(參數:10位自增序列,1000次漂移最大值)
💍 極致性能:500W/s~3000W/s。(所有測試數據均基于8代低壓i7計算) 如何處理時間回撥🔶 當發生系統時間回撥時,算法采用過去時序的預留序數生成新的ID。 🔶 回撥生成的ID序號,默認靠前,也可以調整為靠后。 🔶 允許時間回撥至本算法預設基數(參數可調)。 💎 ID組成說明
ID示例🟣 本算法生成的 ID ,是整數(占用空間最多8字節),以下是基于默認配置生成的ID: 129053495681099 (運行1年,長度:15) 387750301904971 (運行3年,長度:15) 646093214093387 (運行5年,長度:15) 1292658282840139 (運行10年,長度:16) 9007199254740992 (運行70年,達到 js Number 最大值,長度:16) 165399880288699493 (運行1000年,等同普通雪花算法運行1年,長度:18) 🟣 本算法生成的 ID 值,是 js Number 最大值的 1%-10%,是普通雪花算法值的千分之一,而生成速度卻超過普通雪花算法。 🟣 js Number 類型最大數值:9007199254740992,本算法在保持并發性能(5W+/0.01s)和最大64個 WorkerId(6bit)的同時,能用70年才到 js Number Max 值。 長度估算💍 每增加 1位 WorkerIdBitLength 或 SeqBitLength,生成的ID數字值將會乘以2(基礎長度可參考前一節“ID示例”),反之則除以2。 能用多久能用多久的解釋,是指生成的ID數字,何時能增長到超過 long(有符號64位,8字節)最大值。 🔵 在默認配置下,ID可用 71000 年不重復。 🔵 在支持 1024 個工作節點時,ID可用 4480 年不重復。 🔵 在支持 4096 個工作節點時,ID可用 1120 年不重復。 💎 參數設置❄ WorkerIdBitLength,機器碼位長,決定 WorkerId 的最大值,默認值6,取值范圍 [1, 19],實際上有些語言采用 無符號 ushort (uint16) 類型接收該參數,所以最大值是16,如果是采用 有符號 short (int16),則最大值為15。 ❄ WorkerId,機器碼,最重要參數,無默認值,必須 全局唯一(或相同 DataCenterId 內唯一),必須 程序設定,缺省條件(WorkerIdBitLength取默認值)時最大值63,理論最大值 2^WorkerIdBitLength-1(不同實現語言可能會限定在 65535 或 32767,原理同 WorkerIdBitLength 規則)。不同機器或不同應用實例 不能相同,你可通過應用程序配置該值,也可通過調用外部服務獲取值。針對自動注冊WorkerId需求,本算法提供默認實現:通過 redis 自動注冊 WorkerId 的動態庫,詳見“Tools\AutoRegisterWorkerId”。 特別提示:如果一臺服務器部署多個獨立服務,需要為每個服務指定不同的 WorkerId。 ❄ SeqBitLength,序列數位長,默認值6,取值范圍 [3, 21](建議不小于4),決定每毫秒基礎生成的ID個數。如果每秒請求數不超過5W,保持默認值6即可;如果超過5W,不超過50W,建議賦值10或更大,以此類推。規則要求:WorkerIdBitLength + SeqBitLength 不超過 22。 ❄ MinSeqNumber,最小序列數,默認值5,取值范圍 [5, MaxSeqNumber],每毫秒的前5個序列數對應編號0-4是保留位,其中1-4是時間回撥相應預留位,0是手工新值預留位。 ❄ MaxSeqNumber,最大序列數,設置范圍 [MinSeqNumber, 2^SeqBitLength-1],默認值0,真實最大序列數取最大值(2^SeqBitLength-1),不為0時,取其為真實最大序列數,一般無需設置,除非多機共享WorkerId分段生成ID(此時還要正確設置最小序列數)。 ❄ BaseTime,基礎時間(也稱:基點時間、原點時間、紀元時間),有默認值(2020年),是毫秒時間戳(是整數,.NET是DatetTime類型),作用是:用生成ID時的系統時間與基礎時間的差值(毫秒數)作為生成ID的時間戳。基礎時間一般無需設置,如果覺得默認值太老,你可以重新設置,不過要注意,這個值以后最好不變。 第二版計劃增加參數: ❄ DataCenterId,數據中心ID(機房ID,默認0),請確保全局唯一。 ❄ DataCenterIdBitLength,數據中心ID長度(默認0)。 ❄ TimestampType,時間戳類型(0-毫秒,1-秒),默認0。 常規集成1️⃣ 用單例模式調用。本算法采用單線程生成ID,多方調用會被互斥。在同一應用實例內,調用者使用多線程(或并行)方式調用本算法,不會增加ID產出速度。 2️⃣ 指定唯一的 WorkerId。必須由外部系統確保 WorkerId 的全局唯一性,并賦值給本算法入口參數。 3️⃣ 單機多實例部署時使用不同 WorkerId。并非所有實現都支持跨進程的并發唯一,保險起見,在同一主機上部署多應用實例時,請確保各 WorkerId 唯一。 4️⃣ 異常處理。算法會拋出所有 Exception,外部系統應 catch 異常并做好應對處理,以免引發更大的系統崩潰。 5️⃣ 認真理解 IdGeneratorOptions 的定義,這對集成和使用本算法有幫助。 6️⃣ 使用雪花漂移算法。雖然代碼里包含了傳統雪花算法的定義,并且你可以在入口處指定(Method=2)來啟用傳統算法,但仍建議你使用雪花漂移算法(Method=1,默認的),畢竟它具有更好的伸縮力和更高的性能。 7️⃣ 不要修改核心算法。本算法內部參數較多,邏輯較為復雜,在你尚未掌握核心邏輯時,請勿修改核心代碼且用于生產環境,除非通過大量細致、科學的測試驗證。 8️⃣ 應用域內配置策略相同。當系統運行一段時間后,項目需要從程序指定 WorkerId 轉到自動注冊 WorkerId 時,請確保同一應用域內所有在用實例采用一致的配置策略,這不僅僅針對 WorkerId,也包含其他配置參數。 9️⃣ 管理好服務器時間。雪花算法依賴系統時間,不要手工大幅度回調操作系統時間。如果一定要調整,切記:確保服務再次啟動時的系統時間大于最后一次關閉時的時間。(注:世界級或網絡級的時間同步或回撥,引起的系統時間小幅度變化,對本算法沒影響) 配置變更配置變更是指系統運行一段時間后,再調整運行參數(IdGeneratorOptions 對象屬性),請注意: 🔴 1.首要原則是:BaseTime 只能更舊(距現在更遠),讓生成的ID值較歷史最大值更大,確保沒有時間重疊區,不產生重復ID。[不推薦 在系統運行之后調整 BaseTime] 🔴 2.任何時候增加 WorkerIdBitLength 或 SeqBitLength,都是允許的,但應慎用 “減小”操作,因為這可能導致在未來某天生成的 ID 與舊配置時相同。[允許在系統運行之后 增加 任何一個 xxxBitLength 值] 🔴 3.如果必須減小 WorkerIdBitLength 或 SeqBitLength 其中的一項,一定要滿足條件:新的兩個 xxxBitLength 之和要大于舊值之和。[不推薦 在運行之后縮小任何一個 BitLength 值] 🔴 4.上述3條規則,并未在本算法內做邏輯控制,使用者應在確認新配置符合要求后,再實施配置變更。 自動注冊WorkerId🔍 唯一ID生成器,依賴WorkerId,當業務服務需要水平無差別復制(自動擴容)時,這就要求能自動注冊全局唯一WorkerId,然后才能生產唯一ID。 🔍 本算法提供開源動態庫(go語言實現),能在容器 k8s 等容器環境下,通過 redis 自動注冊 WorkerId。 🔍 通過redis注冊WorkerId,并非唯一方法。你還可以開發中心化的配置服務,各端點服務啟動時,通過中心服務獲取唯一 WorkerId。 🔍 當然,如果你的服務無需自動擴容,那就不必自動注冊WorkerId,而是為它們分別設置全局唯一值。 🔍 方法還有很多,例如:開發中心化的ID生成服務,由它為各端點服務(單個或批量)生成可用ID。 自動注冊流程圖圖片鏈接:https://github.com/yitter/IdGenerator/blob/master/Tools/AutoRegisterWorkerId/regprocess.jpg 源碼路徑:/Go/source/regworkerid/reghelper.go 動態庫下載下載鏈接:https://github.com/yitter/IdGenerator/releases/download/v1.3.3/workeridgo_lib_v1.3.3.zip 動態庫接口定義// 注冊一個 WorkerId,會先注銷所有本機已注冊的記錄 // address: Redis連接地址,單機模式示例:127.0.0.1:6379,哨兵/集群模式示例:127.0.0.1:26380,127.0.0.1:26381,127.0.0.1:26382 // password: Redis連接密碼 // db: Redis指定存儲庫,示例:1 // sentinelMasterName: Redis 哨兵模式下的服務名稱,示例:mymaster,非哨兵模式傳入空字符串即可 // minWorkerId: WorkerId 最小值,示例:30 // maxWorkerId: WorkerId 最大值,示例:63 // lifeTimeSeconds: WorkerId緩存時長(秒,3的倍數),推薦值15 extern GoInt32 RegisterOne(char* server, char* password, GoInt32 db, char* sentinelMasterName, GoInt32 minWorkerId, GoInt32 maxWorkerId, GoInt32 lifeTimeSeconds); // 注銷本機已注冊的 WorkerId extern void UnRegister(); 已實現的語言
技術支持開源地址:https://github.com/yitter/IdGenerator QQ群:646049993 該文章在 2023/9/27 14:39:05 編輯過
|
關鍵字查詢
相關文章
正在查詢... |