位置 | 大小 | 作用 |
---|---|---|
0~11bit | 12bits | 序列號(hào),用來對(duì)同一個(gè)毫秒之內(nèi)產(chǎn)生不同的ID,可記錄4095個(gè) |
12~21bit | 10bits | 10bit用來記錄機(jī)器ID,總共可以記錄1024臺(tái)機(jī)器 |
22~62bit | 41bits | 用來記錄時(shí)間戳,這里可以記錄69年 |
63bit | 1bit | 符號(hào)位,不做處理 |
上面只是一個(gè)將 64bit 劃分的通用標(biāo)準(zhǔn),一般的情況可以根據(jù)自己的業(yè)務(wù)情況進(jìn)行調(diào)整。例如目前業(yè)務(wù)只有機(jī)器10臺(tái)左右預(yù)計(jì)未來會(huì)增加到三位數(shù),并且需要進(jìn)行多機(jī)房部署,QPS 幾年之內(nèi)會(huì)發(fā)展到百萬。
那么對(duì)于百萬 QPS 平分到 10 臺(tái)機(jī)器上就是每臺(tái)機(jī)器承擔(dān)十萬級(jí)的請(qǐng)求即可,12 bit 的序列號(hào)完全夠用。對(duì)于未來會(huì)增加到三位數(shù)機(jī)器,并且需要多機(jī)房部署的需求我們僅需要將 10 bits 的 work id 進(jìn)行拆分,分割 3 bits 來代表機(jī)房數(shù)共代表可以部署8個(gè)機(jī)房,其他 7bits 代表機(jī)器數(shù)代表每個(gè)機(jī)房可以部署128臺(tái)機(jī)器。那么數(shù)據(jù)格式就會(huì)如下所示:
其實(shí)看懂了上面的數(shù)據(jù)結(jié)構(gòu)之后,需要自己實(shí)現(xiàn)一個(gè)雪花算法是非常簡(jiǎn)單,步驟大致如下:
首先我們需要定義一個(gè) Snowflake 結(jié)構(gòu)體:
type Snowflake struct { sync.Mutex // 鎖 timestamp int64 // 時(shí)間戳 ,毫秒 workerid int64 // 工作節(jié)點(diǎn) datacenterid int64 // 數(shù)據(jù)中心機(jī)房id sequence int64 // 序列號(hào) }
然后我們需要定義一些常量,方便我們?cè)谑褂醚┗ㄋ惴ǖ臅r(shí)候進(jìn)行位運(yùn)算取值:
const ( epoch = int64(1577808000000) // 設(shè)置起始時(shí)間(時(shí)間戳/毫秒):2020-01-01 00:00:00,有效期69年 timestampBits = uint(41) // 時(shí)間戳占用位數(shù) datacenteridBits = uint(2) // 數(shù)據(jù)中心id所占位數(shù) workeridBits = uint(7) // 機(jī)器id所占位數(shù) sequenceBits = uint(12) // 序列所占的位數(shù) timestampMax = int64(-1 ^ (-1 timestampBits)) // 時(shí)間戳最大值 datacenteridMax = int64(-1 ^ (-1 datacenteridBits)) // 支持的最大數(shù)據(jù)中心id數(shù)量 workeridMax = int64(-1 ^ (-1 workeridBits)) // 支持的最大機(jī)器id數(shù)量 sequenceMask = int64(-1 ^ (-1 sequenceBits)) // 支持的最大序列id數(shù)量 workeridShift = sequenceBits // 機(jī)器id左移位數(shù) datacenteridShift = sequenceBits + workeridBits // 數(shù)據(jù)中心id左移位數(shù) timestampShift = sequenceBits + workeridBits + datacenteridBits // 時(shí)間戳左移位數(shù) )
需要注意的是由于 -1 在二進(jìn)制上表示是:
11111111 11111111 11111111 11111111 11111111 11111111 11111111 11111111
所以想要求得 41bits 的 timestamp 最大值可以將 -1 向左位移 41 位,得到:
11111111 11111111 11111110 00000000 00000000 00000000 00000000 00000000
那么再和 -1 進(jìn)行 ^異或運(yùn)算:
00000000 00000000 00000001 11111111 11111111 11111111 11111111 11111111
這就可以表示 41bits 的 timestamp 最大值。datacenteridMax、workeridMax也同理。
接著我們就可以設(shè)置一個(gè) NextVal 函數(shù)來獲取 Snowflake 返回的 ID 了:
func (s *Snowflake) NextVal() int64 { s.Lock() now := time.Now().UnixNano() / 1000000 // 轉(zhuǎn)毫秒 if s.timestamp == now { // 當(dāng)同一時(shí)間戳(精度:毫秒)下多次生成id會(huì)增加序列號(hào) s.sequence = (s.sequence + 1) sequenceMask if s.sequence == 0 { // 如果當(dāng)前序列超出12bit長度,則需要等待下一毫秒 // 下一毫秒將使用sequence:0 for now = s.timestamp { now = time.Now().UnixNano() / 1000000 } } } else { // 不同時(shí)間戳(精度:毫秒)下直接使用序列號(hào):0 s.sequence = 0 } t := now - epoch if t > timestampMax { s.Unlock() glog.Errorf("epoch must be between 0 and %d", timestampMax-1) return 0 } s.timestamp = now r := int64((t)timestampShift | (s.datacenterid datacenteridShift) | (s.workerid workeridShift) | (s.sequence)) s.Unlock() return r }
上面的代碼也是非常的簡(jiǎn)單,看看注釋應(yīng)該也能懂,我這里說說最后返回的 r 系列的位運(yùn)算表示什么意思。
首先 t 表示的是現(xiàn)在距離 epoch 的時(shí)間差,我們 epoch 在初始化的時(shí)候設(shè)置的是2020-01-01 00:00:00,那么對(duì)于 41bit 的 timestamp 來說會(huì)在 69 年之后才溢出。對(duì) t 進(jìn)行向左位移之后,低于 timestampShift 位置上全是0 ,由 datacenterid、workerid、sequence 進(jìn)行取或填充。
在當(dāng)前的例子中,如果當(dāng)前時(shí)間是2021/01/01 00:00:00,那么位運(yùn)算結(jié)果如下圖所示:
到此這篇關(guān)于Go語言實(shí)現(xiàn)Snowflake雪花算法的文章就介紹到這了,更多相關(guān)Go語言雪花算法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:武漢 嘉峪關(guān) 延邊 江西 宜賓 張掖 新余 黑龍江
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Go語言實(shí)現(xiàn)Snowflake雪花算法》,本文關(guān)鍵詞 語言,實(shí)現(xiàn),Snowflake,雪花,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。