主頁 > 知識庫 > 簡單談?wù)凪ysql索引與redis跳表

簡單談?wù)凪ysql索引與redis跳表

熱門標(biāo)簽:百度地圖標(biāo)注要什么軟件 天津公司外呼系統(tǒng)軟件 中國地圖標(biāo)注公司 400電話申請廠家現(xiàn)貨 電話機器人的價格多少錢一個月 徐涇鎮(zhèn)騰訊地圖標(biāo)注 福建外呼電銷機器人加盟 昌德訊外呼系統(tǒng) 自己做地圖標(biāo)注需要些什么

摘要

面試時,交流有關(guān)mysql索引問題時,發(fā)現(xiàn)有些人能夠濤濤不絕的說出B+樹和B樹,平衡二叉樹的區(qū)別,卻說不出B+樹和hash索引的區(qū)別。這種一看就知道是死記硬背,沒有理解索引的本質(zhì)。本文旨在剖析這背后的原理,歡迎留言探討

問題

如果對以下問題感到困惑或一知半解,請繼續(xù)看下去,相信本文一定會對你有幫助

  • mysql 索引如何實現(xiàn)
  • mysql 索引結(jié)構(gòu)B+樹與hash有何區(qū)別。分別適用于什么場景
  • 數(shù)據(jù)庫的索引還能有其他實現(xiàn)嗎
  • redis跳表是如何實現(xiàn)的
  • 跳表和B+樹,LSM樹有和區(qū)別呢

解析

首先為什么要把mysql索引和redis跳表放在一起討論呢,因為他們解決的都是同一種問題,用于解決數(shù)據(jù)集合的查找問題,即根據(jù)指定的key,快速查到它所在的位置(或者對應(yīng)的value)

當(dāng)你站在這個角度去思考問題時,還會不知道B+樹索引和hash索引的區(qū)別嗎

數(shù)據(jù)集合的查找問題

現(xiàn)在我們將問題領(lǐng)域邊界劃分清楚了,就是為了解決數(shù)據(jù)集合的查找問題。這一塊需要考慮哪些問題呢

  1. 需要支持哪些查找方式,單key/多key/范圍查找,
  2. 插入/刪除效率
  3. 查找效率(即時間復(fù)雜度)
  4. 存儲大?。臻g復(fù)雜度)

我們看下幾種常用的查找結(jié)構(gòu)

hash

hash是key,value形式,通過一個散列函數(shù),能夠根據(jù)key快速找到value

B+樹

B+樹是在平衡二叉樹基礎(chǔ)上演變過來,為什么我們在算法課上沒學(xué)到B+樹和跳表這種結(jié)構(gòu)呢。因為他們都是從工程實踐中得到,在理論的基礎(chǔ)上進行了妥協(xié)。

B+樹首先是有序結(jié)構(gòu),為了不至于樹的高度太高,影響查找效率,在葉子節(jié)點上存儲的不是單個數(shù)據(jù),而是一頁數(shù)據(jù),提高了查找效率,而為了更好的支持范圍查詢,B+樹在葉子節(jié)點冗余了非葉子節(jié)點數(shù)據(jù),為了支持翻頁,葉子節(jié)點之間通過指針連接。

跳表

跳表是在鏈表的基礎(chǔ)上進行擴展的,為的是實現(xiàn)redis的sorted set數(shù)據(jù)結(jié)構(gòu)。 level0: 是存儲原始數(shù)據(jù)的,是一個有序鏈表,每個節(jié)點都在鏈上 level0+: 通過指針串聯(lián)起節(jié)點,是原始數(shù)據(jù)的一個子集,level等級越高,串聯(lián)的數(shù)據(jù)越少,這樣可以顯著提高查找效率,

總結(jié)

數(shù)據(jù)結(jié)構(gòu) 實現(xiàn)原理 key查詢方式 查找效率 存儲大小 插入、刪除效率
Hash 哈希表 支持單key 接近O(1) 小,除了數(shù)據(jù)沒有額外的存儲 O(1)
B+樹 平衡二叉樹擴展而來 單key,范圍,分頁 O(Log(n) 除了數(shù)據(jù),還多了左右指針,以及葉子節(jié)點指針 O(Log(n),需要調(diào)整樹的結(jié)構(gòu),算法比較復(fù)雜
跳表 有序鏈表擴展而來 單key,分頁 O(Log(n) 除了數(shù)據(jù),還多了指針,但是每個節(jié)點的指針小于2,所以比B+樹占用空間小 O(Log(n),只用處理鏈表,算法比較簡單

對LSM結(jié)構(gòu)感興趣的可以看下cassandra vs mongo (1)存儲引擎

cassandra vs mongo (1)存儲引擎

概括

存儲引擎:

B-Tree

緩存管理

緩存管理的核心在于置換算法,置換算法常見的有FIFO(First In First Out),LRU(Least Recently Used)。關(guān)系型數(shù)據(jù)庫在LRU的基礎(chǔ)上,進行了改進,主要使用LIRS(Low Inter-reference Recency Set)
將緩存分為兩級,第一次采用LRU,最近被使用到的數(shù)據(jù)會進第一級,如果數(shù)據(jù)在較短時間內(nèi)被訪問了兩次或以上,則成為熱點數(shù)據(jù),進入第二級。避免了進行全表掃描的時候,可能會將緩存中的大量熱點數(shù)據(jù)替換掉。

LSM

Log-Structured Merge Tree:結(jié)構(gòu)化合并樹,核心思想就是不將數(shù)據(jù)立即從內(nèi)存中寫入到磁盤,而是先保存在內(nèi)存中,積累了一定量后再刷到磁盤中

LSM VS B-Tree

LSM在B-Tree的基礎(chǔ)上為了獲取更好的寫性能而犧牲了部分的讀性能,同時利用其它的實現(xiàn)來彌補讀性能,比如boom-filter.

1.寫

B樹的寫入,是首先找到對應(yīng)的塊位置,然后將新數(shù)據(jù)插入。隨著寫入越來越多,為了維護B樹結(jié)構(gòu),節(jié)點得分裂。這樣插入數(shù)據(jù)的隨機寫概率就會增大,性能會減弱。

LSM 則是在內(nèi)存中形成小的排好序的樹,然后flush到磁盤的時候不斷的做merge.因為寫入都是內(nèi)存寫,不寫磁盤,所以寫會很高效。

2.讀

B樹從根節(jié)點開始二分查詢直到葉子節(jié)點,每次讀取一個節(jié)點,如果對應(yīng)的頁面不在內(nèi)存中,則讀取磁盤,緩存數(shù)據(jù)。

LSM樹整個結(jié)構(gòu)不是有序的,所以不知道數(shù)據(jù)在什么地方,需要從每個小的有序結(jié)構(gòu)中做二分查詢,找到了就返回,找不到就繼續(xù)找下一個有序結(jié)構(gòu)。所以說LSM犧牲了讀性能。但是LSM之所以能夠作為大規(guī)模數(shù)據(jù)存儲系統(tǒng)在于讀性能可以通過其他方式來提高,比如讀取性能更多的依賴于內(nèi)存/緩存命中率而不是磁盤讀取。

Cassandra

Cassandra是一個寫性能優(yōu)于讀性能的NoSql數(shù)據(jù)庫,寫性能好一個原因在于選擇了LSM存儲引擎。

Mongo

MMAPv1

Mongo 3.2以前默認使用MMAPv1存儲引擎,是基于B-Tree類型的。

邊界(padding)

MMAPv1 存儲引擎使用一個叫做”記錄分配”的過程來為document存儲分配磁盤空間。MongoDB與Cassandra不同的是,需要去更新原有的document。如果原有的document空間不足,則需要將這個document移動到新的位置,更新對應(yīng)的index。這樣就會導(dǎo)致一些不必要的更新,和數(shù)據(jù)碎片。

為了避免出現(xiàn)上述情況,就有了邊界的概念,就是為document預(yù)分配空間。但是這樣就有可能造成資源的浪費。mongo 按照64M,128M,256M…2G的2的冥次方遞增策略預(yù)分配,最大2G。在數(shù)據(jù)量小的情況下問題并不明顯,但是當(dāng)達到2G時,磁盤占用量大的問題就出來了。

同樣這一點和關(guān)系型數(shù)據(jù)庫也不一樣,關(guān)系型數(shù)據(jù)庫對于長記錄數(shù)據(jù)會分開存儲。


MMAPv1使用collection級別的鎖,即一個collecion增,刪,改一次只能有一個。在并發(fā)操作時,就會造成等待。

WiredTiger

3.2及其以后的默認存儲引擎,同樣是基于B-Tree的。采用了lock-free,風(fēng)險指針等并發(fā)技術(shù),使得在多核機器上工作的更好。

鎖級別為document。并且引入了compression,減少了磁盤占用。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • 新手學(xué)習(xí)MySQL索引
  • 由不同的索引更新解決MySQL死鎖套路
  • 通過唯一索引S鎖與X鎖來了解MySQL死鎖套路
  • 分享幾道關(guān)于MySQL索引的重點面試題
  • Mysql中的索引精講
  • MySQL學(xué)習(xí)(七):Innodb存儲引擎索引的實現(xiàn)原理詳解
  • 使用shell腳本來給mysql加索引的方法
  • MySQL批量插入和唯一索引問題的解決方法
  • 高效利用mysql索引指南

標(biāo)簽:黔西 梅河口 駐馬店 北京 昌都 鄂爾多斯 荊門 陜西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《簡單談?wù)凪ysql索引與redis跳表》,本文關(guān)鍵詞  簡單,談?wù)?Mysql,索引,與,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《簡單談?wù)凪ysql索引與redis跳表》相關(guān)的同類信息!
  • 本頁收集關(guān)于簡單談?wù)凪ysql索引與redis跳表的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章