主頁 > 知識庫 > MySQL Threads_running飆升與慢查詢的相關(guān)問題解決

MySQL Threads_running飆升與慢查詢的相關(guān)問題解決

熱門標簽:400電話辦理服務(wù)價格最實惠 呂梁外呼系統(tǒng) 大豐地圖標注app 催天下外呼系統(tǒng) html地圖標注并導(dǎo)航 武漢電銷機器人電話 400電話變更申請 南太平洋地圖標注 北京金倫外呼系統(tǒng)

背景

年前本應(yīng)該是回顧一年工作和收尾的階段,奈何各種促銷,活動都等著春節(jié),因此也遇到了不少的問題,回顧了一下最近遇到的問題,發(fā)現(xiàn)有好幾個問題比較類似,正好整理一下,作為年前收尾的案例吧。表現(xiàn)上都是數(shù)據(jù)庫假死,無響應(yīng),發(fā)生的場景有較高的業(yè)務(wù)壓力到來時,也有業(yè)務(wù)正常運行的時候,突然就出現(xiàn)問題了。

問題描述

由于騰訊云數(shù)據(jù)庫 MySQL 本身是有故障檢測和高可用機制的,這幾例問題發(fā)生的時候,從用戶反饋的問題出現(xiàn)的時間點到實際介入排查的時候已經(jīng)有好幾分鐘了,但是并沒有觸發(fā)高可用切換,說明這個問題可能并不是數(shù)據(jù)庫自身的故障,也不是一些外部原因?qū)е聰?shù)據(jù)庫不可用。

檢查一下數(shù)據(jù)庫當時候的狀態(tài),發(fā)現(xiàn)一個很不正常的指標:

在問題的時間點附近,連接數(shù)的總數(shù)量和 threads_running 的數(shù)量在短時間內(nèi)開始飆升,并且接近半分鐘的時間內(nèi),連監(jiān)控插件都采集不到數(shù)據(jù)了。在相同的時間段內(nèi),CPU 的使用率(達到 100%)、慢查詢數(shù)量也跟著飆升。基本上可以確認 CPU 使用率,慢查詢,連接數(shù)的指標這三者應(yīng)該是相關(guān)聯(lián)的,可以從這三者入手來分析這次問題的起因。

原因分析

99%的情況下,只要慢查詢數(shù)量在飆升,那么這個問題就和慢查詢脫不了關(guān)系,但是案例分析并不能這么草率的下結(jié)論。言歸正傳,既然目標縮小在三個指標上,那么分別考慮一下這三個指標的意義,看看這幾個指標的異常會帶來什么問題。

CPU

CPU 過高說明 MySQL 的計算能力被占滿了,能占用 MySQL 計算資源的只有用戶線程和 MySQL 自身的系統(tǒng)線程,這次問題明顯和 MySQL 系統(tǒng)線程沒什么關(guān)系,說明用戶線程在大量占用 CPU 的計算資源,而且使用率達到 100% 說明有這個資源爭搶的程度是非常嚴重的,可能會導(dǎo)致原本效率極高的查詢因為拿不到 CPU 資源而變得非常緩慢,從高效率的查詢變成低效的慢查詢,從而產(chǎn)生數(shù)據(jù)庫假死或者 hang 死的現(xiàn)象。

慢查詢

慢查詢是個老生常談的問題了,因為查詢效率過低,會過度占用 CPU,IO,內(nèi)存等資源,從而影響到其他正常的查詢,從監(jiān)控指標上來說,CPU 使用率,IO 使用情況,內(nèi)存使用率都可能會有不同程度的上升,嚴重的情況下也會引發(fā)這幾個指標的飆升,導(dǎo)致整個數(shù)據(jù)庫響應(yīng)緩慢。

連接數(shù)

連接數(shù)通常是一個引發(fā)“實際故障”的指標,例如連接數(shù)達到 max_connections 的上限,從而導(dǎo)致整個數(shù)據(jù)庫無法新建連接,程序側(cè)直接是報錯的,而不是無響應(yīng)。threads_running 這個指標,參考官方文檔的描述:

The number of threads that are not sleeping.

簡單直白的解釋,這個指標的飆升代表當時候有大量活躍的用戶連接在 MySQL 實例中。而且從這個案例的監(jiān)控圖表來看,是一個飆升的趨勢,說明是在短時間內(nèi)出現(xiàn)了大量的活躍連接。

分析

完成這三個指標的簡單分析,可以發(fā)現(xiàn)這個三個指標是互相影響:

  1. 慢查詢堆積會導(dǎo)致 CPU 使用率過高;
  2. CPU 過高會導(dǎo)致整體的查詢效率變低,進而導(dǎo)致一些高效的查詢變成慢查詢;
  3. 慢查詢的執(zhí)行效率過低,會較長時間的保持活躍狀態(tài),所以 Threads_running 這個指標一定會上漲。
  4. 過高的并發(fā)突然到來時,大量的查詢處于活躍狀態(tài)會讓 Threads_running 這個指標飆升,同時這種尖刺型的高峰也很容易占滿 CPU。

看起來三個指標飆升的原因是自洽的,只靠這三個指標并不能真正的判斷出問題的原因。那么仔細考慮一下這幾個指標飆升的原因為什么會自洽?會發(fā)現(xiàn)有一個核心現(xiàn)象,或者說是共性:查詢要能夠堆積起來。如果:

  1. 堆積起來的查詢本來效率就不高,那么這個問題的誘因基本就是慢查詢了。
  2. 堆積起來的查詢效率很高,那么這個問題的誘因可能是瞬間并發(fā)過高,或者是其他的原因?qū)е?CPU 使用率暴漲,然后反過來影響了這些效率很高的查詢。

所以檢查一下堆積起來的查詢,就能比較直白的分辨出問題了,就上圖展示的這個案例而言,堆積起來的查詢大量使用了 group by 和 order by,查詢的效率比較低,所以根因還是慢查詢。

拓展一下

如開篇所提及,最近發(fā)生的問題有多起,且原因類似。除了這個飆升的案例,還有如下所示的現(xiàn)象。

threads_running 保持在一個相對平穩(wěn)的數(shù)值,參考前文的分析,可以發(fā)現(xiàn)這個現(xiàn)象代表著在平時的時候,就有約 10 個查詢長時間處于活躍狀態(tài),可以預(yù)測一個故障場景:業(yè)務(wù)量繼續(xù)上升,活躍的查詢變多,當高效的查詢受影響,效率降低到一定程度的時候,前端程序/用戶會因為超時或者響應(yīng)慢的原因,發(fā)起重試,然后因為查詢效率降低,這個重試被反復(fù)觸發(fā),然后引發(fā)雪崩效應(yīng),慢慢拖垮數(shù)據(jù)庫。

萬幸的是多個類似現(xiàn)象的實例僅有一個出現(xiàn)了問題,就是預(yù)測的這個場景,其他的都及時優(yōu)化掉了。

總結(jié)一下

雖說仍舊是慢查詢的問題,但是從這個案例可以發(fā)現(xiàn)另外一個 MySQL 指標,threads_running 的用處:監(jiān)控活躍的連接,提前發(fā)現(xiàn)一些并發(fā)量過高和異常的查詢,防止數(shù)據(jù)庫堆積查詢,產(chǎn)生假死的現(xiàn)象。

以上就是MySQL Threads_running飆升與慢查詢的問題解決的詳細內(nèi)容,更多關(guān)于MySQL Threads_running飆升與慢查詢的資料請關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • MySQL慢查詢的坑
  • MYSQL慢查詢和日志實例講解
  • MySQL慢查詢?nèi)罩镜淖饔煤烷_啟
  • MYSQL慢查詢與日志的設(shè)置與測試
  • MySQL 慢查詢?nèi)罩镜拈_啟與配置
  • 實例講解MySQL 慢查詢
  • Mysql sql慢查詢監(jiān)控腳本代碼實例
  • MySQL慢查詢?nèi)绾味ㄎ辉斀?/li>
  • MySQL開啟慢查詢方法及實例
  • MySQL5.7慢查詢?nèi)罩緯r間與系統(tǒng)時間差8小時原因詳解
  • Mysql慢查詢優(yōu)化方法及優(yōu)化原則
  • 通過MySQL慢查詢優(yōu)化MySQL性能的方法講解

標簽:麗水 西寧 徐州 龍巖 迪慶 無錫 自貢 南充

巨人網(wǎng)絡(luò)通訊聲明:本文標題《MySQL Threads_running飆升與慢查詢的相關(guān)問題解決》,本文關(guān)鍵詞  MySQL,Threads,running,飆升,與,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《MySQL Threads_running飆升與慢查詢的相關(guān)問題解決》相關(guān)的同類信息!
  • 本頁收集關(guān)于MySQL Threads_running飆升與慢查詢的相關(guān)問題解決的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章