《Mysql必讀MySQL多線程復制遇到Error_code: 1872的解決方案》要點:
本文介紹了Mysql必讀MySQL多線程復制遇到Error_code: 1872的解決方案,希望對您有用。如果有疑問,可以聯系我們。
上周在生產環境上遇到一個問題,不敢獨享,拿出來給小伙伴們做個簡單的分享.MYSQL實例
起因 :由于IDC機房斷電(估計又是哪里被挖掘機碰了下吧),導致所有服務器重啟,影響到了其中的MySQL數據庫.來看下這時數據庫遇到的問題:MYSQL實例
數據庫版本 :MySQL 5.7.10MYSQL實例
問題表現MYSQL實例
:從機復制報如下錯誤:Slave SQL for channel ”: Slave failed to initialize relay log info structure from the repository, Error_code: 1872
MYSQL實例
用了Inside君的MySQL標準配置文件模板,怎么沒有實現crash safe呢?其實,這主要是因為多線程復制(MTS)所引起.不知MySQL 5.7,即使MySQL 5.6也同樣會遇到問題.MYSQL實例
在MTS場景下,可能會出現以下兩個問題:MYSQL實例
gap事務:后執行的事務先回放(apply)了
Exec_Master_Log_Pos位置不準確:可能存在已經事務已經提交,但是位置還沒更新(單線程復制不存在此問題)
gap事務比較好理解,因為不論是基于database級別的MTS,還是基于logical_clock的MTS,都可能存在下面的這種場景:MYSQL實例
MYSQL實例
由于MTS的原因,后面的事務可能比前面的事務早執行,如上圖終可能事務tx2和tx4都已經提交了,但是事務tx1和tx3還未提交.這時就稱為存在gap事務.在基于logical_clock的MTS場景下,用戶可以通過配置 參數slave_preserve_commit_order=1
來保證提交的順序性.MYSQL實例
另一方面,這時Exec_Master_Log_Pos也是不準確的,當發生crash時,master info中依然記錄的是tx1事務開始執行的位置(見上圖右邊的部分).切記,即使將參數slave_preserve_commit_order設置為1,MTS場景下依然不能保證Exec_Master_Log_Pos是準確的,其稱之為 gap-free low-watermark .因為MTS場景下對于表slave_realy_info_log的更新并不是事務的(這個需要好好體會下).MYSQL實例
然而,MTS場景下引入了新的事務表slave_worker_info,用以表示發生宕機時每個線程更新到的位置,其與Worker線程的回放是事務的.因此,MySQL在恢復的時候可以通過通過Exec_Master_Log_Pos與表slave_worker_info的列Master_log_pos做對比,判斷是否需要回放當前事務.MYSQL實例
在MySQL 5.7.13版本之前,當發生宕機后需要手動執行如下操作,若直接執行CHANGE MASTER TO操作,則可能會觸發上述1872錯誤:MYSQL實例
START SLAVE UNTIL SQL_AFTER_MTS_GAPS; START SLAVE SQL_THREAD;
由于服務器上的MySQL版本為5.7.10,而DBA試圖通過命令CHANGE MASTER TO來修復復制問題,因此導致了上述問題.而在MySQL 5.7.13版本后,上述問題將有MySQL自動修復.簡單來說,即使發生了宕機,也能準確并自動地恢復復制的運行狀態.MYSQL實例
不過,當Inside升級到MySQL 5.7.15過程時,又遇到了一個不大不小的坑,這個就留著等下回分享吧.MYSQL實例
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/2269.html