《MySQL備份、安全、SQL規(guī)范與系統(tǒng)規(guī)劃》要點:
本文介紹了MySQL備份、安全、SQL規(guī)范與系統(tǒng)規(guī)劃,希望對您有用。如果有疑問,可以聯(lián)系我們。
講師介紹
韓成亮
資深DBA
擁有7年DBA實戰(zhàn)經(jīng)驗.目前從事MySQL相關(guān)運維及架構(gòu)工作,擅長MySQL及Oracle設(shè)計和調(diào)優(yōu).
主題簡介:
1、MySQL之備份
2、MySQL之安全
3、MySQL之SQL規(guī)范
4、MySQL之系統(tǒng)規(guī)劃
之所以開頭就提這個,主要原因是最近的事故略多,刪主機、刪庫、刪表、刪字段還有勒索病毒等,太多的不可控因素了,從“刪XX到跑路”你缺少的只是一個“機會”.本來是你好、我好、大家好,但是萬一呢?所以要未雨綢繆,當(dāng)然備份的意義不僅僅在于此.
一般而言我們同一份文件需要存放多個位置,三份是個不錯的選擇.常規(guī)的做法是本地一份,其它地方兩份,具體的可以根據(jù)實際條件酌情處理,通常一份的效驗很難有說服力,而且也并不可靠,一定要確保多份副本,從技術(shù)的角度而言,奇數(shù)是常用的仲裁配置,而三是最小的單位.
接下來就是需要經(jīng)常驗證,我這邊說的是經(jīng)常,日常不是很現(xiàn)實,如果資源足夠,那就完全可以實施了,這樣可以做到心里有底,避免真正在生產(chǎn)執(zhí)行恢復(fù)的時候手忙腳亂,而且主要是可以通過預(yù)先準(zhǔn)備的腳本或者命令,快速恢復(fù).之所以一定要通過實踐去檢驗,因為通過實際的行為去排雷、排坑、排問題,盡可能地摸清楚將來可能會遇到的可能性
問題.雖然可能性為零,不過平時多演練,這樣在真正需要的時候才能少掉坑里去.
如果說因為各方面的原因你沒法去驗證,只能通過系統(tǒng)自帶的驗證或者采取其他的諸如文件效驗的方式,這樣回到之前說的多副本情況,如果你擁有多分副本,起碼驗證起來還是比較簡單的,但是也并不是說多份副本就一定是有效的,還有時效性等問題.
這是建立在前面?zhèn)浞菘苫謴?fù)性基礎(chǔ)上,首先你的備份是可以支持恢復(fù)的,這個接下來需要關(guān)注備份的有效性,恢復(fù)的效率性.這里面會涉及到RPO、RTO,兩者是相互耦合的,RTO要求你越少的時間,RPO要求你恢復(fù)到最近時間點的數(shù)據(jù),無論哪個方面,有效的解決方案都是更新的備份,更快的恢復(fù)效率,最好乃至于瞬間恢復(fù)到上一個事務(wù),當(dāng)前事務(wù).不同的業(yè)務(wù)級別,需要不同的級別,當(dāng)然災(zāi)備另說.
時效性,說實話是屬于比較難界定的.那具體需要恢復(fù)到什么時間節(jié)點的數(shù)據(jù)呢?根據(jù)相應(yīng)的RPO級別,需要指定相應(yīng)的計劃,而且這其中還需要考慮RTO,如何縮短時間.如果說真的發(fā)生了需要從備份恢復(fù)的場景,首先需要確定你的數(shù)據(jù)庫擁有完整的備份,但是往往這個時候可能沒有最新的,要么就是最近的備份是不成功或者失敗,不要覺得我在危言聳聽.
事實往往比這個更復(fù)雜、更加嚴(yán)重,如果幸運的是,你不僅僅擁有多份可靠的而且是最新的備份,還有完美得是到宕機前一刻的增量或者日志,接下來就是跟時間賽跑,穩(wěn)穩(wěn)地減少宕機時間.
安全性放在最后,并不是說不重要,相反,主要高度依賴以上兩點,如果脫離了,就片面而言,沒有備份,那就是安全的,這是在沒有的情況下,不存在其它的情況.
然后就輪到有備份了,當(dāng)你有了備份,你不僅僅需要保證備份的多副本,還要保證其安全性,這里面的安全性包括內(nèi)部安全,外部安全.很多時候外部反而是安全的,一個有效的備份經(jīng)歷加密、訪問控制,別人無論是獲取還是解密都需要花費大量時間的,而內(nèi)部往往更容易出問題,千里之堤,毀于蟻穴.
提一下泄密,這個還是比較尷尬的,不論等級劃分,籠統(tǒng)來講,被權(quán)限以外的人接觸都算,那具體怎么界定,而且權(quán)限也是比較難劃分的,所以該有的預(yù)防措施必須要有.
安全無小事,相應(yīng)的規(guī)定章程制定下來就需要嚴(yán)格的執(zhí)行,剩下的這就需要看從業(yè)者的職業(yè)操守.
PS:如果需要了解備份恢復(fù)可以關(guān)注下社群文章《解鎖MySQL備份恢復(fù)的4種正確姿勢》,相信可以幫到你.
以上是5.6版本,5.7有所加強但也僅此而已,看看你的環(huán)境是否存在上述問題,這個算是最基本的安全吧.
常見創(chuàng)建用戶時你需要指定你的IP訪問地址范圍或者固定IP,一般而言,只有特定唯一的幾個IP才會訪問,或者說你可以采用代理訪問的方式,減少應(yīng)用直接訪問你的數(shù)據(jù)庫,而且現(xiàn)在很多中間件也都有白名單機制,原則上是把非法請求防止在數(shù)據(jù)庫以外的地方.
規(guī)范數(shù)據(jù)庫管理軟件,實現(xiàn)管理軟件的標(biāo)準(zhǔn)、統(tǒng)一化,還有嚴(yán)禁杜絕開啟外網(wǎng)訪問,如果客戶端在遠(yuǎn)程,就根本不應(yīng)該直接訪問數(shù)據(jù)庫,而應(yīng)該使用中間件堡壘機或其它替代方案.
為了防止連入數(shù)據(jù)庫的應(yīng)用程序存在后門,造成數(shù)據(jù)庫安全隱患,檢查所有連接數(shù)據(jù)庫程序的安全性.通過使用堡壘機或者其它監(jiān)控登錄數(shù)據(jù)庫,禁止對數(shù)據(jù)庫的直接操作.
對已經(jīng)連接的IP網(wǎng)段進(jìn)行規(guī)范化、統(tǒng)一化的管理,定期進(jìn)行權(quán)限復(fù)核操作,對系統(tǒng)所屬IP、用戶進(jìn)行權(quán)限梳理工作.
對員工進(jìn)行安全培訓(xùn),增強員工的系統(tǒng)安全觀念,做到細(xì)心操作,安全操作.確保訪問數(shù)據(jù)庫的主機為已知用戶或者主機,使用專門主機與數(shù)據(jù)庫進(jìn)行連接.
對重要業(yè)務(wù)表的所有行為全部審計,審計同時所有包括即使是DBA的DDL操作行為.
權(quán)限這塊無可厚非,在建立之初遵循最小權(quán)限原則,堅持最小權(quán)限原則,是數(shù)據(jù)庫安全的重要步驟.
以上說的是白話,下面說說正題.
很多時候我們不知道具體的最小權(quán)限是什么,你說一個賬號到底需要什么樣權(quán)限才合適,才不會影響業(yè)務(wù)?這個不是很好界定.我們需要知道在設(shè)置權(quán)限時的信息,要授予的權(quán)限級別、庫級別、表級別、列級別,或者其它超級權(quán)限、要授予的權(quán)限類型,增刪改查等.
從mysql.user表來看
用戶賬戶劃分原則:
主要是防止泄漏,非必要人員不需要知道賬號的名稱,同時需要制定相應(yīng)的命名規(guī)則,還有就是合理使用自己的賬號密碼,保護(hù)好你的賬號密碼,對于絕無必要的用戶,先禁用,后期刪除,要做到無匿名賬戶和無廢棄賬戶.
提高本地安全性,主要是防止MySQL對本地文件的存取,會對系統(tǒng)構(gòu)成威脅,還有Load DATA LOCAL INFILE,禁用該功能.
這個主要是防止誤刪除,非權(quán)限用戶禁止訪問目錄,還有就是數(shù)據(jù)文件禁止訪問,或者采用更改常用的目錄路徑,或者通過chroot,要保證該目錄不能讓未經(jīng)授權(quán)的用戶訪問后把數(shù)據(jù)庫打包拷貝走了,所以要限制對該目錄的訪問.
盡量并且不要使用固定密碼,實行每個用戶單獨密碼,長度在16位以上 0-9a-zA-Z~!@#$%^&*()-+ 隨機組合.
根據(jù)公司的情況設(shè)定密碼過期時間,定期更改,同時不可使用重復(fù)密碼.
為了方便管理,可能會采用一個密碼表,要加強對于密碼表的維護(hù)更新,最重要的是保證不泄漏.
常規(guī)的方式是安裝補丁,不過這個往往比較麻煩,主要是版本升級,還有就是防護(hù)策略.
由于性能或者其它方面原因,很多生產(chǎn)環(huán)境并沒有使用,不過從5.7+開始,已經(jīng)好很多了,有需要的加強安全防范其實可以嘗試下了.
https://dev.mysql.com/doc/refman/5.7/en/mysql-ssl-rsa-setup.html
一般化數(shù)據(jù)庫前面都會有主備的墻,不過從成本上考慮,很多企業(yè)都是單個或者裸奔的,有自己的硬件防火墻最好,沒有的話也可以使用系統(tǒng)自帶的防火墻,然后在加上其它白名單和中間件白名單過濾輔助措施,也能防止一部分問題.
默認(rèn)端口是3306,這個最好修改下,為了方便記憶,你可以根據(jù)的IP地址來加密動態(tài)調(diào)整,不過如果生產(chǎn)網(wǎng)絡(luò)允許,也可以定期修改,最好不要影響研發(fā)進(jìn)度.
刪除操作系統(tǒng)記錄的敏感數(shù)據(jù),比如.mysql_history、.bash_history 等,及時清理,移除和禁用.mysql_history文件.
人是安全的主導(dǎo),管理的對象要從兩個角度來看,從信息角度來說就是MySQL本身的安全,要防止數(shù)據(jù)的丟失和免遭破壞;從技術(shù)角度來說就是整個系統(tǒng)的安全,要防止系統(tǒng)的癱瘓和免遭破壞.
最后說句題外話,監(jiān)控和審計,安全主要是防患于未然,沒有誰希望一天到晚接到各種警報,最好根據(jù)公司的實際情況訂個詳細(xì)的規(guī)章制度,不要覺得這個麻煩,有些你可能并不覺得有用,但是呢?我希望是沒有但是.
不以規(guī)矩,不成方圓.
無可否認(rèn),很多時候由于項目的開發(fā)迭代過于頻繁,實時的需求反饋,可以及時調(diào)整產(chǎn)品的方向,不過由于各種大大小小的功能的耦合交錯,還有研發(fā)人員對數(shù)據(jù)庫的了解參差不齊,他們可能更加關(guān)注的是功能的實現(xiàn),其次可能才是響應(yīng)速度,這就導(dǎo)致了由于數(shù)據(jù)量小時看不出問題的SQL,一旦遇到大數(shù)據(jù)量,查詢性能或者說系統(tǒng)的響應(yīng)速度會變慢,這是個值得關(guān)注的地方,為了防止出現(xiàn)這種情況,你需要做點什么.
以上相對比較常規(guī),一個完善合理的規(guī)范當(dāng)然還需要一個比較長的過程.
MySQL作為流行的開源數(shù)據(jù)庫擁有多個重要分支,每個分支都有各自的優(yōu)缺點,這里不做過多評價,總的來說,MySQL仍然是一款非常出色的產(chǎn)品,是一個非常適合大多數(shù)場景下使用的數(shù)據(jù)庫,無論是從可用性、可擴展性、性能和管理各方面都是不錯的選擇.
當(dāng)然說為了追求某些方面的新的功能性需求,或者M(jìn)ySQL版本覺得太臃腫,你也可以嘗試其他版本,主要是符合你的業(yè)務(wù)場景才是最合適的.
根據(jù)研發(fā)的階段來劃分主要分為開發(fā)階段、測試階段、準(zhǔn)生產(chǎn)階段、壓測階段、上線階段.
數(shù)據(jù)庫和系統(tǒng)的版本可能都比較新,這里面有一部分是嘗鮮的概念在里面,同時,也為了以后的版本更新提供了一定的基礎(chǔ),其次是研發(fā)人員對于數(shù)據(jù)庫和操作系統(tǒng)的權(quán)限是比較大的,基本上會all in,主要保證開發(fā)的進(jìn)度.
這個環(huán)境的版本可能也是比較新的,不過已經(jīng)很貼近生產(chǎn)了,然后是對于權(quán)限的話,由于主要是測試階段,研發(fā)人員和測試人員的權(quán)限基本上限定到庫表的DML權(quán)限,很難執(zhí)行其它特別是DDL操作了,當(dāng)然還是以保證開發(fā)和測試為主.
原則上這個環(huán)境跟生產(chǎn)環(huán)境基本上1:1,版本跟生產(chǎn)是一樣的,其次配置比生產(chǎn)會低很多,權(quán)限的話,已經(jīng)不允許DDL語句了,并且DML也會嚴(yán)格控制.
一般化而言,很多公司會把準(zhǔn)這個壓測環(huán)境放到準(zhǔn)生產(chǎn)上面,對此,我不反對不建議,完全看你的想法和公司的規(guī)劃,壓測環(huán)境跟生產(chǎn)環(huán)境保證100%完全一致性,因為為了追求那個極致,同時全面禁止的DDL,只讀環(huán)境.
PS:很多時候,你的準(zhǔn)生產(chǎn)可能就是壓測環(huán)境,這邊就不做過多說明了,主要還是看你的規(guī)劃.
這個就不說了,完全禁止的DML、DDL操作,任何操作必須有記錄,比如審計、工單等等.
容量規(guī)劃主要是如何有效評估需求,如果說沒有統(tǒng)一綜合的管理機制,各種項目的資源申請各自為政,沒有考慮到綜合實際使用的資源情況,會造成嚴(yán)重的分配問題,或者說資源不足,有可能部分項目的提前預(yù)支超過實際情況的資源,其它項目完全沒有資源,或者項目資源是有時間期限的,過了期限就需要即使的回收利用.
對于數(shù)據(jù)庫本身容量規(guī)劃更加重要,畢竟你的數(shù)據(jù)都在里面,首先項目初始階段可能會預(yù)估下使用量,然后還需要定期的實際評估,根據(jù)資源的使用情況及時調(diào)整,綜合規(guī)劃各個項目的資源配置.
MySQL的容量規(guī)劃主要是庫表的大小,這個主要是看業(yè)務(wù)量,很多時候業(yè)務(wù)部門會說我的計劃目標(biāo)是1kw用戶量,那么可能很難有一個估計的大小,因為你的庫表一直是在變化的,自然而言,比較困難評估一個大概的容量,而且如果數(shù)據(jù)量太大的情況下,從數(shù)據(jù)的訪問響應(yīng)速度就需要考慮分庫分表了,這個主要還是看的業(yè)務(wù)場景和需要的響應(yīng)速度.
MySQL數(shù)據(jù)文件目錄還是比較簡單的,可以分成數(shù)據(jù)文件目錄、日志文件目錄、參數(shù)文件目錄、其它文件目錄等.
數(shù)據(jù)文件主要按照庫表單位劃分的,由于引擎的不同可能分成結(jié)構(gòu)定義文件、數(shù)據(jù)文件、索引文件.
這里面包括了啟動日志、報錯日志、查詢?nèi)罩尽⒙樵內(nèi)罩尽inlog日志、binlog索引文件、relay_log中繼日志、relay_log中繼日志索引文件等.
包括pid、sock、cnf 文件等.
包括redo、undo、ibdata1、ibtmp1文件等.
歸檔,這邊說的歸檔規(guī)劃是定期把以上各類文件備份歸檔,數(shù)據(jù)文件自不必說,其它文件也是需要定期歸檔的,歸檔的方法有很多,你可以把相應(yīng)的文件根據(jù)不同的規(guī)律存放在結(jié)構(gòu)化或者非結(jié)構(gòu)化的地方.
數(shù)據(jù)庫審計能夠?qū)崟r記錄網(wǎng)絡(luò)上的數(shù)據(jù)庫活動,對數(shù)據(jù)庫操作進(jìn)行細(xì)粒度審計的合規(guī)性管理,對數(shù)據(jù)庫遭受到的風(fēng)險行為進(jìn)行告警,對攻擊行為進(jìn)行阻斷.
它通過對用戶訪問數(shù)據(jù)庫行為的記錄、分析和匯報,用來幫助用戶事后生成合規(guī)報告、事故追根溯源,同時加強內(nèi)外部數(shù)據(jù)庫網(wǎng)絡(luò)行為記錄,提高數(shù)據(jù)安全.
審計對數(shù)據(jù)庫記錄和行為進(jìn)行獨立的審查和估計,其主要作用和目的包括以下幾個方面:
有個不知道算奇怪還是正常的事情,不知道多少人給生產(chǎn)恢復(fù)過數(shù)據(jù),這里面不談因由,只有做過的人才知道這其中的坑有多少,所以也就需要大家對于各種恢復(fù)手段都有所了解,乃至于熟練掌握.
雖然防患未然還是比較困難,畢竟各種情況都會發(fā)生,但至少可以未雨綢繆,從安全上講,有了審計就可以大大減少這類事情的發(fā)生.
對于數(shù)據(jù)庫而言,無論是硬件設(shè)備還是軟件審計都會加大數(shù)據(jù)庫的壓力,從性能的損耗上講,事后審計是比較折中的策略,這邊先講下軟件部分的,無論是MySQL官方還是MariaDB或者Percona還是其它的都有一套自己的審計產(chǎn)品.
下面列下常用的幾種:
主要用哪個還得看你適合哪個,如果你有足夠的資源可以考慮采用硬件的模式,盡量選擇專門審計設(shè)備的設(shè)備,然后根據(jù)定期的報表檢查你的相關(guān)配置.
前面列出的幾個感興趣的小伙伴可以具體測試下,當(dāng)然如果你已經(jīng)在使用了,那我們可以私下交流.
備份和恢復(fù)是兩個相互關(guān)聯(lián)的,至于備份恢復(fù)的種種前面已經(jīng)有說過了,關(guān)于備份恢復(fù)也有一系列的軟硬件,這邊主要說下規(guī)劃.
你首選要根據(jù)自己的實際情況做需求分析,你需要有當(dāng)前使用數(shù)據(jù)庫的類型、版本信息、配置信息、數(shù)據(jù)量總大小、每日新增大小、備份方式(物理備份/邏輯備份)、業(yè)務(wù)高峰期,當(dāng)然還有數(shù)據(jù)庫的主機的系統(tǒng)情況等信息.
備份策略,根據(jù)不同的業(yè)務(wù)還有其它需要確定,常用的是全量、增量、差異備份三種,實際情況下很多都是三種策略的結(jié)合使用.
備份大小,這個取決于你采用的備份方式,會有一個大致的增長值,這個可能需要跟業(yè)務(wù)那邊的規(guī)劃做詳細(xì)的統(tǒng)計,給出一個大概的范圍.
備份保留時間,這個跟備份的大小、備份介質(zhì)的大小、性價比有關(guān)系.
如果你的介質(zhì)空間太小,自然而然也就不能保留太長時間,這個時候,通常會根據(jù)業(yè)務(wù)的核心程度來劃分,應(yīng)確定重要業(yè)務(wù)備份的保存期以及其它需要永久保存的備份,總的來說,保留半年之類的有效數(shù)據(jù)是基本的要求.
備份介質(zhì)大小,根據(jù)你的保留時間合理地規(guī)劃你的備份介質(zhì)大小.
備份計劃,這個跟恢復(fù)策略有關(guān)系,基本上是你需要一個專門備份的數(shù)據(jù)庫,這個主要是為了減少對主庫的影響,對此大部分是數(shù)據(jù)庫都支持該方案,當(dāng)然主庫執(zhí)行備份也不是不可以,只要合理使用.
根據(jù)業(yè)務(wù)繁忙的情況,在合理的時間和空間下能全備的盡量全備,雖然全量可能會增加數(shù)據(jù)的重復(fù)性和空間的使用,你可以適當(dāng)加上增量或者差異備份.
太大的庫可能全備時間太長,優(yōu)化過后還是不能接受,可以選擇一個相對不繁忙的時間做全量備份,然后加上增量或者差異備份,當(dāng)然這個全量的頻率還是需要根據(jù)你的業(yè)務(wù)來結(jié)合.總不能說,我需要恢復(fù)昨天的數(shù)據(jù),你告訴我只有上上上個月的全備加上增量或者差異,這個恢復(fù)的時間一般會比較長,這個肯定不能滿足的需求,所以備份計劃要完全貼合你的業(yè)務(wù)需求,以及需要詳細(xì)指定最大容忍的時間性要求.
備份執(zhí)行過程應(yīng)有詳細(xì)的規(guī)劃和記錄,包括備份重要等級、備份主體、備份時間、備份策略、備份路徑、記錄介質(zhì)(類型)等.
同時備份文件加密權(quán)限控制也是不可或缺的,所有操作需要保留相應(yīng)記錄,方便審計跟蹤,安全需要時刻關(guān)注.
恢復(fù)規(guī)劃,這個不能說是規(guī)劃,我覺得這個應(yīng)該更像一個日常的計劃任務(wù),如果你有充足的資源,特別的恢復(fù)服務(wù)器組,我希望你在每天完成備份并且上傳統(tǒng)一的備份介質(zhì)后,每天都可以把所有的系統(tǒng)都恢復(fù)一次,不要覺得太麻煩,有時候這些麻煩會幫你很多,當(dāng)你把所有的一切做成定時任務(wù)之后,你會發(fā)現(xiàn),生活太美好.
實際的情況往往比這個更加復(fù)雜,我們把容災(zāi)劃分成很多的等級,計算機軟件故障、人為原因、計劃性停機,然后從等級上是時間上有幾個九,同時還有災(zāi)備的環(huán)境一些措施,確保可以在規(guī)定的時間內(nèi)完成有效性恢復(fù).
但是,當(dāng)災(zāi)難發(fā)生的時候,很多東西都會很巧合地并發(fā)發(fā)生,會很亂,假使災(zāi)備環(huán)境也不是正常的或者壓根就沒有所謂的災(zāi)備環(huán)境,那個時候你依賴的可能也僅僅是備份的一個有效恢復(fù),那個時候,壓力會稍微有點大,如果你對恢復(fù)情況不是很了解,或者不是很熟練,我們也只能就這么看著能恢復(fù)多少,心里沒有底,這個時候才會覺得恢復(fù)測試真的非常重要.
平時我們關(guān)注的大都在日常的備份上,并不會實際去驗證,不過其實日常恢復(fù)演練更加重要,即使不能做到所有系統(tǒng)的恢復(fù)計劃,起碼保證核心系統(tǒng)的備份的有效性,同時制定恢復(fù)測試計劃.
總之,對于數(shù)據(jù)庫而言,首先要求我們擁有一個完整的備份,有了備份你才能做很多事,同時也會省了很多事.其次是安全,無論是數(shù)據(jù)備份的安全還是數(shù)據(jù)本身或者研發(fā)使用中的安全,都值得關(guān)注.然后是數(shù)據(jù)庫本身的使用,合情合理的使用.最后對于你所維護(hù)的數(shù)據(jù)庫你需要擁有詳細(xì)的規(guī)劃,無論是管理角度還是使用角度都需要.
最后給大家提幾點建議:
文章來自微信公眾號:DBAplus社群
轉(zhuǎn)載請注明本頁網(wǎng)址:
http://www.snjht.com/jiaocheng/2204.html