1.設(shè)計評審
在產(chǎn)品研發(fā)初始階段,參與設(shè)計方案評審,從DBA的角度提出數(shù)據(jù)存儲方案、庫表設(shè)計方案、SQL開發(fā)標(biāo)準(zhǔn)、索引設(shè)計方案等,使服務(wù)滿足數(shù)據(jù)庫使用的高可用、高性能要求。
2.容量規(guī)劃
掌握所負(fù)責(zé)服務(wù)的數(shù)據(jù)庫的容量上限,清楚地了解當(dāng)前瓶頸點,當(dāng)服務(wù)還未到達(dá)容量上限時,及時進(jìn)行優(yōu)化、分拆或者擴(kuò)容。
3.數(shù)據(jù)備份與災(zāi)備
制定數(shù)據(jù)備份與災(zāi)備策略,定期完成數(shù)據(jù)恢復(fù)性測試,保證數(shù)據(jù)備份的可用性和完整性。
4.數(shù)據(jù)庫監(jiān)控
完善數(shù)據(jù)庫存活和性能監(jiān)控,及時了解數(shù)據(jù)庫運行狀態(tài)及故障。
數(shù)據(jù)庫安全建設(shè)數(shù)據(jù)庫賬號體系,嚴(yán)格控制賬號權(quán)限與開放范圍,降低誤操作和數(shù)據(jù)泄露的風(fēng)險;加強(qiáng)離線備份數(shù)據(jù)的管理,降低數(shù)據(jù)泄露的風(fēng)險。

5.數(shù)據(jù)庫高可用和性能優(yōu)化
對數(shù)據(jù)庫單點風(fēng)險和故障設(shè)計相應(yīng)的切換方案,降低故障對數(shù)據(jù)庫服務(wù)的影響;不斷對數(shù)據(jù)庫整體性能進(jìn)行優(yōu)化,包括新存儲方案引進(jìn)、硬件優(yōu)化、文件系統(tǒng)優(yōu)化、數(shù)據(jù)庫優(yōu)化、SQL優(yōu)化等,在保障成本不增加或者少量增加的情況下,數(shù)據(jù)庫可以支撐更多的業(yè)務(wù)請求。
6.自動化系統(tǒng)建設(shè)
設(shè)計開發(fā)數(shù)據(jù)庫自動化運維系統(tǒng),包括數(shù)據(jù)庫部署、自動擴(kuò)容、分庫分表、權(quán)限管理、備份恢復(fù)、SQL審核和上線、故障切換等功能。
7.運維研發(fā)
運維研發(fā)負(fù)責(zé)通用的運維平臺設(shè)計和研發(fā)工作,如:資產(chǎn)管理、監(jiān)控系統(tǒng)、運維平臺、數(shù)據(jù)權(quán)限管理系統(tǒng)等。提供各種API供運維或研發(fā)人員使用,封裝更高層的自動化運維系統(tǒng)。詳細(xì)的工作職責(zé)如下所述。
8.運維平臺
記錄和管理服務(wù)及其關(guān)聯(lián)關(guān)系,協(xié)助運維人員自動化、流程化地完成日常運維操作,包括機(jī)器管理、重啟、改名、初始化、域名管理、流量切換和故障預(yù)案實施等。
9.監(jiān)控系統(tǒng)
負(fù)責(zé)監(jiān)控系統(tǒng)的設(shè)計、開發(fā)工作,完成公司服務(wù)器和各種網(wǎng)絡(luò)設(shè)備的資源指標(biāo)、線上業(yè)務(wù)運行指標(biāo)的收集、告警、存儲、分析、展示和數(shù)據(jù)挖掘等工作,持續(xù)提高告警的及時性、準(zhǔn)確性和智能性,促進(jìn)公司服務(wù)器資源的合理化調(diào)配。
10.自動化部署系統(tǒng)
參與部署自動化系統(tǒng)的開發(fā),負(fù)責(zé)自動化部署系統(tǒng)所需要的基礎(chǔ)數(shù)據(jù)和信息,負(fù)責(zé)權(quán)限管理、API開發(fā)、Web端開發(fā)。結(jié)合云計算,研發(fā)和提供PaaS相關(guān)高可用平臺,進(jìn)一步提高服務(wù)的部署速度和用戶體驗,提升資源利用率。