云平臺下的運維體系建設(shè)工作內(nèi)容_第1頁
云平臺下的運維體系建設(shè)工作內(nèi)容_第2頁
云平臺下的運維體系建設(shè)工作內(nèi)容_第3頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、云平臺下的運維體系建設(shè)工作內(nèi)容系統(tǒng)運維系統(tǒng)運維負責IDC、網(wǎng)絡(luò)' CDf和基礎(chǔ)服務(wù)的建設(shè)(LVSNTRDNS;負責資 產(chǎn)管理,服務(wù)器選型、交付和維修。詳細的工作職責如下:IDC數(shù)據(jù)中心建設(shè) 收集業(yè)務(wù)需求,預(yù)估未來數(shù)據(jù)中心的發(fā)展規(guī)模,從骨干網(wǎng)的分 布,數(shù)據(jù)中心建筑,以及Internet接入、網(wǎng)絡(luò)攻擊防御能力、擴容能力、 空間預(yù)留、外接專線能力、現(xiàn)場服務(wù)支撐能力等方面評估選型數(shù)據(jù)中心。 負責數(shù)據(jù)中心的建設(shè)、現(xiàn)場維護工作。網(wǎng)絡(luò)建設(shè)設(shè)計及規(guī)劃生產(chǎn)網(wǎng)絡(luò)架構(gòu),這里面包括:數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)' 傳輸 網(wǎng)架構(gòu)、CDr網(wǎng)絡(luò)架構(gòu)等,以及網(wǎng)絡(luò)調(diào)優(yōu)等日常運維工作。LVS負載均衡和SNAT建設(shè)LVS是整個

2、站點架構(gòu)中的流量入口,根據(jù)網(wǎng)絡(luò)規(guī)模和業(yè)務(wù)需求,構(gòu) 建負載均衡集群;完成網(wǎng)絡(luò)與業(yè)務(wù)服務(wù)器的銜接,提供高性能、高可用的負 載調(diào)度能力,以及統(tǒng)一的網(wǎng)絡(luò)層防攻擊能力;SNAT集中提供數(shù)據(jù)中心的公網(wǎng)訪問服務(wù),通過集群化部署,保 證出網(wǎng)服務(wù)的高性能與高可用。CDN規(guī)劃和建設(shè)CDNE作劃分為第三方和自建兩部分。建立第三方CDN的選型和調(diào)度 控制;根據(jù)業(yè)務(wù)發(fā)展趨勢,規(guī)劃CDN新節(jié)點建設(shè)布局;完善CDN業(yè)務(wù)及監(jiān) 控,保障CDN系統(tǒng)穩(wěn)定、高效運行;分析業(yè)務(wù)加速頻道的文件特性和數(shù)量,制定最優(yōu)的加速策略和資源匹配;負責用戶劫持等CDN日常故障排查工作。服務(wù)器選型、交付和維護負責服務(wù)器的測試選型,包含服務(wù)器整機、部件的

3、基礎(chǔ)性測試和 業(yè)務(wù)測試,降低整機功率,提升機架部署密度等。結(jié)合對公司業(yè)務(wù)的了解, 推廣新硬件、新方案減少業(yè)務(wù)的服務(wù)器投入規(guī)模。負責服務(wù)器硬件故障的診 斷定位,服務(wù)器硬件監(jiān)控、健康檢查工具的開發(fā)和維護。OS內(nèi)核選型和OS相關(guān)維護工作責整體平臺的OS選型' 定制和內(nèi)核優(yōu)化,以及Patch的更新 和內(nèi) 部版本發(fā)布;建立基礎(chǔ)的YUM包管理和分發(fā)中心,提供常用包版本庫;跟進 日常各類OS相關(guān)故障;針對不同的業(yè)務(wù)類型,提供定向的優(yōu)化支持。資產(chǎn)管理記錄和管理運維相關(guān)的基礎(chǔ)物理信息,包括數(shù)據(jù)中心、網(wǎng)絡(luò)、機 柜、服 務(wù)器、ACL、IP等各種資源信息,制定有效的流程,確保信息的準確性; 開放API接口,為

4、自動化運維提供數(shù)據(jù)支持?;A(chǔ)服務(wù)建設(shè)業(yè)務(wù)對DNS NTP SYSLO等基礎(chǔ)服務(wù)的依賴非常高,需要設(shè)計高可用架構(gòu)避免單點,提供穩(wěn)定的基礎(chǔ)服務(wù)。二、應(yīng)用運維 應(yīng)用運維負責線上服務(wù)的變更、服務(wù)狀態(tài)監(jiān)控、服務(wù) 容災(zāi)和數(shù)據(jù)備份等工作,對服務(wù)進行例行排查、故障應(yīng)急處理等工作。詳細 的工作職責如下所述。設(shè)計評審在產(chǎn)品研發(fā)階段,參與產(chǎn)品設(shè)計評審,從運維的角度提出評審意見,使服務(wù)滿足運維準入的高可用要求。服務(wù)管理負責制定線上業(yè)務(wù)升級變更及回滾方案,并進行變更實施。掌握 所負責的服務(wù)及服務(wù)間關(guān)聯(lián)關(guān)系、服務(wù)依賴的各種資源。能夠發(fā)現(xiàn)服務(wù)上的缺陷, 及時通報并推進解決。制定服務(wù)穩(wěn)定性指標及準入標準,同時不斷完善和優(yōu) 化

5、程序和系統(tǒng)的功能、效率,提咼運行質(zhì)量。完善監(jiān)控內(nèi)容,提高報警準確 度。在線上服務(wù)出現(xiàn)故障時,第一時間響應(yīng),對已知線上故障能按流程進行通報并按預(yù)案執(zhí)行,未知故障組織相關(guān)人員聯(lián)合排障。資源管理對各服務(wù)的服務(wù)器資產(chǎn)進行管理,梳理服務(wù)器資源狀況、數(shù)據(jù)中心分布情況、網(wǎng)絡(luò)專線及帶寬情況,能夠合理使用服務(wù)器資源,根據(jù)不同服務(wù)的需求,分配不同配置的服務(wù)器,確保服務(wù)器資源的充分利用。例行檢查制定服務(wù)例行排查點,并不斷完善。根據(jù)制定的服務(wù)排查點,對服務(wù)進行定期檢查。對排查過程中發(fā)現(xiàn)的問題,及時進行追查排除可能存在的隱患。預(yù)案管理確定服務(wù)所需的各項監(jiān)控、系統(tǒng)指標的閾值或臨界點,以及出現(xiàn)該情況后的處理預(yù)案。建立和更新

6、服務(wù)預(yù)案文檔,并根據(jù)日常故障情 況不斷補充完 善,提咼預(yù)案完備性。能夠制定和評審各類預(yù)案,周期性進行預(yù)案演練,確 保預(yù)案的可執(zhí)行性。數(shù)據(jù)備份制定數(shù)據(jù)備份策略,按規(guī)范進行數(shù)據(jù)備份工作。保證數(shù)據(jù)備份的可用性和完整性,定期開展數(shù)據(jù)恢復(fù)性測試。三、數(shù)據(jù)庫運維數(shù)據(jù)庫運維負責數(shù)據(jù)存儲方案設(shè)計、數(shù)據(jù)庫表設(shè)計、索引設(shè)計和SQL優(yōu)化,對數(shù)據(jù)庫進行變更、監(jiān)控、備份、高可用設(shè)計等工作。詳細的工 作職責如下所述。設(shè)計評審在產(chǎn)品研發(fā)初始階段,參與設(shè)計方案評審,從DBA勺角度提出數(shù)據(jù)存 儲方案、庫表設(shè)計方案' SQL開發(fā)標準' 索引設(shè)計方案等,使服務(wù)滿足數(shù)據(jù) 庫使用勺高可用、高性能要求。容量規(guī)劃掌握所負責

7、服務(wù)勺數(shù)據(jù)庫勺容量上限,清楚地了解當前瓶頸點,當服務(wù)還未到達容量上限時,及時進行優(yōu)化、分拆或者擴容。數(shù)據(jù)備份與災(zāi)備制定數(shù)據(jù)備份與災(zāi)備策略,定期完成數(shù)據(jù)恢復(fù)性測試,保證數(shù)據(jù) 備份勺可用性和完整性。數(shù)據(jù)庫監(jiān)控完善數(shù)據(jù)庫存活和性能監(jiān)控,及時了解數(shù)據(jù)庫運行狀態(tài)及故障。數(shù)據(jù)庫安全建設(shè)數(shù)據(jù)庫賬號體系,嚴格控制賬號權(quán)限與開放范圍,降低誤操作和數(shù)據(jù)泄露勺風險;加強離線備份數(shù)據(jù)勺管理,降低數(shù)據(jù)泄露勺風 險。數(shù)據(jù)庫高可用和性能優(yōu)化對數(shù)據(jù)庫單點風險和故障設(shè)計相應(yīng)勺切換方案,降低故障對數(shù)據(jù)庫服務(wù)勺影響;不斷對數(shù)據(jù)庫整體性能進行優(yōu)化,包括新存儲方案引進、硬件優(yōu) 化、文件系統(tǒng)優(yōu)化、數(shù)據(jù)庫優(yōu)化、SQL優(yōu)化等,在保障成本不增

8、加或者少量增加的情況下,數(shù)據(jù)庫可以支撐更多的業(yè)務(wù)請求。自動化系統(tǒng)建設(shè)設(shè)計開發(fā)數(shù)據(jù)庫自動化運維系統(tǒng),包括數(shù)據(jù)庫部署、自動擴容、分庫分表、權(quán)限管理、備份恢復(fù)、SQL審核和上線、故障切換等功能。四、運維研發(fā)運維研發(fā)負責通用的運維平臺設(shè)計和研發(fā)工作,如:資產(chǎn)管理' 監(jiān)控系 統(tǒng)、運維平臺' 數(shù)據(jù)權(quán)限管理系統(tǒng)等。提供各種API供運維或研發(fā)人員使 用,封裝更高層的自動化運維系統(tǒng)。詳細的工作職責如下所述。運維平臺記錄和管理服務(wù)及其關(guān)聯(lián)關(guān)系,協(xié)助運維人員自動化、流程化地完成日 常運維操作,包括機器管理' 重啟、改名、初始化' 域名管理' 流量切 換和故障預(yù)案實施等。監(jiān)控系

9、統(tǒng)負責監(jiān)控系統(tǒng)的設(shè)計、開發(fā)工作,完成公司服務(wù)器和各種網(wǎng)絡(luò)設(shè)備的資 源指標、線上業(yè)務(wù)運行指標的收集' 告警、存儲' 分析' 展示和數(shù)據(jù)挖掘等 工作,持續(xù)提高告警的及時性' 準確性和智能性,促進公司服務(wù)器資源的合 理化調(diào)配。自動化部署系統(tǒng)參與部署自動化系統(tǒng)的開發(fā),負責自動化部署系統(tǒng)所需要的基 礎(chǔ) 數(shù)據(jù)和信息,負責權(quán)限管理' API開發(fā)' Wet端開發(fā)。結(jié)合云計算,研發(fā) 和提供PaaS相關(guān)高可用平臺,進一步提高服務(wù)的部署速度和用戶體驗,提 升資源利用率。五、運維安全運維安全負責網(wǎng)絡(luò)' 系統(tǒng)和業(yè)務(wù)等方面的安全加固工作,進行常規(guī)的安 全掃描、滲透測試,進行安全工具和系統(tǒng)研發(fā)以及安全事件應(yīng)急處理。詳細 的工作職責如下所述。安全制度建立根據(jù)公司內(nèi)部的具體流程,制定切實可行,且行之有效的安全制度。安全培訓(xùn)定期向員工提供具有針對性的安全培訓(xùn)和考核,在全公司內(nèi)建立 安全負責人制度。no風險評估通過黑白盒測試和檢查機制,定期產(chǎn)生對物理網(wǎng)絡(luò)、服務(wù)器、業(yè) 務(wù)應(yīng) 用、用戶數(shù)據(jù)等方面的總體風險評估結(jié)果。安全建設(shè)根據(jù)風險評估結(jié)果,加固最薄弱的環(huán)節(jié),包括設(shè)計安全防線' 部署安全設(shè)備、及時更新補丁、防御病毒、源代碼自動掃描和業(yè)務(wù)產(chǎn)品安全咨詢等。為了降低可能泄露數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論