云平臺下地運維體系建設(shè)工作內(nèi)容_第1頁
云平臺下地運維體系建設(shè)工作內(nèi)容_第2頁
云平臺下地運維體系建設(shè)工作內(nèi)容_第3頁
云平臺下地運維體系建設(shè)工作內(nèi)容_第4頁
云平臺下地運維體系建設(shè)工作內(nèi)容_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、標準實用文案云平臺下的運維體系建設(shè)工作內(nèi)容一、系統(tǒng)運維系統(tǒng)運維負責(zé)IDC、網(wǎng)絡(luò)、CDN和基礎(chǔ)服務(wù)的建設(shè)(LVS、NTP、DNS);負責(zé)資產(chǎn)管理,服務(wù)器選型、交付和維修。詳細的工作職責(zé)如下:IDC數(shù)據(jù)中心建設(shè)收集業(yè)務(wù)需求,預(yù)估未來數(shù)據(jù)中心的發(fā)展規(guī)模,從骨干網(wǎng)的分布,數(shù)據(jù)中心建筑,以及In ternet接入、網(wǎng)絡(luò)攻擊防御能力、擴容能力、空間預(yù)留、外接專線能力、現(xiàn)場服務(wù)支撐能力等方面評估選型數(shù)據(jù)中心。負責(zé)數(shù)據(jù)中心的建設(shè)、現(xiàn)場維護工作網(wǎng)絡(luò)建設(shè)設(shè)計及規(guī)劃生產(chǎn)網(wǎng)絡(luò)架構(gòu),這里面包括:數(shù)據(jù)中心網(wǎng)絡(luò)架 構(gòu)、傳輸網(wǎng)架構(gòu)、 CDN 網(wǎng)絡(luò)架構(gòu)等,以及網(wǎng)絡(luò)調(diào)優(yōu)等日常運維工 作。LVS 負載均衡和 SNAT 建設(shè)LVS是

2、整個站點架構(gòu)中的流量入口,根據(jù)網(wǎng)絡(luò)規(guī)模和業(yè)務(wù)需 求,構(gòu)建負載均衡集群;完成網(wǎng)絡(luò)與業(yè)務(wù)服務(wù)器的銜接,提供高性 能、高可用的負載調(diào)度能力,以及統(tǒng)一的網(wǎng)絡(luò)層防攻擊 能力; SNAT 集中提供數(shù)據(jù)中心的公網(wǎng)訪問服務(wù),通過集群化部 署,保證出網(wǎng)服務(wù)的高性能與高可用。CDN 規(guī)劃和建設(shè)CDN 工作劃分為第三方和自建兩部分。建立第三方 CDN 的 選型和調(diào)度控制;根據(jù)業(yè)務(wù)發(fā)展趨勢,規(guī)劃 CDN 新節(jié)點建設(shè)布 局;完善 CDN 業(yè)務(wù)及監(jiān)控,保障 CDN 系統(tǒng)穩(wěn)定、高效運行;分析 業(yè)務(wù)加速頻道的文件特性和數(shù)量,制定最優(yōu)的加速策略和資源匹 配;負責(zé)用戶劫持等 CDN 日常故障排查工作。服務(wù)器選型、交付和維護負責(zé)服

3、務(wù)器的測試選型,包含服務(wù)器整機、部件的基礎(chǔ)性測 試和業(yè)務(wù)測試,降低整機功率,提升機架部署密度等。結(jié)合對公司 業(yè)務(wù)的了解,推廣新硬件、新方案減少業(yè)務(wù)的服務(wù)器投入規(guī)模。負 責(zé)服務(wù)器硬件故障的診斷定位,服務(wù)器硬件監(jiān)控、健康檢查工具的 開發(fā)和維護。OS 、內(nèi)核選型和 OS 相關(guān)維護工作責(zé)整體平臺的 OS 選型、定制和內(nèi)核優(yōu)化,以及 Patch 的更 新和內(nèi)部版本發(fā)布;建立基礎(chǔ)的 YUM 包管理和分發(fā)中心,提供常 用包版本庫;跟進日常各類 OS 相關(guān)故障;針對不同的業(yè)務(wù)類型, 提供定向的優(yōu)化支持。資產(chǎn)管理記錄和管理運維相關(guān)的基礎(chǔ)物理信息,包括數(shù)據(jù)中心、網(wǎng)絡(luò)、機 柜、服務(wù)器、 ACL、 IP 等各種資源信

4、息,制定有效的流程,確保信 息的準確性;開放 API 接口,為自動化運維提供數(shù)據(jù)支持。 基礎(chǔ)服務(wù)建設(shè)業(yè)務(wù)對 DNS 、NTP 、SYSLOG 等基礎(chǔ)服務(wù)的依賴非常高,需 要設(shè)計高可用架構(gòu)避免單點,提供穩(wěn)定的基礎(chǔ)服務(wù)。二、應(yīng)用運維應(yīng)用運維負責(zé)線上服務(wù)的變更、服務(wù)狀態(tài)監(jiān)控、服務(wù)容災(zāi)和數(shù)據(jù) 備份等工作,對服務(wù)進行例行排查、故障應(yīng)急處理等工作。詳細的 工作職責(zé)如下所述。設(shè)計評審在產(chǎn)品研發(fā)階段,參與產(chǎn)品設(shè)計評審,從運維的角度提出評審意 見,使服務(wù)滿足運維準入的高可用要求。服務(wù)管理負責(zé)制定線上業(yè)務(wù)升級變更及回滾方案,并進行變更實施。掌握 所負責(zé)的服務(wù)及服務(wù)間關(guān)聯(lián)關(guān)系、服務(wù)依賴的各種資源。能夠發(fā)現(xiàn) 服務(wù)上的

5、缺陷,及時通報并推進解決。制定服務(wù)穩(wěn)定性指標及準入 標準,同時不斷完善和優(yōu)化程序和系統(tǒng)的功能、效率,提高運行質(zhì) 量。完善監(jiān)控內(nèi)容,提高報警準確度。在線上服務(wù)出現(xiàn)故障時,第 一時間響應(yīng),對已知線上故障能按流程進行通報并按預(yù)案執(zhí)行,未 知故障組織相關(guān)人員聯(lián)合排障。資源管理對各服務(wù)的服務(wù)器資產(chǎn)進行管理,梳理服務(wù)器資源狀況、數(shù)據(jù)中 心分布情況、網(wǎng)絡(luò)專線及帶寬情況,能夠合理使用服務(wù)器資源,根 據(jù)不同服務(wù)的需求,分配不同配置的服務(wù)器,確保服務(wù)器資源的充 分利用。例行檢查制定服務(wù)例行排查點,并不斷完善。根據(jù)制定的服務(wù)排查點,對 服務(wù)進行定期檢查。對排查過程中發(fā)現(xiàn)的問題,及時進行追查,排 除可能存在的隱患。預(yù)

6、案管理確定服務(wù)所需的各項監(jiān)控、系統(tǒng)指標的閾值或臨界點,以及出現(xiàn) 該情況后的處理預(yù)案。建立和更新服務(wù)預(yù)案文檔,并根據(jù)日常故障 情況不斷補充完善,提高預(yù)案完備性。能夠制定和評審各類預(yù)案, 周期性進行預(yù)案演練,確保預(yù)案的可執(zhí)行性。數(shù)據(jù)備份制定數(shù)據(jù)備份策略,按規(guī)范進行數(shù)據(jù)備份工作。保證數(shù)據(jù)備份的 可用性和完整性,定期開展數(shù)據(jù)恢復(fù)性測試。三、數(shù)據(jù)庫運維數(shù)據(jù)庫運維負責(zé)數(shù)據(jù)存儲方案設(shè)計、數(shù)據(jù)庫表設(shè)計、索引設(shè)計和 SQL 優(yōu)化,對數(shù)據(jù)庫進行變更、監(jiān)控、備份、高可用設(shè)計等工作。詳細的工作職責(zé)如下所述。設(shè)計評審在產(chǎn)品研發(fā)初始階段,參與設(shè)計方案評審,從 DBA 的角度提出 數(shù)據(jù)存儲方案、庫表設(shè)計方案、 SQL 開發(fā)

7、標準、索引設(shè)計方案等, 使服務(wù)滿足數(shù)據(jù)庫使用的高可用、高性能要求。容量規(guī)劃掌握所負責(zé)服務(wù)的數(shù)據(jù)庫的容量上限,清楚地了解當前瓶頸點, 當服務(wù)還未到達容量上限時,及時進行優(yōu)化、分拆或者擴容。數(shù)據(jù)備份與災(zāi)備制定數(shù)據(jù)備份與災(zāi)備策略,定期完成數(shù)據(jù)恢復(fù)性測試,保證數(shù)據(jù) 備份的可用性和完整性。數(shù)據(jù)庫監(jiān)控完善數(shù)據(jù)庫存活和性能監(jiān)控,及時了解數(shù)據(jù)庫運行狀態(tài)及故障。數(shù)據(jù)庫安全建設(shè)數(shù)據(jù)庫賬號體系,嚴格控制賬號權(quán)限與開放范圍,降低誤操 作和數(shù)據(jù)泄露的風(fēng)險;加強離線備份數(shù)據(jù)的管理,降低數(shù)據(jù)泄露的 風(fēng)險。數(shù)據(jù)庫高可用和性能優(yōu)化對數(shù)據(jù)庫單點風(fēng)險和故障設(shè)計相應(yīng)的切換方案,降低故障對數(shù)據(jù) 庫服務(wù)的影響;不斷對數(shù)據(jù)庫整體性能進行優(yōu)

8、化,包括新存儲方案 引進、硬件優(yōu)化、文件系統(tǒng)優(yōu)化、數(shù)據(jù)庫優(yōu)化、 SQL 優(yōu)化等,在保 障成本不增加或者少量增加的情況下,數(shù)據(jù)庫可以支撐更多的業(yè)務(wù) 請求。自動化系統(tǒng)建設(shè)設(shè)計開發(fā)數(shù)據(jù)庫自動化運維系統(tǒng),包括數(shù)據(jù)庫部署、自動擴容、 分庫分表、權(quán)限管理、備份恢復(fù)、 SQL 審核和上線、故障切換等功 能。四、運維研發(fā)運維研發(fā)負責(zé)通用的運維平臺設(shè)計和研發(fā)工作,如:資產(chǎn)管理、 監(jiān)控系統(tǒng)、運維平臺、數(shù)據(jù)權(quán)限管理系統(tǒng)等。提供各種 API 供運維 或研發(fā)人員使用,封裝更高層的自動化運維系統(tǒng)。詳細的工作職責(zé) 如下所述。運維平臺記錄和管理服務(wù)及其關(guān)聯(lián)關(guān)系,協(xié)助運維人員自動化、流程化地 完成日常運維操作,包括機器管理、重

9、啟、改名、初始化、域名管理、流量切換和故障預(yù)案實施等。監(jiān)控系統(tǒng)負責(zé)監(jiān)控系統(tǒng)的設(shè)計、開發(fā)工作,完成公司服務(wù)器和各種網(wǎng)絡(luò)設(shè) 備的資源指標、線上業(yè)務(wù)運行指標的收集、告警、存儲、分析、展 示和數(shù)據(jù)挖掘等工作,持續(xù)提高告警的及時性、準確性和智能性, 促進公司服務(wù)器資源的合理化調(diào)配。自動化部署系統(tǒng)參與部署自動化系統(tǒng)的開發(fā),負責(zé)自動化部署系統(tǒng)所需要的基礎(chǔ) 數(shù)據(jù)和信息,負責(zé)權(quán)限管理、 API 開發(fā)、 Web 端開發(fā)。結(jié)合云計 算,研發(fā)和提供 PaaS 相關(guān)高可用平臺,進一步提高服務(wù)的部署速 度和用戶體驗,提升資源利用率。五、運維安全運維安全負責(zé)網(wǎng)絡(luò)、系統(tǒng)和業(yè)務(wù)等方面的安全加固工作,進行常 規(guī)的安全掃描、滲透測

10、試,進行安全工具和系統(tǒng)研發(fā)以及安全事件 應(yīng)急處理。詳細的工作職責(zé)如下所述。安全制度建立根據(jù)公司內(nèi)部的具體流程,制定切實可行,且行之有效的安全制 度。安全培訓(xùn)定期向員工提供具有針對性的安全培訓(xùn)和考核,在全公司內(nèi)建立 安全負責(zé)人制度。風(fēng)險評估通過黑白盒測試和檢查機制,定期產(chǎn)生對物理網(wǎng)絡(luò)、服務(wù)器、業(yè) 務(wù)應(yīng)用、用戶數(shù)據(jù)等方面的總體風(fēng)險評估結(jié)果。安全建設(shè)根據(jù)風(fēng)險評估結(jié)果,加固最薄弱的環(huán)節(jié),包括設(shè)計安全防線、部 署安全設(shè)備、及時更新補丁、防御病毒、源代碼自動掃描和業(yè)務(wù)產(chǎn) 品安全咨詢等。為了降低可能泄露數(shù)據(jù)的價值,通過加密、匿名 化、混淆數(shù)據(jù),乃至定期刪除等技術(shù)手段和流程來達到目的。安全合規(guī)為了滿足例如支付牌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論