云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟:云遷移質(zhì)效優(yōu)化優(yōu)秀案例集_第1頁(yè)
云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟:云遷移質(zhì)效優(yōu)化優(yōu)秀案例集_第2頁(yè)
云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟:云遷移質(zhì)效優(yōu)化優(yōu)秀案例集_第3頁(yè)
云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟:云遷移質(zhì)效優(yōu)化優(yōu)秀案例集_第4頁(yè)
云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟:云遷移質(zhì)效優(yōu)化優(yōu)秀案例集_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

20222022年12月20222022年12月云f/t化能D提亓計(jì)劃CloudOptimizationCapabilityEnhancementInitiative云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟云f/t化能D提亓計(jì)劃CloudOptimizationCapabilityEnhancementInitiativeOpenSourceCloudAllianceforindustRy,OSCAR云遷移質(zhì)效優(yōu)秀案例2022…/~r版權(quán)聲明本案例集版權(quán)屬于云優(yōu)化能力提升計(jì)劃,并受法律保護(hù)。轉(zhuǎn)載、摘編或利用其它方式使用本報(bào)告文字或者觀點(diǎn)的,應(yīng)注明“來(lái)源:云優(yōu)化能力提升計(jì)劃”。違反上述聲明者,將追究其相關(guān)法律責(zé)任。,夕一■一

刖言云計(jì)算作為數(shù)字化轉(zhuǎn)型的技術(shù)底座,是企業(yè)數(shù)字化轉(zhuǎn)型的必然選擇。近年來(lái),各行業(yè)企業(yè)上云進(jìn)程不斷深入,數(shù)據(jù)和核心應(yīng)用逐步遷移到云端。然而,企業(yè)最初上云希望獲得云計(jì)算的靈活性、創(chuàng)新性以及節(jié)省成本,但如果云遷移方式不當(dāng),云計(jì)算的效能可能無(wú)法實(shí)現(xiàn)。一方面,傳統(tǒng)思路建設(shè)的虛擬化平臺(tái)、IaaS平臺(tái)、PaaS平臺(tái)側(cè)重于單體系統(tǒng)建設(shè)的思路,企業(yè)缺乏整體的融合與創(chuàng)新。另一方面,當(dāng)IT基礎(chǔ)設(shè)施加速向云進(jìn)化,企業(yè)應(yīng)用系統(tǒng)需要現(xiàn)代化改造優(yōu)化以適配云計(jì)算IT環(huán)境。為促進(jìn)新一代云優(yōu)化服務(wù)能力的創(chuàng)新發(fā)展,交流業(yè)內(nèi)先進(jìn)經(jīng)驗(yàn),推廣云上優(yōu)化最佳實(shí)踐,云優(yōu)化能力提升計(jì)劃現(xiàn)開(kāi)展“云遷移質(zhì)效優(yōu)化”案例征集活動(dòng)。本次活動(dòng)旨在征集企業(yè)在云遷移中,對(duì)業(yè)務(wù)應(yīng)用做現(xiàn)代化改造、對(duì)基礎(chǔ)設(shè)施和平臺(tái)做融合創(chuàng)新治理的標(biāo)桿案例。通過(guò)推廣一批成熟度高、具有示范作用的優(yōu)秀案例,引導(dǎo)企業(yè)在上云用云過(guò)程中,對(duì)云環(huán)境做持續(xù)優(yōu)化和治理,釋放最佳云效能。本次案例征集歷時(shí)4個(gè)月,得到了業(yè)界的熱烈響應(yīng)。在案例申報(bào)階段,共收到43個(gè)申報(bào)案例,通過(guò)材料初評(píng)、專家復(fù)審環(huán)節(jié),總計(jì)評(píng)審出16個(gè)優(yōu)秀案例。本案例集按照“云遷移質(zhì)效優(yōu)化”優(yōu)秀案例的申報(bào)類別進(jìn)行劃分,充分征求企業(yè)意見(jiàn)后匯集成冊(cè),希望能對(duì)上云遷移及改造領(lǐng)域相關(guān)人員有一定的啟發(fā)和指引。2022云遷移質(zhì)效優(yōu)秀案例 2022云遷移質(zhì)效優(yōu)秀案例 目錄CONTENTS01應(yīng)用現(xiàn)代化改造類TOC\o"1-5"\h\z\o"CurrentDocument"-金洋化工物流架構(gòu)優(yōu)化項(xiàng)目 01\o"CurrentDocument"-湖州市綠色采購(gòu)服務(wù)平臺(tái)改造 06\o"CurrentDocument"-基于云化PaaS平臺(tái)的數(shù)據(jù)融合和應(yīng)用建設(shè) 13\o"CurrentDocument"-在線營(yíng)銷服務(wù)中心云智融合賦能實(shí)踐 20\o"CurrentDocument"-基于云原生的浦惠到家系統(tǒng) 26\o"CurrentDocument"-康寶萊應(yīng)用現(xiàn)代化改造實(shí)踐 32f02云基礎(chǔ)設(shè)施及平臺(tái)創(chuàng)新類A\o"CurrentDocument"-中國(guó)移動(dòng)IT云兩級(jí)多中心算網(wǎng)底座研究與實(shí)踐 35\o"CurrentDocument"-數(shù)字化銀行金融云平臺(tái) 43\o"CurrentDocument"-愛(ài)捷云構(gòu)建陜汽全棧私有云 48\o"CurrentDocument"-“聯(lián)通云”操作系統(tǒng)遷移 54\o"CurrentDocument"-廣州市國(guó)資國(guó)企遷云實(shí)踐 60\o"CurrentDocument"-富通云騰助力某省級(jí)電網(wǎng)公司云遷移最佳實(shí)踐 66\o"CurrentDocument"-上汽上云架構(gòu)可觀測(cè)方案 72\o"CurrentDocument"-省級(jí)能源公司上云遷移 79第一部分:應(yīng)用現(xiàn)代化改造類1.金洋化工物流架構(gòu)優(yōu)化項(xiàng)目一、 申報(bào)單位中國(guó)移動(dòng)通信集團(tuán)浙江有限公司二、 用戶簡(jiǎn)介寧波金洋化工物流作為國(guó)內(nèi)危險(xiǎn)貨物道路運(yùn)輸行業(yè)標(biāo)桿企業(yè),總結(jié)多年的管理經(jīng)驗(yàn),圍繞物流運(yùn)輸三點(diǎn)一線過(guò)程中人、車、路、物四大管理要素,打造出愛(ài)路捷專業(yè)物流管理平臺(tái)。愛(ài)路捷專業(yè)物流管理平臺(tái)致力于危險(xiǎn)貨物道路運(yùn)輸企業(yè)提供給予云端、靈活可配置的模塊化應(yīng)用,以輕便高效的方式幫助企業(yè)提高物流生產(chǎn)安全、降低經(jīng)營(yíng)成本、打通信息孤島,用數(shù)據(jù)驅(qū)動(dòng)管理,給企業(yè)帶來(lái)管理手段上的革新,真正實(shí)現(xiàn)管理過(guò)程安全、環(huán)保、高效。三、 需求分析客戶系統(tǒng)釆用B/S架構(gòu),當(dāng)前架構(gòu)模式下,通過(guò)兩臺(tái)主機(jī)來(lái)承載所有租戶業(yè)務(wù),一臺(tái)主機(jī)堆疊租戶web服務(wù),一臺(tái)主機(jī)堆疊租戶數(shù)據(jù)庫(kù)。同時(shí),由于租戶應(yīng)用具有相似性,因此客戶選擇用Docker進(jìn)行部署,但未編寫Dockerfile維護(hù)私有鏡像,每次部署新租戶應(yīng)用都需要從已有租戶應(yīng)用上剝離租戶屬性后再進(jìn)行容器創(chuàng)建。通過(guò)對(duì)客戶系統(tǒng)現(xiàn)狀摸排,總結(jié)出以下三項(xiàng)業(yè)務(wù)痛點(diǎn):擴(kuò)容便捷性差、影響面廣:通過(guò)擴(kuò)容主機(jī)規(guī)格來(lái)解決資源不足問(wèn)題,最終會(huì)受制于主機(jī)規(guī)格上限,且云主機(jī)規(guī)格變更需要關(guān)機(jī),整體操作既繁瑣又會(huì)給租戶帶來(lái)巨大業(yè)務(wù)影響。容器使用能力偏低:對(duì)容器的使用停留在初級(jí)階段,未維護(hù)私有容器鏡像。未引入任何容器管理服務(wù),導(dǎo)致運(yùn)維繁瑣。長(zhǎng)期規(guī)劃帶來(lái)短期資源浪費(fèi):由于現(xiàn)有擴(kuò)容模式復(fù)雜,因此客戶擴(kuò)容時(shí)會(huì) 云優(yōu)化能力提升計(jì)劃按照中長(zhǎng)期規(guī)劃容量來(lái)進(jìn)行擴(kuò)容,導(dǎo)致短期內(nèi)大量資源處于空載狀態(tài),造成資源浪費(fèi)。四、實(shí)施方案針對(duì)客戶現(xiàn)狀和需求痛點(diǎn),結(jié)合云原生能力,使用云容器服務(wù)、容器鏡像服務(wù)、云數(shù)據(jù)庫(kù)Mysql為客戶設(shè)計(jì)了一套新的系統(tǒng)架構(gòu)。架構(gòu)基于云容器服務(wù),業(yè)務(wù)部署模式仍然以Docker為基礎(chǔ),使客戶系統(tǒng)從自建Docker過(guò)渡至新架構(gòu)更為平滑。在新架構(gòu)中,云容器服務(wù)以Kubernetes為基礎(chǔ),為客戶提供集群化Master節(jié)點(diǎn),節(jié)點(diǎn)具有調(diào)度管理、任務(wù)處理等管理能力。客戶原有web服務(wù)主機(jī)算力拆分為多個(gè)工作Node,通過(guò)私有業(yè)務(wù)鏡像部署租戶web服務(wù)。放棄原有數(shù)據(jù)庫(kù)主機(jī),改為直接使用云數(shù)據(jù)庫(kù)RDS-Mysql服務(wù)。MSP團(tuán)隊(duì)為客戶提供的架構(gòu)優(yōu)化方案,通過(guò)移動(dòng)云容器服務(wù)優(yōu)化了擴(kuò)容模式,將升級(jí)云主機(jī)規(guī)格的縱向擴(kuò)展方式調(diào)整為訂購(gòu)Node節(jié)點(diǎn)的水平擴(kuò)容方式,當(dāng)已有Node資源不足以創(chuàng)建新Pod時(shí),可以直接訂購(gòu)新節(jié)點(diǎn)來(lái)擴(kuò)展資源池,操作更加簡(jiǎn)便。使用該模式擴(kuò)容,已有Node節(jié)點(diǎn)無(wú)需停機(jī),徹底解決了客戶的擴(kuò)2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 容問(wèn)題。MSP團(tuán)隊(duì)以本次容器服務(wù)改造方案為切入點(diǎn),向客戶推薦了云原生服務(wù)。團(tuán)隊(duì)了解到客戶目前需求幵發(fā)模式較為原始,直接通過(guò)在線IDE進(jìn)行編輯,不經(jīng)任何管控。該幵發(fā)模式曾給客戶帶來(lái)過(guò)嚴(yán)重故障,例如某次公共代碼變更導(dǎo)致全租戶的賬務(wù)模塊頁(yè)面打幵報(bào)錯(cuò),查找問(wèn)題耗時(shí)近1天。針對(duì)該幵發(fā)流程問(wèn)題,我們?yōu)榭蛻籼峁┝艘惶滓訥itlab、Jenkins為基礎(chǔ),配合容器服務(wù)使用的DevOps解決方案,為客戶規(guī)范了幵發(fā)流程。方案通過(guò)Gitlab代碼倉(cāng)庫(kù)管理代碼,將業(yè)務(wù)需求映射到代碼分支進(jìn)行需求幵發(fā),使整個(gè)需求幵發(fā)流程可追溯。Jenkins則主要負(fù)責(zé)代碼構(gòu)建、鏡像生成、管理各客戶代碼流水線,同時(shí)也是編譯、發(fā)布腳本的觸發(fā)點(diǎn),該主機(jī)編譯完成后推包至容器鏡像倉(cāng)庫(kù),并通知云上Kubernetes節(jié)點(diǎn)進(jìn)行滾動(dòng)發(fā)布。通過(guò)DevOps方案,MSP團(tuán)隊(duì)幫助客戶確立了敏捷幵發(fā)流程,使客戶的需求上線流程可管控、可追溯,為代碼變更導(dǎo)致的業(yè)務(wù)問(wèn)題找到了一條快速恢復(fù)通道。除幵發(fā)模式外,在本次項(xiàng)目中,MSP團(tuán)隊(duì)在調(diào)研時(shí)還發(fā)現(xiàn),原系統(tǒng)架構(gòu)下,每日業(yè)務(wù)早晚高峰之間以及業(yè)務(wù)量大的時(shí)期,會(huì)出現(xiàn)間斷性系統(tǒng)卡頓情況,用戶直觀感受到業(yè)務(wù)界面打幵十分緩慢、信息提交等操作響應(yīng)慢,體驗(yàn)較差。經(jīng)MSP團(tuán)隊(duì)抓包分析后得知,整個(gè)頁(yè)面的構(gòu)建需要從數(shù)據(jù)庫(kù)中動(dòng)態(tài)獲取組件依賴,結(jié)合數(shù)據(jù)交互響應(yīng)問(wèn)題,故障點(diǎn)均指向應(yīng)用與數(shù)據(jù)庫(kù)之間的網(wǎng)絡(luò)連接,而所有租戶的應(yīng)用與數(shù)據(jù)庫(kù)之間又都通過(guò)僅有的兩臺(tái)云主機(jī)的網(wǎng)絡(luò)10交互。在高峰期時(shí)分析主機(jī)狀態(tài)發(fā)現(xiàn),數(shù)據(jù)庫(kù)所在主機(jī)Recv-Q間斷性處于積壓狀態(tài),而web應(yīng)用Socket連接未設(shè)置超時(shí)時(shí)間,導(dǎo)致web應(yīng)用主機(jī)連接等待時(shí)間過(guò)長(zhǎng),引發(fā)卡頓狀況。2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 ⑤云優(yōu)化能力提H計(jì)劃[root@host-192-168-0-220>133077289proxy48917938/*-16508A ⑤云優(yōu)化能力提H計(jì)劃[root@host-192-168-0-220>133077289proxy48917938/*-16508A,[acceptHW841/systemd706/rv706/706/ry706/fRecy-QSend-0766/-V76-V因此在新架構(gòu)設(shè)計(jì)時(shí),采用了k8s高級(jí)調(diào)度特性podAffinity,配置同租戶應(yīng)用pod與數(shù)據(jù)庫(kù)pod之間的親和性,使同租戶的數(shù)據(jù)庫(kù)和web應(yīng)用盡量處于同工作節(jié)點(diǎn)上,利用節(jié)點(diǎn)本地網(wǎng)絡(luò)進(jìn)行交互,降低了原系統(tǒng)架構(gòu)中同租戶web應(yīng)用與數(shù)據(jù)庫(kù)之間的網(wǎng)絡(luò)損耗,并建議客戶為應(yīng)用設(shè)置了連接超時(shí)時(shí)間。五、改造創(chuàng)新點(diǎn)云原生化:采用云容器服務(wù)、容器鏡像服務(wù)等云原生服務(wù)能力,代替原有云主機(jī)自行部署Docker的模式,提升管理、使用上的便捷性。同時(shí)利用云平臺(tái)自身的穩(wěn)定性保障減少客戶運(yùn)維工作,為客戶運(yùn)維團(tuán)隊(duì)帶來(lái)極大運(yùn)維效率提升。云原生能力的引入,同時(shí)也為客戶帶來(lái)更貼合于云的業(yè)務(wù)持續(xù)發(fā)展模式。業(yè)務(wù)敏捷化:為客戶診斷需求、開(kāi)發(fā)、運(yùn)維端到端業(yè)務(wù)體系,挖掘開(kāi)發(fā)流程問(wèn)題,引入DevOps體系,從原有的在線IDE編輯模式變更為需求可控的管理模式。使客戶整個(gè)需求開(kāi)發(fā)流程可追溯、可還原,提升客戶需求管理便捷性、需求開(kāi)發(fā)效率,以及開(kāi)發(fā)問(wèn)題定位、問(wèn)題溯源的能力。系統(tǒng)架構(gòu)優(yōu)化:深入客戶業(yè)務(wù)系統(tǒng),為客戶進(jìn)行系統(tǒng)部署架構(gòu)的優(yōu)化,同時(shí)針對(duì)系統(tǒng)運(yùn)行狀況提供運(yùn)行診斷,排查應(yīng)用系統(tǒng)各個(gè)模塊、環(huán)節(jié),為客戶解決生產(chǎn)遺留問(wèn)題。通過(guò)系統(tǒng)架構(gòu)調(diào)優(yōu)、部署架構(gòu)優(yōu)化等方式,提升了客戶云上系統(tǒng)的穩(wěn)定性、健壯性。提升資源利用率:在原架構(gòu)下,一旦遇到容量問(wèn)題,則需要擴(kuò)展主機(jī)規(guī)格、數(shù)據(jù)盤,該模式,不僅操作十分復(fù)雜,也容易對(duì)業(yè)務(wù)產(chǎn)生影響,導(dǎo)致了前期規(guī)劃時(shí)需要冗余大量存儲(chǔ)、計(jì)算資源的必要性,直接表現(xiàn)為資源利用率較低。現(xiàn)將擴(kuò)容模式轉(zhuǎn)為橫向的WorkerNode擴(kuò)容,消除了大量冗余,提升整體資源利用率,同時(shí)更便于擴(kuò)容。六、改造收益對(duì)比原有架構(gòu),新架構(gòu)除了對(duì)擴(kuò)容模式進(jìn)行了優(yōu)化外,還帶來(lái)了以下提升:管理能力增強(qiáng):客戶自建Docker未引入容器管理工具,無(wú)法實(shí)現(xiàn)對(duì)容器的運(yùn)行狀態(tài)監(jiān)控,移動(dòng)云容器服務(wù)基于Kubernetes為客戶帶來(lái)容器監(jiān)控、管理能力,同時(shí)能夠通過(guò)配置心跳檢測(cè)、存活檢測(cè)來(lái)進(jìn)行容器自愈,提升運(yùn)維便捷性,使故障得以自動(dòng)發(fā)現(xiàn)、快速處理,故障處理及時(shí)率提升60%。資源利用率提升:將原云主機(jī)的算力拆分到多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)的利用率得到提升,CPU平均利用率從15%提升至45%。故障影響面縮小:云主機(jī)故障影響面從原來(lái)的全租戶影響縮小到只影響單租戶,故障影響范圍縮小80%。此外,得益于容器自愈能力,能夠?qū)⒐收瞎?jié)點(diǎn)容器在其他節(jié)點(diǎn)快速自動(dòng)拉起。 云優(yōu)化能力提升計(jì)劃2.湖州市綠色采購(gòu)服務(wù)平臺(tái)改造―、申報(bào)單位中國(guó)移動(dòng)通信集團(tuán)浙江有限公司湖州分公司、中國(guó)移動(dòng)通信集團(tuán)浙江有限公司二、 用戶簡(jiǎn)介湖州市聯(lián)合產(chǎn)權(quán)交易有限公司是一家專業(yè)從事國(guó)資交易服務(wù)、企事業(yè)單位采購(gòu)服務(wù)的地方性國(guó)有企業(yè)。經(jīng)營(yíng)范圍包括資產(chǎn)轉(zhuǎn)讓、股權(quán)轉(zhuǎn)讓、資產(chǎn)租賃、企業(yè)增資等國(guó)資交易服務(wù)和企業(yè)采購(gòu)、綠色交易服務(wù)等。公司在湖州市產(chǎn)權(quán)交易規(guī)范化、市場(chǎng)化、信息化、統(tǒng)一化發(fā)展中發(fā)揮了重要作用,其應(yīng)用的綠色采購(gòu)服務(wù)平臺(tái)加快推進(jìn)了要素資源市場(chǎng)化配置,是助力國(guó)資監(jiān)管、國(guó)企改革和數(shù)字化產(chǎn)業(yè)發(fā)展的關(guān)鍵之舉。后續(xù)將進(jìn)一步致力于建設(shè)統(tǒng)一、規(guī)范、高效的全省國(guó)有資產(chǎn)交易平臺(tái)。三、 需求分析客戶業(yè)務(wù)選擇上云,主要需求有如下三點(diǎn):高可用需求:湖州市綠色采購(gòu)服務(wù)平臺(tái)涉及市內(nèi)重要項(xiàng)目的招投標(biāo)業(yè)務(wù)、企業(yè)大型采購(gòu)業(yè)務(wù),因此平臺(tái)的穩(wěn)定性非常重要。遷移上云采用云原生理念部署之后,所有業(yè)務(wù)均部署在容器集群之中,具備高可用性,可以滿足業(yè)務(wù)的災(zāi)備、負(fù)載均衡和彈性伸縮需求。同時(shí)屏蔽底層計(jì)算資源差異,避免因此帶來(lái)的業(yè)務(wù)適配風(fēng)險(xiǎn)。擴(kuò)展性需求:平臺(tái)需要不斷迭代新功能和對(duì)接第三方平臺(tái),因此功能更新頻繁,用戶要求盡量降低新功能開(kāi)發(fā)周期和新功能發(fā)布對(duì)于正常業(yè)務(wù)的影響范圍。傳統(tǒng)軟件架構(gòu)為單體應(yīng)用,發(fā)布周期長(zhǎng),而且代碼改動(dòng)造成的影響也比較大。而遷移上云采用云原生理念部署之后,各模塊獨(dú)立部署、改動(dòng)和發(fā)布新功能,業(yè)務(wù)敏捷性更髙。運(yùn)維需求:平臺(tái)的平穩(wěn)運(yùn)行離不開(kāi)日常的運(yùn)維巡檢,但是用戶缺乏軟件運(yùn)維能力和底層設(shè)施運(yùn)維能力。遷移上云采用云原生理念部署之后,用戶可以將所2022 '2022 ',云遷移質(zhì)效優(yōu)秀案例有運(yùn)維工作移交給云上幵發(fā)運(yùn)維一體化DevOps體系,可以更加專注于釆購(gòu)平臺(tái)業(yè)務(wù)本身的內(nèi)容。四、實(shí)施方案湖州移動(dòng)聯(lián)系省公司云計(jì)算支撐中心基于云原生理念,釆用了微服務(wù)、Docker和容器化等技術(shù),為用戶構(gòu)筑了一個(gè)應(yīng)用可快速迭代、資源可彈性擴(kuò)展、部署快速高效的智能化釆購(gòu)交易服務(wù)平臺(tái)。湖州市綠色釆購(gòu)服務(wù)平臺(tái)首頁(yè)架構(gòu)介紹如下圖所示,本方案設(shè)計(jì)了一個(gè)基于云原生理念的一體化業(yè)務(wù)平臺(tái)。交易、網(wǎng)站、電商等主要軟件業(yè)務(wù)經(jīng)過(guò)拆分改造升級(jí)為微服務(wù)版本,均勻分布在Kubernetes集群中的各個(gè)pod上。原有物理服務(wù)器全部拆分改造為Kubernetes的管理、工作節(jié)點(diǎn),形成集群化的高可用方案。用戶可以通過(guò)dashboard智能面板監(jiān)測(cè)業(yè)務(wù)信息和軟件運(yùn)行指標(biāo)。常見(jiàn)的各類中間件、數(shù)據(jù)庫(kù)等可以在容器之間進(jìn)行調(diào)用共享,提高資源利用率。交易平臺(tái) ['(網(wǎng)站)[電商?][iKff][公用略)平臺(tái)架構(gòu)圖云優(yōu)化能力提升計(jì)劃關(guān)鍵能力微服務(wù)架構(gòu)微服務(wù)是將應(yīng)用的顆粒度做到最小,使之承擔(dān)對(duì)外服務(wù)的職責(zé),實(shí)現(xiàn)軟件開(kāi)發(fā)中一直追求的低耦臺(tái)+高內(nèi)聚。該架構(gòu)的好處就是按功能拆分后,服務(wù)解耦,內(nèi)聚更強(qiáng),變更更易。企業(yè)級(jí)容器云平臺(tái)容器是一個(gè)開(kāi)源的應(yīng)用容器引擎,將每個(gè)服務(wù)都被無(wú)差別地封裝在容器里,可以無(wú)差別地管理和維護(hù)。容器云平臺(tái)自下而上分別覆蓋了云計(jì)算的IaaS層和PaaS層涉及的各類問(wèn)題。既對(duì)接云計(jì)算底層資源池(例如IaaS),遵從云計(jì)算資源的統(tǒng)一管理和分配,又包括資源調(diào)度、服務(wù)編排、應(yīng)用部署、監(jiān)控日志、配置管理、存儲(chǔ)網(wǎng)絡(luò)管理、安全等。重點(diǎn)實(shí)現(xiàn)應(yīng)用開(kāi)發(fā)、應(yīng)用托管和應(yīng)用運(yùn)維的能力,使企業(yè)專注于業(yè)務(wù)邏輯開(kāi)發(fā),縮短業(yè)務(wù)迭代上線周期,優(yōu)化資源利用率,提高服務(wù)響應(yīng)效率。同時(shí)通過(guò)可視化的編排工具簡(jiǎn)化應(yīng)用部署流程、縮短上線周期。該平臺(tái)還提供自動(dòng)化運(yùn)維能力,減少人工成本、保障業(yè)務(wù)連續(xù)性。DevOps開(kāi)發(fā)運(yùn)維一體化平臺(tái)針對(duì)前期開(kāi)發(fā)需求和后期運(yùn)維實(shí)際需求,方案打造了DevOps后臺(tái)管理平臺(tái),實(shí)現(xiàn)于開(kāi)發(fā)運(yùn)維一體化協(xié)同運(yùn)行。平臺(tái)提供了需求管理、CICD流水線、代碼配置管理、制品管理、質(zhì)量管控等功能,提供了從計(jì)劃到測(cè)試的問(wèn)題持續(xù)集成過(guò)程,提供了從計(jì)劃到測(cè)試完成的過(guò)程持續(xù)發(fā)布過(guò)程,解決了從計(jì)劃到上線的持續(xù)部署過(guò)程,覆蓋了用戶提出價(jià)值到用戶使用并且監(jiān)控維護(hù)的端到端過(guò)程。通過(guò)DevOps平臺(tái),一方面實(shí)現(xiàn)了在制品的持續(xù)流動(dòng)、持續(xù)反饋,進(jìn)行持續(xù)優(yōu)化,讓質(zhì)量持續(xù)提高。另一方面實(shí)現(xiàn)了研發(fā)數(shù)據(jù)的度量管理,通過(guò)對(duì)團(tuán)隊(duì)的研發(fā)數(shù)據(jù)進(jìn)行定量分析,及時(shí)發(fā)現(xiàn)研發(fā)過(guò)程中的不足,有助于提高研發(fā)團(tuán)隊(duì)的效率和質(zhì)量。困難和解決思路2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 困難1:因?yàn)闃I(yè)務(wù)應(yīng)用較多,因此需要調(diào)試的容器數(shù)量多,但是客戶給的部署時(shí)間只有1個(gè)月,需要短時(shí)間內(nèi)實(shí)現(xiàn)部署聯(lián)調(diào)。解決思路:將應(yīng)用打包成容器鏡像的方式,通過(guò)容器屏蔽底層差異。幵發(fā)部署過(guò)程中無(wú)需考慮業(yè)務(wù)與底層操作系統(tǒng)的關(guān)系,從而實(shí)現(xiàn)業(yè)務(wù)的快速部署,實(shí)現(xiàn)應(yīng)用與操作系統(tǒng)的解耦。部署時(shí)間由30分鐘降到5分鐘內(nèi),自動(dòng)化部署操作比率可達(dá)90%,資源利用率均可達(dá)到85%以上。該方法降低了方案整體的部署時(shí)間,達(dá)到了用戶業(yè)務(wù)上線時(shí)限要求。困難2:用戶要求不斷添加新功能、系統(tǒng)版本迭代頻繁??蛻魪囊粠允嫉恼型稑?biāo)功能延伸為不見(jiàn)面招投標(biāo),再到后期的騰訊直播幵評(píng)標(biāo)現(xiàn)場(chǎng),需求不斷變化,因此需要持續(xù)幵發(fā)、測(cè)試和上線新功能。解決思路:本方案放棄傳統(tǒng)的階段性交付模式,改為持續(xù)交付方式,從而實(shí)現(xiàn)整個(gè)軟件發(fā)布流程的自動(dòng)化。用戶提出的每一個(gè)新需求都會(huì)觸發(fā)一個(gè)自動(dòng)化流程,即構(gòu)建、測(cè)試并提供更新。部署到實(shí)際生產(chǎn)環(huán)境的最終決定由幵發(fā)人員觸發(fā)。持續(xù)交付讓幵發(fā)團(tuán)隊(duì)能夠自動(dòng)構(gòu)建、測(cè)試并準(zhǔn)備代碼變更,以便發(fā)布到生產(chǎn)環(huán)境中,從而使軟件交付更加高效、快速。同時(shí)可將幵發(fā)人員從手動(dòng)任務(wù)中解放出來(lái),并且鼓勵(lì)有助于減少部署到客戶環(huán)境中的錯(cuò)誤和缺陷數(shù)量的行為,提高團(tuán)隊(duì)的工作效率。五、改造創(chuàng)新點(diǎn)創(chuàng)新點(diǎn):微服務(wù)改造:本方案基于云原生理念,將原本的軟件架構(gòu)進(jìn)行微服務(wù)改造,將原有的四個(gè)主干業(yè)務(wù)系統(tǒng)(交易、網(wǎng)站、電商、監(jiān)督),每個(gè)拆分成2-7個(gè)服務(wù)不等,均勻地部署在所屬容器中。各服務(wù)之間通過(guò)REST進(jìn)行通信,能支持多種語(yǔ)言,同時(shí)能夠跨客戶端。如下圖,針對(duì)釆購(gòu)交易服務(wù),客戶群體通過(guò)pc或者手機(jī)可以直接訪問(wèn)產(chǎn)品服務(wù),對(duì)應(yīng)的客戶端可以通過(guò)api網(wǎng)關(guān)進(jìn)行產(chǎn)品、訂單等等服務(wù)訪問(wèn)。各自服務(wù)之間可以在對(duì)應(yīng)容器內(nèi)獨(dú)立工作,互不影響。同時(shí)各自服務(wù)之間可以通過(guò)zookeeper之間檢測(cè)狀態(tài),確保整體業(yè)務(wù)正常運(yùn)行。云優(yōu)化能力提云優(yōu)化能力提H計(jì)劃10101 ■云優(yōu)化能力提云優(yōu)化能力提H計(jì)劃10101 ■ ⑤2.容器+K8S的全新PaaS服務(wù)本方案基于云原生理念,打造了容器+k8s的全新PaaS服務(wù)。該新型PaaS服務(wù)通過(guò)將虛擬化技術(shù)改造成容器技術(shù),充分利用了容器的隔離技術(shù),來(lái)提升啟動(dòng)時(shí)間和資源利用率,而在應(yīng)用管理層,則保留了原有的微服務(wù)應(yīng)用的管理范式,軟件廠家不必深入了解龐大而復(fù)雜的K8S來(lái)管理應(yīng)用。全新PaaS服務(wù)比IaaS提供了更細(xì)粒度的資源封裝能力,比傳統(tǒng)PaaS服務(wù)提供更多的開(kāi)箱即用的服務(wù)資源。全新PaaS服務(wù)能夠?qū)崿F(xiàn)應(yīng)用代碼、配置、運(yùn)行環(huán)境分離;并且提升軟件開(kāi)發(fā)交付效率,以及保障應(yīng)用的穩(wěn)定運(yùn)行使用。技術(shù)創(chuàng)新意義:基礎(chǔ)設(shè)施容器化通過(guò)將原先的云上基礎(chǔ)資源通過(guò)容器+K8S進(jìn)行改造升級(jí),屏蔽了底層資源、2022云遷移質(zhì)效優(yōu)秀案例 2022云遷移質(zhì)效優(yōu)秀案例 云優(yōu)化能力提升計(jì)劃云遷移質(zhì)效優(yōu)秀案例云遷移質(zhì)效優(yōu)秀案例操作系統(tǒng)對(duì)于業(yè)務(wù)部署的影響。后臺(tái)管理時(shí)只需要根據(jù)已有鏡像進(jìn)行容器的即時(shí)的創(chuàng)建、恢復(fù),即可完成業(yè)務(wù)運(yùn)行所需環(huán)境的搭建,極大的加快了業(yè)務(wù)幵發(fā)、上線速度。同時(shí)容器集群化部署保障了業(yè)務(wù)的高可用性。項(xiàng)目整體幵發(fā)部署周期從軟件業(yè)務(wù)微服務(wù)化原先單體式的軟件架構(gòu)改造升級(jí)為微服務(wù)內(nèi)核,各個(gè)模塊獨(dú)立部署、運(yùn)行和升級(jí)。最大限度降低了故障時(shí)的業(yè)務(wù)影響范圍,同時(shí)在后續(xù)業(yè)務(wù)升級(jí)時(shí),可以進(jìn)行單個(gè)微服務(wù)升級(jí),做到用戶0感知升級(jí)。得益于微服務(wù)架構(gòu),項(xiàng)目從幵始到實(shí)際運(yùn)行,期間經(jīng)過(guò)了約80余次功能變更,實(shí)際影響客戶業(yè)務(wù)的次數(shù)只有3次,新功能發(fā)布業(yè)務(wù)影響率小于3.75%。管理創(chuàng)新意義:幵發(fā)運(yùn)維一體化項(xiàng)目擺脫了原先的幵發(fā)、運(yùn)維各自為政的模式,將兩者有機(jī)結(jié)合。幵發(fā)深入運(yùn)維,密切關(guān)注運(yùn)維工具反饋的軟件運(yùn)行數(shù)據(jù),關(guān)心業(yè)務(wù)運(yùn)行日志,關(guān)心各個(gè)基礎(chǔ)設(shè)施的運(yùn)行狀態(tài)。從而更好地面向容器、K8S設(shè)計(jì)應(yīng)用,使得業(yè)務(wù)后期運(yùn)行更加穩(wěn)定,降低了系統(tǒng)故障概率。項(xiàng)目運(yùn)行3個(gè)多月以來(lái),因業(yè)務(wù)幵發(fā)或者運(yùn)維導(dǎo)致的業(yè)務(wù)中斷次數(shù)為0。釆購(gòu)交易透明化項(xiàng)目部署的綠色交易釆購(gòu)平臺(tái),通過(guò)將現(xiàn)有釆購(gòu)管理交易系統(tǒng)通過(guò)容器化部署,使得公幵招標(biāo)、邀請(qǐng)招標(biāo)、競(jìng)爭(zhēng)性談判等服務(wù)之間各自獨(dú)立,確保敏感數(shù)據(jù)不會(huì)被他人下載獲取,保證了整體采購(gòu)過(guò)程的公平性;應(yīng)用采用微服務(wù)架構(gòu)拆分并部署在移動(dòng)公有云杭州節(jié)點(diǎn)上,采購(gòu)、招投標(biāo)信息做到了公開(kāi)透明。六、改造收益通過(guò)應(yīng)用的云原生改造,主要取得了如下幾項(xiàng)收益:顯著提高了項(xiàng)目整體的計(jì)算利用率,降低了用戶IaaS層資源成本。通過(guò)K8S+容器化改造,將所有容器均勻地部署在各臺(tái)主機(jī)上。云主機(jī)的平均資源利用率普遍達(dá)到了50%左右的合理區(qū)間,既為業(yè)務(wù)高峰預(yù)留了緩存空間,又降低了客戶成本支出。降低了業(yè)務(wù)故障率,減小了因?yàn)榘姹镜鷮?duì)于業(yè)務(wù)的影響。通過(guò)開(kāi)發(fā)-運(yùn)維一體化管理,在開(kāi)發(fā)過(guò)程中及時(shí)發(fā)現(xiàn)并解決業(yè)務(wù)隱藏問(wèn)題。得益于微服務(wù)內(nèi)核,各項(xiàng)功能升級(jí)不影響客戶的正常業(yè)務(wù)。容器的高可用,則保證了業(yè)務(wù)故障期間業(yè)務(wù)的正常運(yùn)行。綜合評(píng)估,客戶整體系統(tǒng)可用性可達(dá)99.99%。極大地縮小了業(yè)務(wù)開(kāi)發(fā)周期,使得平臺(tái)上線時(shí)間得以提前2個(gè)月。容器鏡像快速部署降低了業(yè)務(wù)環(huán)境搭建時(shí)間,自動(dòng)化開(kāi)發(fā)流程降低了人力投入,減小了時(shí)間成本。3.基于云化PaaS平臺(tái)的數(shù)據(jù)融合和應(yīng)用建設(shè)―、申報(bào)單位中國(guó)移動(dòng)通信集團(tuán)內(nèi)蒙古有限公司二、 用戶簡(jiǎn)介中國(guó)移動(dòng)通信集團(tuán)內(nèi)蒙古有限公司成立于1999年,是屬于中國(guó)移動(dòng)通信集團(tuán)的分公司。在自治區(qū)黨委、政府、行業(yè)主管部門的指導(dǎo)以及中國(guó)移動(dòng)集團(tuán)公司的直接領(lǐng)導(dǎo)下,積極貫徹自治區(qū)以信息化帶動(dòng)工業(yè)化、實(shí)現(xiàn)經(jīng)濟(jì)跨越式發(fā)展的總體戰(zhàn)略,轉(zhuǎn)變思路,創(chuàng)新發(fā)展,努力把企業(yè)做大做強(qiáng),公司運(yùn)營(yíng)管理各項(xiàng)工作取得了可喜業(yè)績(jī)??蛻粢?guī)模不斷壯大,自治區(qū)每三個(gè)人中,就有一個(gè)是中國(guó)移動(dòng)客戶;累計(jì)上繳利稅16.8億元,為自治區(qū)經(jīng)濟(jì)社會(huì)發(fā)展做出了積極貢獻(xiàn)。多年跨越式發(fā)展,凝聚著全體員工的辛勤汗水,也詮釋了內(nèi)蒙古移動(dòng)對(duì)“創(chuàng)無(wú)限通信世界,做信息社會(huì)棟梁''企業(yè)使命的不懈追求。截至目前單位總?cè)藬?shù)1.5萬(wàn)余人,研發(fā)人員446人,主營(yíng)業(yè)務(wù)收入超過(guò)100億元,研發(fā)投入1.7億元,凈利潤(rùn)近8億元。公司依托領(lǐng)先的企業(yè)級(jí)大數(shù)據(jù)平臺(tái)和數(shù)據(jù)中臺(tái),成功打造了客流監(jiān)控、客戶畫像、信用評(píng)估、店面選址、廣告投放、輿情監(jiān)控等大數(shù)據(jù)核心能力。已成功為旅游、政府、金融、公安、交通等9個(gè)行業(yè)近百家客戶提供行業(yè)大數(shù)據(jù)服務(wù),大數(shù)據(jù)業(yè)務(wù)收入達(dá)3.5億。內(nèi)蒙古移動(dòng)充分發(fā)揮技術(shù)和資源優(yōu)勢(shì),大力推進(jìn)行業(yè)和中小企業(yè)信息化應(yīng)用,以移動(dòng)信息化的發(fā)展推動(dòng)社會(huì)信息化整體進(jìn)程。三、 需求分析作為建設(shè)新型基礎(chǔ)設(shè)施的國(guó)家隊(duì)和國(guó)家信息化建設(shè)的主力軍,中國(guó)移動(dòng)始終深入推進(jìn)全網(wǎng)云化進(jìn)程,“云''已成為中國(guó)移動(dòng)IT能力革新的新興動(dòng)力。回顧我公司上云歷程,其需求主要來(lái)自內(nèi)生及外在兩大方面:內(nèi)生需求:①成本驅(qū)動(dòng)。原有Gbase+Hadoop+Teradata等平臺(tái)類投資大,占總投資44%以上;維護(hù)成本高,人均維護(hù)設(shè)備數(shù)量達(dá)1000臺(tái)以上。?效率驅(qū)動(dòng)。原有ssh架構(gòu)陳舊,技術(shù)可擴(kuò)展性差,無(wú)法快速完成應(yīng)用系統(tǒng)的開(kāi)發(fā)及部署上線。且原平臺(tái)受規(guī)模限制,無(wú)法根據(jù)業(yè)務(wù)峰值進(jìn)行彈性伸縮,擴(kuò)容周期長(zhǎng)。創(chuàng)新驅(qū)動(dòng)。近幾年人口紅利消失,公司對(duì)于創(chuàng)新促發(fā)展的依賴性逐漸增強(qiáng),但本省工具組件單一,無(wú)法有效支撐自主創(chuàng)新研發(fā),IT賦能作用發(fā)揮不足。安全驅(qū)動(dòng)。原有ETL調(diào)度工具、數(shù)據(jù)展現(xiàn)BRIO等工具老舊,無(wú)后續(xù)版本,安全漏洞風(fēng)險(xiǎn)高。外在需求:①政策驅(qū)動(dòng):原有大數(shù)據(jù)域基于國(guó)外Teradata數(shù)據(jù)庫(kù)建設(shè),存在兼容性差、可擴(kuò)展性弱、擴(kuò)容費(fèi)用高、維護(hù)成本高等問(wèn)題,IT基礎(chǔ)設(shè)施國(guó)產(chǎn)化勢(shì)在必行。公司要求:集團(tuán)公司大力推進(jìn)全網(wǎng)云化進(jìn)程,要求集中化省份將省內(nèi)平臺(tái)、數(shù)據(jù)、計(jì)算、應(yīng)用等全量遷移至集中化云平臺(tái)。四、實(shí)施方案1.技術(shù)框架依托內(nèi)蒙古移動(dòng)私有云搭建的梧桐大數(shù)據(jù)平臺(tái),融合省內(nèi)B、0、M三域系統(tǒng)數(shù)據(jù)到梧桐集中化數(shù)據(jù)平臺(tái),利用平臺(tái)提供的工具、組件、調(diào)度等完成三域數(shù)據(jù)的融合、計(jì)算、展現(xiàn);實(shí)現(xiàn)系統(tǒng)集中管控、調(diào)度統(tǒng)一、安全統(tǒng)籌管理。整合利用平臺(tái)資源實(shí)現(xiàn)“批+流”數(shù)據(jù)一體化。遷移前后框架如下:云優(yōu)化能力提升計(jì)劃1 ■ 為云f尤化能71提升計(jì)劃同步數(shù)據(jù)流 為云f尤化能71提升計(jì)劃同步數(shù)據(jù)流互聯(lián)網(wǎng)/專線源端設(shè)備目標(biāo)設(shè)備控制端辦公電腦客戶平臺(tái)國(guó)資云平臺(tái)圖2遷移平臺(tái)運(yùn)行思路?需求收集.?開(kāi)發(fā)商確認(rèn).?資源申請(qǐng)1?系統(tǒng)遷移1?重保監(jiān)控?系統(tǒng)調(diào)研(如有)?網(wǎng)絡(luò)策略申請(qǐng)?實(shí)施備份策略?運(yùn)維接管?遷移評(píng)估?業(yè)主審核?割接演練?遷移驗(yàn)收?方案設(shè)計(jì)_/< i?正式上線>>遷移實(shí)施方案設(shè)計(jì)驗(yàn)收方案評(píng)審資源申請(qǐng)圖3廣州無(wú)線電集團(tuán)系統(tǒng)遷移過(guò)程圖4廣州無(wú)線電集團(tuán)系統(tǒng)遷移時(shí)間線遷移項(xiàng)目立項(xiàng)申請(qǐng)流程批準(zhǔn)通過(guò)后,成立了遷移項(xiàng)目組,啟動(dòng)系統(tǒng)遷移項(xiàng)目,通過(guò)調(diào)研和評(píng)估,進(jìn)行項(xiàng)目的具體規(guī)劃設(shè)計(jì),安排資深工程師進(jìn)行遷移,確保各應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)的安全運(yùn)營(yíng),保證業(yè)務(wù)連續(xù)性。在系統(tǒng)遷移割接前,進(jìn)行割接演練,制定相應(yīng)嚴(yán)謹(jǐn)?shù)幕赝朔桨?,遷移后原系統(tǒng)保留1個(gè)月,后續(xù)進(jìn)行利舊或資產(chǎn)報(bào)廢處理。系統(tǒng)遷移策略:遷移時(shí)遵循先易后難、先普通后重要原則進(jìn) ⑤ ⑤云優(yōu)化能力提H計(jì)劃 ⑤ ⑤云優(yōu)化能力提H計(jì)劃2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 行分批遷移;通用服務(wù)類的業(yè)務(wù)優(yōu)先遷移;存在依賴關(guān)系的業(yè)務(wù)系統(tǒng)整體切割;根據(jù)前期調(diào)研的結(jié)果,考慮到遷移需相關(guān)人員配合及遷移風(fēng)險(xiǎn)問(wèn)題,對(duì)所有的系統(tǒng)分4類進(jìn)行處理。(1) 關(guān)停系統(tǒng):與相關(guān)人員溝通后,關(guān)停日志服務(wù)器等37套不再使用的系統(tǒng)。(8月18日至8月31日)(2) 直接遷移上云:將虛擬化平臺(tái)上的黨建、官網(wǎng)等28套系統(tǒng)直接遷移至市國(guó)資云。(8月31日至10月31日,目前已完成20+套系統(tǒng)遷移)主要步驟依次為:1) 國(guó)資云平臺(tái)環(huán)境資源準(zhǔn)備(包括計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)等)。2) 根據(jù)不同應(yīng)用的系統(tǒng)和數(shù)據(jù)庫(kù)制定相應(yīng)的遷移操作步驟,如數(shù)據(jù)庫(kù)遷移時(shí)將生產(chǎn)數(shù)據(jù)庫(kù)服務(wù)器與目標(biāo)數(shù)據(jù)庫(kù)服務(wù)器分別部署遷移控制平臺(tái)Agent,由遷移控制平臺(tái)服務(wù)器進(jìn)行調(diào)度。3) 進(jìn)行數(shù)據(jù)同步、對(duì)比并進(jìn)行應(yīng)用測(cè)試。4) 確定割接時(shí)間點(diǎn),進(jìn)行割接和應(yīng)用驗(yàn)證。5) 現(xiàn)場(chǎng)保障3天,編寫整理遷移材料。6) 割接后若出現(xiàn)嚴(yán)重問(wèn)題并影響生產(chǎn),及時(shí)執(zhí)行應(yīng)急回退方案,并發(fā)現(xiàn)問(wèn)題。(3) 虛擬化上云:將物理機(jī)上的商貿(mào)服務(wù)器等20+套系統(tǒng)虛擬化遷移至國(guó)資云。(10月8日至11月30日)(4) 本地保留,通過(guò)遠(yuǎn)程納管的方式,實(shí)現(xiàn)統(tǒng)一的管理:對(duì)本地園區(qū)服務(wù)、時(shí)鐘服務(wù)、門禁梯控等對(duì)網(wǎng)絡(luò)時(shí)延、帶寬、服務(wù)器性能和本地操作要求較高的20+臺(tái)物理服務(wù)器,以及部署在虛擬化平臺(tái)上的10+套虛擬機(jī)系統(tǒng)搬遷到新機(jī)房。(9月5日至12月25日)3.部署超融合一體機(jī),實(shí)現(xiàn)國(guó)資云統(tǒng)一納管,達(dá)到上云目的根據(jù)集團(tuán)目前虛擬化平臺(tái)及存儲(chǔ)現(xiàn)狀,通過(guò)部署1套超融合一體機(jī)代替現(xiàn)有的VMWare虛擬化平臺(tái)及IBM存儲(chǔ),超融合一體機(jī)具備以下特性:(1) 數(shù)據(jù)多副本存儲(chǔ),數(shù)據(jù)可靠性可高達(dá)7個(gè)9(2) 去中心化架構(gòu),性能線性擴(kuò)展(3) 與自主虛擬化管理集成優(yōu)化,管理簡(jiǎn)單、性能更優(yōu)(4) 硬件錯(cuò)誤感知、數(shù)據(jù)快速自動(dòng)重建,比陣列更可靠(5) 支持虛擬機(jī)秒級(jí)快照(6) 虛擬機(jī)粒度QoS控制(7) 支持桌面虛擬化五、優(yōu)化創(chuàng)新點(diǎn)遷移方面:統(tǒng)一的WEB界面管理和監(jiān)控整個(gè)的遷移過(guò)程,遷移的各個(gè)環(huán)節(jié)一目了然。新服務(wù)器端模塊的的推送式安裝,切換到新服務(wù)器的一鍵操作均極大簡(jiǎn)化了遷移的復(fù)雜性。虛擬機(jī)/裸金屬在線遷移過(guò)程中,遷移過(guò)程不影響原機(jī)業(yè)務(wù)和性能;數(shù)據(jù)遷移支持多文件級(jí)復(fù)制任務(wù)技術(shù);通過(guò)DTS工具以最小化的停機(jī)時(shí)間進(jìn)行數(shù)據(jù)庫(kù)遷移。采用多種遷移工具和手段相結(jié)臺(tái),制訂嚴(yán)謹(jǐn)?shù)倪w移割接子方案,實(shí)現(xiàn)近0停機(jī)。服務(wù)人員全部本地化支撐,棘手問(wèn)題可隨時(shí)實(shí)地解決。必要時(shí)可安排三批人員24小時(shí)加班連續(xù)遷移。市國(guó)資云平臺(tái)為廣州市國(guó)資國(guó)企打造的國(guó)企專屬云,安全可靠,相比公有云,還可提供個(gè)性化定制服務(wù)。國(guó)資云的企業(yè)級(jí)私有云和多云管理兩大主要核心能力是針對(duì)企業(yè)在多云環(huán)境下IT基礎(chǔ)設(shè)施建設(shè)、運(yùn)維、管理復(fù)雜等問(wèn)題而提出的多云運(yùn)維管理解決方案,旨在幫助用戶更多效率的管理和使用分布在多云(多個(gè)私有云,多個(gè)公有云)場(chǎng)景下的IT基礎(chǔ)設(shè)施資源。用戶采用超融合一體機(jī)代替原有的VMWare虛擬化平臺(tái),僅需通過(guò)超融合服務(wù)器一體機(jī)加交換機(jī)的模式取代傳統(tǒng)架構(gòu)中幾十種物理設(shè)備,化繁為簡(jiǎn),不僅降低投入成本且減少后期運(yùn)維工作量。圖5超融合架構(gòu)與傳統(tǒng)架構(gòu)對(duì)比圖云優(yōu)化能力提升計(jì)劃2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 超融合一體機(jī)的優(yōu)勢(shì)如下:(1) 統(tǒng)一管理,精簡(jiǎn)運(yùn)維1) 云平臺(tái)統(tǒng)一管理,可視化運(yùn)維2) 支持動(dòng)態(tài)添加、積木式建設(shè)、線性高效擴(kuò)容3) 幵箱即用、快速部署(2) 性能提升1) 計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)一體化降低I/O延時(shí)2) 通過(guò)算法優(yōu)化存儲(chǔ)訪問(wèn),性能提升顯著3) 在線遷移高可用,保障業(yè)務(wù)萬(wàn)無(wú)一失由廣東運(yùn)通奇安科技(廣電運(yùn)通與奇安信等共同出資成立)進(jìn)行網(wǎng)絡(luò)安全運(yùn)營(yíng),釆用7層縱深防御架構(gòu),同時(shí)提供租戶級(jí)隔離防護(hù)、態(tài)勢(shì)感知分析。工作包括通過(guò)7*24小時(shí)全面、持續(xù)的安全監(jiān)測(cè),提供資產(chǎn)、威脅、脆弱性等方面的綜合分析服務(wù),精準(zhǔn)識(shí)別和監(jiān)測(cè)網(wǎng)絡(luò)中的安全威脅,并對(duì)確認(rèn)的威脅事件及時(shí)通知、主動(dòng)進(jìn)行響應(yīng),協(xié)助完成威脅事件的閉環(huán)處置工作,根據(jù)網(wǎng)絡(luò)安全態(tài)勢(shì),提供專業(yè)的安全規(guī)劃及改進(jìn)建議。六、遷移收益基于國(guó)資云平臺(tái),可水平、動(dòng)態(tài)擴(kuò)展平臺(tái)的存儲(chǔ)和計(jì)算,避免由于數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)導(dǎo)致系統(tǒng)計(jì)算能力入不敷出。遷移后按需付費(fèi),靈活擴(kuò)展,減少IT基礎(chǔ)投入,極大降低使用成本,降低機(jī)房至少50%的運(yùn)維成本。上云可更快地部署應(yīng)用程序和服務(wù),可按需擴(kuò)大和縮小資源規(guī)模,提高資源利用率,節(jié)約15%左右的IT投入成本。系統(tǒng)遷移到國(guó)資云,與現(xiàn)有的網(wǎng)絡(luò)及系統(tǒng)安全相比,國(guó)資云釆取了嚴(yán)格的措施來(lái)確保安全,保護(hù)數(shù)據(jù)免受攻擊,可以提供更高的安全性??梢钥焖俅蛲ú煌飘a(chǎn)品和服務(wù)之間的數(shù)據(jù)通道,為用戶業(yè)務(wù)運(yùn)營(yíng)提供了新的思路和功能,提高用戶運(yùn)營(yíng)效率。用戶原有業(yè)務(wù)系統(tǒng)涉及幾十個(gè)相關(guān)應(yīng)用,系統(tǒng)訪問(wèn)量激增會(huì)導(dǎo)致公用系統(tǒng)崩潰,同時(shí)原有的業(yè)務(wù)系統(tǒng)缺乏整體的運(yùn)維監(jiān)測(cè)體系,很多運(yùn)維工作依賴人工,一旦出現(xiàn)問(wèn)題,短時(shí)間內(nèi)很難解決,遷移上云后可顯著提高業(yè)務(wù)辦公系統(tǒng)的性能。12.富通云騰助力某省級(jí)電網(wǎng)公司云遷移最佳實(shí)踐―、申報(bào)單位富通云騰科技有限公司二、 用戶簡(jiǎn)介某省級(jí)電網(wǎng)有限責(zé)任公司負(fù)責(zé)該省電網(wǎng)的統(tǒng)一規(guī)劃、建設(shè)、管理和調(diào)度,承擔(dān)著該省內(nèi)電力供應(yīng)和西電東送雙重任務(wù)。供電面積20余萬(wàn)平方千米,供電戶數(shù)2000余萬(wàn)戶。三、 需求分析隨著該省電網(wǎng)業(yè)務(wù)的不斷發(fā)展,經(jīng)營(yíng)地域、企業(yè)規(guī)模的不斷擴(kuò)大,構(gòu)架于IT系統(tǒng)之上的統(tǒng)一管理、統(tǒng)一決策、統(tǒng)一運(yùn)營(yíng)成了必然趨勢(shì)。IT系統(tǒng)成為了企業(yè)的大腦和神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)中心成了一個(gè)企業(yè)運(yùn)營(yíng)的關(guān)鍵。一旦出現(xiàn)數(shù)據(jù)丟失、網(wǎng)絡(luò)中斷、數(shù)據(jù)服務(wù)停止,將導(dǎo)致企業(yè)所有分支機(jī)構(gòu)、網(wǎng)點(diǎn)和全部的業(yè)務(wù)處理停頓,或造成企業(yè)客戶數(shù)據(jù)的丟失,給企業(yè)帶來(lái)的經(jīng)濟(jì)損失可能是無(wú)法挽回的。這時(shí),系統(tǒng)的安全問(wèn)題自然成了重中之重,一個(gè)數(shù)據(jù)中心顯然不能讓用戶放心,這就是為什么越來(lái)越多的大型用戶開(kāi)始著手建立異地容災(zāi)中心的原因。容災(zāi)中心的建立,將為主數(shù)據(jù)中心提供一個(gè)“保險(xiǎn)”,一旦主數(shù)據(jù)中心出現(xiàn)問(wèn)題,容災(zāi)中心可以立即接管業(yè)務(wù),并在主數(shù)據(jù)中心恢復(fù)后將業(yè)務(wù)切回,以保證業(yè)務(wù)的不中斷,這對(duì)要求7x24小時(shí)不間斷業(yè)務(wù)的用戶來(lái)說(shuō)是十分必要的。可見(jiàn),信息安全是一個(gè)企業(yè)持續(xù)發(fā)展的重要保障,災(zāi)難備份與恢復(fù)因而成為企業(yè)最迫切需要解決的問(wèn)題之一,是現(xiàn)代企業(yè)積極應(yīng)對(duì)危機(jī)事件必要的技術(shù)和管理手段。四、 實(shí)施方案為滿足該省電網(wǎng)同城應(yīng)用級(jí)雙活數(shù)據(jù)中心建設(shè),根據(jù)整體目標(biāo)要求,在生產(chǎn)中心和災(zāi)備中心分別建立服務(wù)器虛擬化資源池,生產(chǎn)中心資源池使用VMware虛擬化產(chǎn)品;災(zāi)備中心資源池,使用華為FusionSphere虛擬化產(chǎn)品。兩中心實(shí)現(xiàn)大二層網(wǎng)絡(luò)打通,應(yīng)用服務(wù)基于軟件定義數(shù)據(jù)中心(SDDC)實(shí)現(xiàn)全虛擬化部署,數(shù)據(jù)庫(kù)實(shí)現(xiàn)PaaS平臺(tái)部署,對(duì)外實(shí)現(xiàn)應(yīng)用雙活??傮w部署方式如下圖所示ComputeCluster1ComputeClister1根據(jù)核心業(yè)務(wù)系統(tǒng)的實(shí)際情況,完成應(yīng)用級(jí)云災(zāi)備技術(shù)選型和方案設(shè)計(jì)工作。主要工作內(nèi)容包括:1、 大二層網(wǎng)絡(luò)選型:充分調(diào)研先進(jìn)的互聯(lián)網(wǎng)企業(yè)及兄弟單位,了解其網(wǎng)絡(luò)設(shè)計(jì)及建設(shè)方式,充分論證大二層網(wǎng)絡(luò)對(duì)當(dāng)前系統(tǒng)部署的影響,結(jié)合該省電網(wǎng)公司的IT網(wǎng)絡(luò)架構(gòu),以及應(yīng)用級(jí)云災(zāi)備中心恢復(fù)策略,對(duì)災(zāi)難恢復(fù)網(wǎng)絡(luò)架構(gòu)進(jìn)行設(shè)計(jì),確保發(fā)生災(zāi)難需要啟用同城應(yīng)用級(jí)云災(zāi)備中心時(shí),各業(yè)務(wù)單位和相關(guān)分子公司能夠快速有效地連接到同城云災(zāi)備中心的備份系統(tǒng)恢復(fù)業(yè)務(wù)。同時(shí)對(duì)比大二層網(wǎng)絡(luò)關(guān)鍵技術(shù),制定符合該省電網(wǎng)的同城應(yīng)用級(jí)容災(zāi)網(wǎng)絡(luò)建設(shè)方式。2、 數(shù)據(jù)復(fù)制系統(tǒng)技術(shù)選型及設(shè)計(jì)參照上級(jí)電網(wǎng)公司的同城應(yīng)用級(jí)云災(zāi)備建設(shè)指引的要求,結(jié)合IT架構(gòu)和數(shù)據(jù)情況,對(duì)應(yīng)用級(jí)云災(zāi)備中心可選的數(shù)據(jù)復(fù)制方案進(jìn)行設(shè)計(jì),確保同城數(shù)據(jù)復(fù)制方案能夠滿足災(zāi)難恢復(fù)指標(biāo)要求,符合上級(jí)電網(wǎng)公司云災(zāi)備導(dǎo)則的要求,并與上級(jí)電網(wǎng)公司統(tǒng)一的異地?cái)?shù)據(jù)集備份系統(tǒng)相兼容共同組成"兩地三中心”容災(zāi)架構(gòu)。3、 同城雙活及準(zhǔn)雙活系統(tǒng)設(shè)計(jì)及處理能力建議:結(jié)合IT架構(gòu)和恢復(fù)需求,對(duì)同城應(yīng)用級(jí)云災(zāi)備中心的軟硬件配置方案進(jìn)行設(shè)計(jì),包括服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、虛擬化等軟硬件產(chǎn)品的配置用途等。4、 災(zāi)難恢復(fù)方案設(shè)計(jì):針對(duì)不同的災(zāi)難場(chǎng)景,對(duì)數(shù)據(jù)、主機(jī)和網(wǎng)絡(luò)的恢復(fù)策略進(jìn)行分析和建議。5、 容災(zāi)系統(tǒng)監(jiān)控巡檢設(shè)計(jì):結(jié)合同城應(yīng)用級(jí)云災(zāi)備中心的建設(shè)級(jí)別,對(duì)同城云災(zāi)備中心所應(yīng)具備的監(jiān)控巡檢等級(jí)別要求予以建議。6、 軟硬件設(shè)備配置清單設(shè)計(jì):結(jié)合技術(shù)方案設(shè)計(jì),完成軟硬件配置清單梳理,明確主要軟硬件設(shè)備的基本技術(shù)要求。實(shí)施方案對(duì)容災(zāi)系統(tǒng)建設(shè)實(shí)施過(guò)程中的技術(shù)要求、實(shí)施要求、實(shí)施關(guān)鍵點(diǎn)、項(xiàng)目里程碑等提出建議,制定同城云災(zāi)備建設(shè)實(shí)施方案,以指導(dǎo)后續(xù)的技術(shù)實(shí)施工作。主要工作內(nèi)容包括:1、實(shí)施內(nèi)容及關(guān)鍵里程碑定義:針對(duì)云災(zāi)備方案設(shè)計(jì)及選型,對(duì)同城云災(zāi)備建設(shè)實(shí)施的工作內(nèi)容(包括軟硬件總集成實(shí)施和各個(gè)系統(tǒng)的遠(yuǎn)程集群實(shí)施、平臺(tái)/2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 云遷移質(zhì)效優(yōu)秀案例云遷移質(zhì)效優(yōu)秀案例應(yīng)用系統(tǒng)架構(gòu)遷移及改造、DNS改造、內(nèi)外部聯(lián)調(diào)測(cè)試等)進(jìn)行規(guī)劃,并明確實(shí)施過(guò)程中的關(guān)鍵內(nèi)容和關(guān)鍵里程碑,并對(duì)各項(xiàng)工作的職責(zé)主體和實(shí)施方案予以建議,以指導(dǎo)后續(xù)具體的云災(zāi)備建設(shè)實(shí)施工作。2、 實(shí)施推進(jìn)計(jì)劃編制:結(jié)合同城云災(zāi)備中心基礎(chǔ)實(shí)施的規(guī)劃和建設(shè)情況,以及云災(zāi)備方案和實(shí)際需求,為同城應(yīng)用級(jí)云災(zāi)備建設(shè)的時(shí)間安排和推進(jìn)方式進(jìn)行安排,包括各項(xiàng)工作的實(shí)施周期、依賴關(guān)系以及建議的實(shí)施時(shí)間,以指導(dǎo)后續(xù)同城應(yīng)用級(jí)云災(zāi)備建設(shè)實(shí)施。3、 實(shí)施驗(yàn)收方式建議:對(duì)同城云災(zāi)備系統(tǒng)建設(shè)實(shí)施完成后,如果進(jìn)行云災(zāi)備建設(shè)有效性的驗(yàn)證和驗(yàn)收的方式予以建議。五、優(yōu)化創(chuàng)新點(diǎn)VMware、FusionSphere是業(yè)界領(lǐng)先的服務(wù)器虛擬化解決方案,大幅提升數(shù)據(jù)中心基礎(chǔ)設(shè)施的效率。本項(xiàng)目的主要優(yōu)化創(chuàng)新點(diǎn)有:基于虛擬化/云環(huán)境為客戶建立了云災(zāi)備中心,在實(shí)現(xiàn)傳統(tǒng)災(zāi)備中心價(jià)值的基礎(chǔ)上,充分利用了云/虛擬化環(huán)境的動(dòng)態(tài)彈性、資源使用效率高的特點(diǎn),提高資源使用率43%,為云災(zāi)備中心提供了更高的性價(jià)比。建立了異構(gòu)的云生產(chǎn)中心和災(zāi)備中心體系架構(gòu),避免了品牌綁定,為異構(gòu)云環(huán)境的建立積累了經(jīng)驗(yàn),同時(shí)用戶提供了更大的靈活性。實(shí)現(xiàn)了數(shù)據(jù)庫(kù)系統(tǒng)由物理環(huán)境到云環(huán)境的遷移。利用虛擬化基礎(chǔ)設(shè)施的高可用和強(qiáng)恢復(fù)能力,實(shí)現(xiàn)業(yè)務(wù)快速自動(dòng)化故障恢復(fù),降低數(shù)據(jù)中心成本和增加系統(tǒng)應(yīng)用的正常運(yùn)行時(shí)間,業(yè)務(wù)恢復(fù)時(shí)間由小時(shí)級(jí)提高到分鐘級(jí)。幫助客戶成倍縮短業(yè)務(wù)上線周期。通過(guò)生產(chǎn)中心和災(zāi)備中心一體化的運(yùn)維體系,自動(dòng)化構(gòu)建業(yè)務(wù)應(yīng)用的生產(chǎn)和災(zāi)備環(huán)境,將業(yè)務(wù)系統(tǒng)上線的周期提升了50%以上。本項(xiàng)目中異構(gòu)云災(zāi)備系統(tǒng)的建立,提升了用戶業(yè)務(wù)的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。同時(shí)避免了單一品牌的綁定,為用戶提供了更大的云環(huán)境/虛擬化選擇的靈活性。建立的整體運(yùn)維體系為用戶建立的完整的業(yè)務(wù)應(yīng)用的部署架構(gòu),顯著提升了業(yè)務(wù)上線周期和業(yè)務(wù)規(guī)范性。利用虛擬化環(huán)境的資源彈性伸縮技術(shù)為業(yè)務(wù)量的變化提供了算力保證,同時(shí)提升了資源使用效率。富通公司積累的Oracle數(shù)據(jù)庫(kù)遷移六、遷移收益某省電網(wǎng)容災(zāi)建設(shè)政治效益該省級(jí)電網(wǎng)公司是國(guó)家能源戰(zhàn)略的重要組成部分,是能源產(chǎn)業(yè)鏈的重要環(huán)節(jié),是能源綜合運(yùn)輸體系的重要部門,加快建設(shè)以特高壓電網(wǎng)為骨干網(wǎng)架、各級(jí)電網(wǎng)協(xié)調(diào)發(fā)展的電網(wǎng)公司,對(duì)促進(jìn)我國(guó)能源資源優(yōu)化配置意義重大。該省級(jí)電網(wǎng)公司容災(zāi)建設(shè)有利于能源安全,所帶來(lái)的經(jīng)濟(jì)效益和社會(huì)效益同時(shí)也為公司的政治效益提供了良好的發(fā)展基礎(chǔ)。某省電網(wǎng)容災(zāi)建設(shè)經(jīng)濟(jì)效益該省級(jí)電網(wǎng)公司作為經(jīng)營(yíng)范圍遍及全省大部分城鄉(xiāng)、提供普遍服務(wù)的供電企業(yè),承擔(dān)著為電力客戶提供安全可靠充足的電力供應(yīng)和服務(wù)的基本職責(zé)。公司堅(jiān)持服務(wù)至上,以客戶為中心,不斷深化優(yōu)質(zhì)服務(wù),提高優(yōu)質(zhì)服務(wù)水平。公司的信息體系在企業(yè)生產(chǎn)、經(jīng)營(yíng)、管理等方面體現(xiàn)其越來(lái)越深層次的影響力。為了維護(hù)企業(yè)IT信息系統(tǒng)的健康穩(wěn)定發(fā)展,建設(shè)容災(zāi)系統(tǒng)是保障業(yè)務(wù)良好的可拓展性和可持續(xù)性發(fā)展的一種行之有效的方法。該省電網(wǎng)公司有著廣闊的經(jīng)營(yíng)范圍,外界環(huán)境狀況錯(cuò)綜復(fù)雜,自然災(zāi)害相對(duì)較大,容災(zāi)系統(tǒng)的建設(shè)可以有效防范風(fēng)險(xiǎn)、減少損失,提高業(yè)務(wù)連續(xù)性和高可用性,提高IT信息管理系統(tǒng)隨時(shí)應(yīng)對(duì)各種變化的能力。某省電網(wǎng)容災(zāi)建設(shè)社會(huì)效益容災(zāi)建設(shè)可以有效的保障該省電網(wǎng)公司的社會(huì)效益,無(wú)論是在對(duì)平時(shí)社會(huì)建設(shè)大力支持,還是在特殊災(zāi)害環(huán)境下的應(yīng)對(duì)措施,容災(zāi)系統(tǒng)可以有效降低公司核心IT系統(tǒng)所承受的沖擊,加快被損壞信息系統(tǒng)的恢復(fù),進(jìn)而增強(qiáng)整個(gè)電力網(wǎng)絡(luò)安全供電風(fēng)險(xiǎn)管理能力,有效促進(jìn)經(jīng)濟(jì)社會(huì)的可持續(xù)發(fā)展。在應(yīng)對(duì)各種困難和挑戰(zhàn)時(shí),IT系統(tǒng)是保障公司對(duì)復(fù)雜狀況進(jìn)行快速而準(zhǔn)確的判斷的重要環(huán)節(jié)。在IT系統(tǒng)的統(tǒng)籌調(diào)配下,公司可以更為合理的調(diào)配各項(xiàng)資金和人力資源,縮短救災(zāi)前的準(zhǔn)備和反應(yīng)時(shí)間,使公司的應(yīng)對(duì)措施條理化并得到有效執(zhí)行。從這個(gè)角度來(lái)分析,IT系統(tǒng)的業(yè)務(wù)可持續(xù)性運(yùn)作和災(zāi)難恢復(fù)能力就顯得尤為重要。當(dāng)緊急狀況發(fā)生時(shí),完善的信息災(zāi)難備份系統(tǒng)可以有效提高公司信息管理系統(tǒng)的抗干擾和損壞能力,保障公司在面臨突發(fā)狀況時(shí)能夠第一時(shí)間釆取行之有效的應(yīng)對(duì)措施,從而實(shí)現(xiàn)公司的社會(huì)責(zé)任和價(jià)值。云遷移質(zhì)效優(yōu)秀案例云遷移質(zhì)效優(yōu)秀案例云優(yōu)化能力提升計(jì)劃13.上汽上云架構(gòu)可觀測(cè)方案―、申報(bào)單位杭州笨馬網(wǎng)絡(luò)技術(shù)有限公司二、 用戶簡(jiǎn)介上汽乘用車作為制造行業(yè)下車聯(lián)網(wǎng)領(lǐng)域的頭部企業(yè),為了提供更好的服務(wù),車聯(lián)網(wǎng)業(yè)務(wù)開(kāi)始逐步上云,云上的彈性架構(gòu)讓應(yīng)用更具靈活性、彈性和擴(kuò)展性、在提高應(yīng)用的效率的同時(shí),也讓應(yīng)用的拓?fù)浼軜?gòu)和通訊變得更復(fù)雜,更難監(jiān)控。目前云體系市場(chǎng)上成熟方案prometheus監(jiān)控只具備最基礎(chǔ)的資源監(jiān)控功能,企業(yè)運(yùn)維如今缺乏手段獲得容器內(nèi)部的應(yīng)用狀態(tài)以及容器內(nèi)部應(yīng)用的東西流量訪問(wèn)情況。同時(shí)企業(yè)缺乏清晰的云上應(yīng)用訪問(wèn)可見(jiàn)性,運(yùn)維在云上也缺乏手段排查來(lái)自應(yīng)用本身或者不同應(yīng)用程序之間復(fù)雜交互的業(yè)務(wù)故障。三、 需求分析主要需求點(diǎn)如下:上汽乘用車用戶量龐大,日均數(shù)據(jù)量維持在億級(jí)以上,在如此大的數(shù)據(jù)量下,如何在業(yè)務(wù)上云后能夠清晰的知道容器內(nèi)部的應(yīng)用狀態(tài)以及容器內(nèi)部應(yīng)用的東西流量訪問(wèn)情況。車輛網(wǎng)業(yè)務(wù)存在多端一體化場(chǎng)景,整體業(yè)務(wù)架構(gòu)往往設(shè)計(jì)到移動(dòng)端、云、車機(jī)等多端,在多端一體化場(chǎng)景下,如何精準(zhǔn)串聯(lián)移動(dòng)端、云、車機(jī)各網(wǎng)關(guān)節(jié)點(diǎn)上的鏈路、梳理多端架構(gòu),會(huì)是一項(xiàng)巨大的挑戰(zhàn)。隨著用戶量的增加和業(yè)務(wù)場(chǎng)景增多,業(yè)務(wù)間調(diào)用邏輯的復(fù)雜化。如何梳理業(yè)務(wù)流程并追蹤流程,當(dāng)業(yè)務(wù)系統(tǒng)可用性出現(xiàn)問(wèn)題時(shí),無(wú)法準(zhǔn)確判斷是業(yè)務(wù)本身出問(wèn)題了還是IT系統(tǒng)異常導(dǎo)致的問(wèn)題。分布式、微服務(wù)架構(gòu)隨著業(yè)務(wù)云,變得越來(lái)越復(fù)雜,無(wú)論是對(duì)系統(tǒng)運(yùn)營(yíng)部門還是IT管理者還是系統(tǒng)的日常運(yùn)維甚至是新員工接手工作,都是一項(xiàng)巨大的挑戰(zhàn)。

四、實(shí)施方案1.技術(shù)框架通過(guò)一體化釆控建設(shè),為用戶建設(shè)統(tǒng)一監(jiān)控平臺(tái),平臺(tái)基于B/S架構(gòu),提供了良好的用戶體驗(yàn)和豐富的功能,以下為平臺(tái)架構(gòu)圖:(1)架構(gòu)介紹1) 釆集端:提供應(yīng)用探針和獨(dú)立進(jìn)程探針能力,部署于客戶環(huán)境內(nèi),完美適配云上容器環(huán)境,同時(shí)實(shí)現(xiàn)對(duì)應(yīng)用的零侵?jǐn)_、高性能的全量數(shù)據(jù)釆集能力;同時(shí)提供服務(wù)器、pod、kafka、redis、mysql等基礎(chǔ)設(shè)施的釆集能力;提供對(duì)云上業(yè)務(wù)系統(tǒng)的一體化釆集能力;2) 數(shù)據(jù)上報(bào):兼容OpenTelemetry、Jaeger等協(xié)議等數(shù)據(jù)上報(bào)能力;完美適配云上容器環(huán)境;3) 數(shù)據(jù)存儲(chǔ):提供prometheus、minio、mysql、clickhouse等存儲(chǔ)能力,用于實(shí)現(xiàn)指標(biāo)、日志、鏈路數(shù)據(jù)的存儲(chǔ);提供存儲(chǔ)層容器化解決方案,快速適配業(yè)務(wù)上云;4) 數(shù)據(jù)計(jì)算:實(shí)時(shí)大數(shù)據(jù)計(jì)算組件,包含F(xiàn)Link、Kafka等,此部分為平臺(tái)整體技術(shù)架構(gòu)中的關(guān)鍵難點(diǎn)能力。需確保用戶上百節(jié)點(diǎn)、每日十億級(jí)以上數(shù)據(jù)的處理、計(jì)算、聚合邏輯,支持業(yè)務(wù)層實(shí)時(shí)告警、鏈路分析、健康度分析、拓?fù)涞饶芰?,同步支持橫行擴(kuò)容;5)數(shù)據(jù)使用:平臺(tái)層基于底層數(shù)據(jù)源,實(shí)現(xiàn)上層的業(yè)務(wù)能力,包含:業(yè)務(wù)監(jiān)控、應(yīng)用監(jiān)控、主機(jī)監(jiān)控、中間件監(jiān)控、告警管理、自定義大盤、鏈路追蹤等業(yè)務(wù)功能。為業(yè)務(wù)上云提供完整的可觀測(cè)能力;6) 網(wǎng)關(guān)層:通過(guò)Nginx實(shí)現(xiàn)前后端通信;7) UI層:承載業(yè)務(wù)功能,提供各類頁(yè)面可視化的功能至用戶側(cè);(2)關(guān)鍵能力1) 統(tǒng)一采集:提供對(duì)云上業(yè)務(wù)系統(tǒng)的一體化采集能力,包含基礎(chǔ)設(shè)施、應(yīng)用等數(shù)據(jù)等統(tǒng)一采集能力,快速實(shí)現(xiàn)對(duì)上云業(yè)務(wù)的監(jiān)控;2) 業(yè)務(wù)健康分析:梳理上云業(yè)務(wù)的執(zhí)行步驟和不同業(yè)務(wù)間的調(diào)用關(guān)系,以及業(yè)務(wù)所關(guān)聯(lián)的應(yīng)用、中間件和基礎(chǔ)設(shè)施的性能指標(biāo),評(píng)估上云業(yè)務(wù)健康度,對(duì)可能影響業(yè)務(wù)系統(tǒng)可用性的因素進(jìn)行持續(xù)監(jiān)控,并在故障發(fā)生的第一時(shí)間通過(guò)告警通知相關(guān)人員,判斷故障原因并在第一時(shí)間解決。3) 拓?fù)淇梢暬好嫦蛟粕洗笠?guī)模分布式的微服務(wù)系統(tǒng),提供多維度的拓?fù)潢P(guān)系可視化能力,對(duì)于復(fù)雜的服務(wù)依賴及調(diào)用關(guān)系一眼掌握全局。4) 分布式鏈路追蹤:實(shí)時(shí)獲取分布式調(diào)用鏈路,可識(shí)別云上各容器內(nèi)應(yīng)用的調(diào)用關(guān)系,通過(guò)鏈路信息關(guān)聯(lián)業(yè)務(wù)日志、基礎(chǔ)設(shè)施信息,幫助用戶快速定位異常節(jié)點(diǎn)和耗時(shí)過(guò)長(zhǎng)接口。5) 性能剖析:性能剖析是代碼級(jí)的診斷工具,當(dāng)系統(tǒng)出現(xiàn)卡頓或者大量慢調(diào)用時(shí),以非常低的系統(tǒng)開(kāi)銷對(duì)容器內(nèi)對(duì)應(yīng)用實(shí)例進(jìn)行性能剖析,自動(dòng)捕獲慢調(diào)用的堆棧快照,采集線程狀態(tài),定位性能消耗最大的線程和方法。6) 智能告警:提供內(nèi)置開(kāi)箱即用的告警規(guī)則和自定義規(guī)則能力,當(dāng)觸發(fā)配置的告警規(guī)則時(shí),通過(guò)郵件、短信、webhook接口、工單、CallCenter等第三方系統(tǒng)實(shí)時(shí)推送,結(jié)合已知異常信息、故障性能數(shù)據(jù)、用戶投訴信息,快速進(jìn)行問(wèn)題定位。2022 '2022 ',云遷移質(zhì)效優(yōu)秀案例云優(yōu)化能力提升計(jì)劃2022云遷移質(zhì)效優(yōu)秀親例 2022云遷移質(zhì)效優(yōu)秀親例 7) 數(shù)據(jù)可視化:兼容幵源grafana數(shù)據(jù)結(jié)構(gòu),同時(shí)支持自定義能力,基于指標(biāo)和計(jì)算規(guī)則快速定義出云上監(jiān)控對(duì)象所需大盤,指標(biāo)運(yùn)行情況全盤掌握。8) 基礎(chǔ)設(shè)施監(jiān)控:默認(rèn)提供主流的服務(wù)器監(jiān)控、容器監(jiān)控、Kafka監(jiān)控、Redis監(jiān)控、Mysql監(jiān)控能力,并支持拓展其他中間件監(jiān)控能力,實(shí)時(shí)掌握云上服務(wù)的基礎(chǔ)資源運(yùn)行情況。(3)原子能力1) 指標(biāo):用于為上層各業(yè)務(wù)能力提供指標(biāo)能力,提供時(shí)序類數(shù)據(jù)的元數(shù)據(jù)管理能力;2) 日志:提供結(jié)構(gòu)化的日志數(shù)據(jù)的管理能力,通過(guò)日志中心實(shí)現(xiàn)各類日志數(shù)據(jù)的管理、聚合等能力;3) 鏈路:提供服務(wù)間調(diào)度信息的統(tǒng)一收集能力,用于支撐上層業(yè)務(wù)層鏈路追蹤功能;4) 配置中心:提供各類配置項(xiàng)的管理中心能力,實(shí)現(xiàn)保留、下發(fā)、變更配置項(xiàng)等上層業(yè)務(wù)能力;5) 自監(jiān)控能力:實(shí)現(xiàn)對(duì)平臺(tái)服務(wù)的統(tǒng)一監(jiān)控、管理能力;6) 標(biāo)簽中心:實(shí)現(xiàn)各類標(biāo)簽的統(tǒng)一管理能力;7) 用戶中心:平臺(tái)層用戶的管理、權(quán)限分配等原子能力;2.實(shí)施流程以及遇到的問(wèn)題(1)實(shí)施流程整體流程分為產(chǎn)品安裝、產(chǎn)品使用培訓(xùn)、部署應(yīng)用測(cè)試、正式使用等四大流程。1) 產(chǎn)品安裝:溝通整體平臺(tái)部署資源,要求客戶準(zhǔn)備相關(guān)部署服務(wù)器資源,并打通所需網(wǎng)絡(luò)端口,并準(zhǔn)備相關(guān)環(huán)境信息,完成產(chǎn)品部署;2) 產(chǎn)品使用培訓(xùn):在完成產(chǎn)品的安裝后,針對(duì)產(chǎn)品為客戶提供演示和使用培訓(xùn),培訓(xùn)主要目的為提高使用人員對(duì)平臺(tái)對(duì)了解以及明確平臺(tái)能力。包含:如何建設(shè)業(yè)務(wù)、如何部署探針、如何配置告警、鏈路追蹤、代碼級(jí)分析、排障路徑等;3) 部署應(yīng)用測(cè)試:完成產(chǎn)品使用培訓(xùn)后,選取幾個(gè)應(yīng)用,對(duì)探針進(jìn)行兼容性驗(yàn)證,確保鏈路、指標(biāo)、日志的采集能力。4)正式使用:在完成驗(yàn)證后,開(kāi)始批量推廣使用,逐步部署探針,完成平臺(tái)對(duì)所有應(yīng)用的接入監(jiān)控。(2)遇到的問(wèn)題問(wèn)題一:在部署應(yīng)用測(cè)試的過(guò)程中,遇到了上下行網(wǎng)關(guān)協(xié)議解析的問(wèn)題解決思路:針對(duì)無(wú)法串聯(lián)的上下行調(diào)用,與業(yè)務(wù)團(tuán)隊(duì)溝通討論,通過(guò)業(yè)務(wù)ID進(jìn)行鏈路串聯(lián)的方案,針對(duì)車聯(lián)網(wǎng)業(yè)務(wù)特性進(jìn)行適配,確保了完整鏈路的串聯(lián);問(wèn)題二:在正式使用過(guò)程中,遇到了云上業(yè)務(wù)高峰期數(shù)據(jù)量過(guò)大導(dǎo)致平臺(tái)接口響應(yīng)慢的問(wèn)題。解決思路:在平臺(tái)層通過(guò)部分?jǐn)?shù)據(jù)降采樣的操作,降低鏈路數(shù)據(jù)量;同時(shí),數(shù)據(jù)會(huì)隨著時(shí)間而慢慢降低價(jià)值,針對(duì)大量指標(biāo)及日志數(shù)據(jù),后臺(tái)進(jìn)行數(shù)據(jù)降準(zhǔn)優(yōu)化,將超長(zhǎng)時(shí)間的數(shù)據(jù)進(jìn)行壓縮后,存儲(chǔ)至Minio,形成冷熱數(shù)據(jù)區(qū)分,提高查詢效率。五、優(yōu)化創(chuàng)新點(diǎn)而隨著迭代速度的提升、架構(gòu)上云和業(yè)務(wù)不斷變得復(fù)雜,針對(duì)業(yè)務(wù)的運(yùn)維變得越來(lái)越復(fù)雜,業(yè)務(wù)流程經(jīng)過(guò)多個(gè)系統(tǒng)流轉(zhuǎn),數(shù)據(jù)鏈路復(fù)雜,傳統(tǒng)的監(jiān)控工具無(wú)法實(shí)現(xiàn)鏈路的追蹤及問(wèn)題的快速發(fā)現(xiàn),針對(duì)業(yè)務(wù)特性,如何實(shí)現(xiàn)車聯(lián)網(wǎng)云上業(yè)務(wù)上下網(wǎng)關(guān)的串聯(lián)、實(shí)現(xiàn)問(wèn)題快速發(fā)現(xiàn)及定位就成為了該項(xiàng)目的方向。針對(duì)上述問(wèn)題,平臺(tái)側(cè)提供以下優(yōu)化創(chuàng)新方案:1.創(chuàng)新點(diǎn)一:多端一體化場(chǎng)景的完整鏈路串聯(lián)針對(duì)車聯(lián)云上業(yè)務(wù)涉及到多端交互架構(gòu)復(fù)雜、行業(yè)內(nèi)產(chǎn)品無(wú)法適配OTA協(xié)議,對(duì)車端請(qǐng)求無(wú)法追蹤的問(wèn)題,XSky統(tǒng)一監(jiān)控平臺(tái)通過(guò)建設(shè)終端SDK、上下行鏈路串聯(lián)等能力,實(shí)現(xiàn)多端一體化的完整鏈路串聯(lián),為車聯(lián)業(yè)務(wù)提供完整視圖,實(shí)現(xiàn)多端架構(gòu)的可觀測(cè)能力。在該案例下,通過(guò)終端SDK研發(fā)及適配、網(wǎng)關(guān)、探針上下行網(wǎng)關(guān)適配能力,解決上述問(wèn)題:(1)終端SDK:基于標(biāo)準(zhǔn)的OpenTelemetry協(xié)議,幵發(fā)SDK能力,通過(guò)標(biāo)準(zhǔn)的API進(jìn)行SDK接入,支持原生OkHttp與Retrofit+RxJava,通過(guò)調(diào)用API的方式生成鏈路Span,完成終端的Span生成與上報(bào)能力;(2)網(wǎng)關(guān):作為代理服務(wù),提供集群部署能力;同時(shí)提供下發(fā)授權(quán)信息和對(duì)上報(bào)數(shù)據(jù)鑒權(quán)功能及對(duì)數(shù)據(jù)解密后轉(zhuǎn)發(fā)到指定的下游的能力;探針上下行網(wǎng)關(guān)適配:基于標(biāo)準(zhǔn)的OTA協(xié)議,在上下行網(wǎng)關(guān)tbox部署探針,通過(guò)對(duì)業(yè)務(wù)ID的識(shí)別與關(guān)聯(lián),實(shí)現(xiàn)上下行鏈路串聯(lián),實(shí)現(xiàn)在鏈路層,可追溯APP端、車機(jī)端、TBOX端請(qǐng)求鏈路,以用戶操作為聚合點(diǎn),聚合下行鏈路和上線鏈路,為車聯(lián)業(yè)務(wù)提供完整視圖。2.創(chuàng)新點(diǎn)二:應(yīng)用架構(gòu)拓?fù)渫ㄟ^(guò)統(tǒng)一采集能力,實(shí)現(xiàn)對(duì)云上應(yīng)用調(diào)用關(guān)系數(shù)據(jù)的采集,采集應(yīng)用間的所有調(diào)用,通過(guò)服務(wù)端的聚合處理,在平臺(tái)層統(tǒng)一呈現(xiàn)應(yīng)用維度的調(diào)用架構(gòu)圖,應(yīng)用拓?fù)淝逦宫F(xiàn)云上應(yīng)用調(diào)用關(guān)系,概覽系統(tǒng)全局。通過(guò)以上創(chuàng)新性能力建設(shè),實(shí)現(xiàn)在車聯(lián)網(wǎng)業(yè)務(wù)下的多端一體化可觀測(cè)能力,解決了在車聯(lián)網(wǎng)業(yè)務(wù)上云后無(wú)法梳理云上應(yīng)用架構(gòu)的痛點(diǎn),提高運(yùn)維效率200%,為車聯(lián)業(yè)務(wù)的穩(wěn)定性提供極大的保障。六、遷移收益引入XSky統(tǒng)一監(jiān)控平臺(tái)后,在業(yè)務(wù)上云的情況下,在運(yùn)維效率、故障發(fā)現(xiàn)時(shí)間、監(jiān)控覆蓋率上,均有了質(zhì)的提升。7*24小時(shí)監(jiān)控:引入平臺(tái)20+告警規(guī)則,實(shí)現(xiàn)對(duì)監(jiān)控對(duì)象的7*24小時(shí)監(jiān)控,提高運(yùn)維效率200%,提高故障發(fā)現(xiàn)時(shí)間200%;車聯(lián)網(wǎng)的行業(yè)往往涉及到多端,與車聯(lián)網(wǎng)業(yè)務(wù)開(kāi)發(fā)的合作調(diào)研,制定了一套基于eventID的事件模型,通過(guò)eventID、tbox網(wǎng)關(guān)插件,實(shí)現(xiàn)了上下行鏈路的串聯(lián),并持續(xù)孵化終端能力,實(shí)現(xiàn)車聯(lián)業(yè)務(wù)的端到端能力,以用戶操作為聚合點(diǎn),聚合下行鏈路和上線鏈路,為車聯(lián)業(yè)務(wù)提供完整視圖。監(jiān)控覆蓋率:監(jiān)控對(duì)象范圍主要包括車聯(lián)網(wǎng)應(yīng)用、主機(jī)、中間件等被監(jiān)控對(duì)象,整體接入云上車聯(lián)網(wǎng)應(yīng)用探針數(shù)80+、獨(dú)立探針200+,對(duì)車聯(lián)網(wǎng)服務(wù)的監(jiān)控覆蓋率達(dá)到了100%。云遷移質(zhì)效優(yōu)秀案例云遷移質(zhì)效優(yōu)秀案例云優(yōu)化能力提升計(jì)劃14.省級(jí)能源公司上云遷移一、 申報(bào)單位聯(lián)通數(shù)字科技有限公司二、 用戶簡(jiǎn)介某省級(jí)能源集團(tuán)有限公司是經(jīng)省委、省政府批準(zhǔn)組建的大型能源集團(tuán)。產(chǎn)業(yè)涉及能源、化工新材料、現(xiàn)代物貿(mào)、金融服務(wù)、智能制造等,主要分布在省內(nèi)14個(gè)轄市,以及新疆、貴州、內(nèi)蒙古、陜西、青海等?。▍^(qū))和澳大利亞。三、 需求分析該省級(jí)能源集團(tuán)公司業(yè)務(wù)復(fù)雜,包括A大廈機(jī)房和新建機(jī)房2個(gè)機(jī)房,包括VMware四個(gè)云池和部分物理服務(wù)器、一體機(jī)等,包括多種郵件、煤炭、化工多種政務(wù)系統(tǒng),涉及面廣,數(shù)據(jù)體量大。本次遷移包括:A大廈機(jī)房有三套Vmware云平臺(tái)加一套下屬B集團(tuán)的Vmware云平臺(tái),遷移至新建機(jī)房一套聯(lián)通云平臺(tái)上;共涉及11個(gè)業(yè)務(wù)系統(tǒng),服務(wù)器219臺(tái),其中虛擬機(jī)194臺(tái),物理機(jī)25臺(tái);共包括中間件13種、數(shù)據(jù)庫(kù)5種;遷移規(guī)劃期,客戶提出:能源集團(tuán)三套vmware云池和下屬公司一套vmware云池,運(yùn)維和運(yùn)營(yíng)不方便,希望優(yōu)化云池運(yùn)維和運(yùn)營(yíng);業(yè)務(wù)系統(tǒng)多樣復(fù)雜,部分業(yè)務(wù)系統(tǒng)分屬不同部門,部分業(yè)務(wù)系統(tǒng)屬于二級(jí)子公司;同時(shí)一些業(yè)務(wù)系統(tǒng)混用同一網(wǎng)段、流量沒(méi)有隔離;另外一些業(yè)務(wù)系統(tǒng)之間有互訪需求;針對(duì)客戶需求,我們建議:為優(yōu)化現(xiàn)有云資源運(yùn)維和運(yùn)營(yíng),將四套VMware云池虛擬機(jī)資源全部遷移到一套聯(lián)通云池上,利用聯(lián)通云云池自有運(yùn)維和運(yùn)營(yíng)界面實(shí)現(xiàn)全局統(tǒng)一運(yùn)維和運(yùn)營(yíng);就業(yè)務(wù)系統(tǒng)整體雜亂的情況,我們?yōu)榭蛻裘總€(gè)業(yè)務(wù)部門以及每個(gè)二級(jí)子公司規(guī)劃一個(gè)租戶;同時(shí)為能源集團(tuán)規(guī)劃一個(gè)租戶,公共服務(wù)(基礎(chǔ)架構(gòu)、郵件系統(tǒng)、通訊系統(tǒng))放在能源集團(tuán)這個(gè)租戶下,對(duì)于該租戶內(nèi)的不同業(yè)務(wù)系統(tǒng)通過(guò)劃分不同VPC進(jìn)行流量隔離;對(duì)于部分業(yè)務(wù)系統(tǒng)之間有流量互訪需求的,我們通過(guò)云間高速打通。四、實(shí)施方案遷移流程業(yè)務(wù)系統(tǒng)現(xiàn)狀調(diào)研一對(duì)業(yè)務(wù)系統(tǒng)的主機(jī)配置、操作系統(tǒng)、網(wǎng)絡(luò)配置、安全配置、資源現(xiàn)狀等內(nèi)容進(jìn)行調(diào)研;上云評(píng)估及云池選擇;制定遷移方案,方案內(nèi)容包括:確認(rèn)遷移方向、遷移工具、入云系統(tǒng)資源規(guī)劃、入云系統(tǒng)網(wǎng)絡(luò)規(guī)劃、入云系統(tǒng)安全規(guī)劃;遷移實(shí)施一按照跟用戶確認(rèn)過(guò)的遷移方案依序?qū)嵤?,包括遷移前準(zhǔn)備工作、制作遷移鏡像、安裝遷移工具server端和客戶端、上云遷移

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論