版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Cloudwiz智能化IT運(yùn)維分析平臺(tái)云興維智AIOPS
PLATFORM01公司介紹公司介紹云興維智(北京)科技有限公司是一家高科技軟件公司,致力于為企業(yè)數(shù)據(jù)中心和在線系統(tǒng)提供新一代高智能運(yùn)維服務(wù)軟件。公司研發(fā)設(shè)計(jì)高性能,高可靠性,高適用性,可大規(guī)模運(yùn)行的數(shù)據(jù)系統(tǒng),并在此基礎(chǔ)上引入數(shù)據(jù)分析和人工智能以提供市場(chǎng)上領(lǐng)先的自動(dòng)運(yùn)維功能和解決方案。公司是由數(shù)位長期在美國硅谷一線互聯(lián)網(wǎng)高科技公司工作的海歸技術(shù)專家和在中國的知名的高科技企業(yè)從事市場(chǎng)銷售的高管合作創(chuàng)立。目前在美國和中國北京都設(shè)有公司。團(tuán)隊(duì)介紹Cloudwiz專家團(tuán)隊(duì)創(chuàng)始團(tuán)隊(duì)有多年微軟、Twitter、亞馬遜、eBay知名互聯(lián)網(wǎng)公司里建造和運(yùn)維大數(shù)據(jù)系統(tǒng)的經(jīng)驗(yàn),合計(jì)超過50年的從業(yè)經(jīng)驗(yàn),負(fù)責(zé)超過60萬臺(tái)服務(wù)器節(jié)點(diǎn)的設(shè)計(jì)和運(yùn)維工作。核心業(yè)務(wù)運(yùn)維大數(shù)據(jù)平臺(tái),讓客戶能夠高效、智能和自動(dòng)運(yùn)維IT服務(wù)器和應(yīng)用。致力于故障定位時(shí)間縮短90%,down機(jī)時(shí)間減少80%,節(jié)省成本50%以上技術(shù)應(yīng)用核心技術(shù)已應(yīng)用于中國鐵路集團(tuán)總公司、國家電網(wǎng)及眾多的互聯(lián)網(wǎng)公司融資獲得國內(nèi)一線投資機(jī)構(gòu)如聯(lián)想的投資?,F(xiàn)有客戶國家電網(wǎng)上汽集團(tuán)思百吉集團(tuán)02IT運(yùn)維的現(xiàn)狀與挑戰(zhàn)背景介紹在線企業(yè)和云服務(wù)商的運(yùn)維故障噩夢(mèng):冰山一角信譽(yù)聲譽(yù)收益2010年10月22日、26日、30日,AWS谷歌AppEngine,蘋果iCloud先后出現(xiàn)故障2014年11月18日微軟Azure11小時(shí)故障2015年5月,6月支付寶阿里云先后出現(xiàn)故障2017年2月28日亞馬遜S35個(gè)小時(shí)故障2013年6月工商銀行大面積癱瘓1小時(shí)2015年5月28日攜程旅行網(wǎng)12小時(shí)的系統(tǒng)癱瘓2016年1月19日推特10個(gè)小時(shí)故障,損失7%市值=10億美金領(lǐng)域發(fā)展IT系統(tǒng)運(yùn)維發(fā)展歷程:簡(jiǎn)單的運(yùn)維工具/APM成為過去,智能運(yùn)維引領(lǐng)未來目前大部分企業(yè)運(yùn)維狀態(tài)AIOps(AlgorithmicITOperations)把機(jī)器學(xué)習(xí)、人工智能應(yīng)用在運(yùn)維領(lǐng)域ITILIT運(yùn)維管理網(wǎng)管AIOps智能運(yùn)維應(yīng)用業(yè)務(wù)運(yùn)維監(jiān)控未來企業(yè)運(yùn)維狀態(tài)人少、事多、責(zé)任大運(yùn)維人員IT設(shè)備和數(shù)據(jù)過去:運(yùn)維十到幾十臺(tái)設(shè)備IT運(yùn)維現(xiàn)狀運(yùn)維人員IT設(shè)備和數(shù)據(jù)目前/未來:運(yùn)維設(shè)備數(shù)量10倍-100倍增長IT運(yùn)維現(xiàn)狀基礎(chǔ)架構(gòu):云化應(yīng)用:微服務(wù)化雙態(tài)數(shù)據(jù)中心:傳統(tǒng)架構(gòu)+互聯(lián)網(wǎng)架構(gòu)全新架構(gòu)-系統(tǒng)復(fù)雜運(yùn)維對(duì)象:網(wǎng)絡(luò)、主機(jī)、OS、存儲(chǔ)、中間件、各類業(yè)務(wù)應(yīng)用數(shù)據(jù)多樣化:日志、指標(biāo)、告警、時(shí)間
…運(yùn)維對(duì)象、數(shù)據(jù)激增依賴工程師技能經(jīng)驗(yàn)跨部門運(yùn)維,責(zé)任界定困難業(yè)務(wù)的支撐對(duì)排障時(shí)效性要求更高排障困難-排障周期長IT運(yùn)維面臨的挑戰(zhàn)無法統(tǒng)一管理,快速查詢無法滿足企業(yè)合規(guī)需求查詢難分析難對(duì)比難人員利用率低故障根源定位難成本高,效率低業(yè)務(wù)投訴多,系統(tǒng)風(fēng)險(xiǎn)高數(shù)據(jù)管理故障定位數(shù)據(jù)分析運(yùn)維成本依賴專家手動(dòng)運(yùn)維03Cloudwiz智能運(yùn)維大數(shù)據(jù)平臺(tái)產(chǎn)品定位網(wǎng)絡(luò)系統(tǒng):NPM客戶端用戶體驗(yàn):APMSDK私有云,企業(yè)數(shù)據(jù)中心數(shù)據(jù)采集移動(dòng)App網(wǎng)銀客戶端客戶端手機(jī)銀行客戶端電商網(wǎng)站公共網(wǎng)絡(luò)動(dòng)力環(huán)境系統(tǒng)動(dòng)環(huán)數(shù)據(jù)日志數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)流程數(shù)據(jù)網(wǎng)絡(luò)數(shù)據(jù)關(guān)鍵業(yè)務(wù)系統(tǒng):日志服務(wù)客戶端核心信貸支付結(jié)算網(wǎng)銀……ITIL/ITOM可視化展現(xiàn)后臺(tái)配置管理智能運(yùn)維管理平臺(tái)標(biāo)準(zhǔn)數(shù)據(jù)接口智能分析監(jiān)控預(yù)警數(shù)據(jù)采集、管理操作系統(tǒng)數(shù)據(jù)庫、中間件應(yīng)用業(yè)務(wù)系統(tǒng)ITIL/ITOMCloudwiz:服務(wù)器端運(yùn)維數(shù)據(jù)、智能分析、監(jiān)控、管理問題解決優(yōu)化數(shù)據(jù)管理自動(dòng)化數(shù)據(jù)分析快速故障定位運(yùn)維提升業(yè)務(wù)后盾故障自動(dòng)恢復(fù)推薦解決方案問題解決-宕機(jī)
-重大故障,系統(tǒng)不可用-系統(tǒng)性能大幅下降快速定位故障快速發(fā)現(xiàn)問題根源和解決方案排障定位自動(dòng)檢測(cè)系統(tǒng)評(píng)測(cè)-
自動(dòng)發(fā)現(xiàn)異常和隱患-梳理不合理系統(tǒng)配置和架構(gòu)-安全隱患:端口攻擊,DDOS自動(dòng)異常檢測(cè),架構(gòu)梳理-
健康指數(shù)-拓?fù)淇傆[-KPI指標(biāo)評(píng)測(cè)系統(tǒng)整體態(tài)勢(shì)評(píng)測(cè)故障快速定位排除,防患于未然標(biāo)準(zhǔn)化產(chǎn)品功能對(duì)報(bào)警及異常事件,主動(dòng)利用模式識(shí)別找出關(guān)聯(lián)指標(biāo)和事件,快速定位問題。整合日志分析進(jìn)行診斷。對(duì)日志進(jìn)行聚類,對(duì)比和規(guī)律挖掘,突出有問題的日志。提供專業(yè)運(yùn)維知識(shí)庫。自反饋學(xué)習(xí)進(jìn)行故障根源定位。實(shí)時(shí)分析診斷專家報(bào)告智能發(fā)現(xiàn)問題分析數(shù)據(jù)的時(shí)域頻域,找出歷史規(guī)律,自動(dòng)發(fā)現(xiàn)異常。全面覆蓋所有數(shù)據(jù),無需設(shè)定固定閾值。長期分析診斷資源預(yù)測(cè)、容量規(guī)劃:消耗趨勢(shì),規(guī)劃資源,提供采購計(jì)劃指標(biāo)聚類分析,幫助運(yùn)維人員熟悉系統(tǒng)特性。提供專家報(bào)告,優(yōu)化系統(tǒng)、配置、架構(gòu),提升性能,發(fā)現(xiàn)隱患專家解決方案專家現(xiàn)場(chǎng)或遠(yuǎn)程視頻咨詢,定制貼身服務(wù)專業(yè)團(tuán)隊(duì)代客運(yùn)維全方位數(shù)據(jù)整合整合網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫、中間件、業(yè)務(wù)應(yīng)用的指標(biāo)、日志、事件。整合APM、NPM、BSM廠商和產(chǎn)品的數(shù)據(jù)。支持的常見服務(wù)的系統(tǒng)清單編號(hào)種類編號(hào)種類1系統(tǒng)2數(shù)據(jù)庫1.1WindowsServer2.1Oracle1.2Linux2.2Db21.3Aix2.3Sqlserver1.4Hpunix2.4mysql1.5Docker2.5postgresql1.6
JVM,GC2.6MongoDB
2.7Redis
2.8memcached3大數(shù)據(jù)平臺(tái)4中間件3.1Hadoop4.1Websphere3.2Hbase4.2Weblogic3.3Hive4.3Tuxedo3.4Spark4.4Apache3.5Storm4.5Tomcat3.6Kafka4.6Jboss3.7Flume4.7NGINX3.8Zookeeper4.8IIS3.9Elasticsearch4.9Rabbit-MQ5應(yīng)用服務(wù)4.10ExchangeServer5.1……
其他專門的數(shù)據(jù)收集和監(jiān)控能力:
1、進(jìn)程運(yùn)行狀態(tài)
2、服務(wù)及端口響應(yīng)
3、各類日志收集
4、各類運(yùn)維事件:部署、配置、變化
5、任何新的或定制服務(wù):產(chǎn)品采用插件定制模式,快速定制,2-5天產(chǎn)品價(jià)值專業(yè)的人做專業(yè)的事大幅提高運(yùn)維效率,同樣的預(yù)算創(chuàng)造更多業(yè)績(jī)運(yùn)維經(jīng)驗(yàn)和技術(shù)積累在我系統(tǒng)里,不怕牛人跑,不怕新人不上手低成本獲得國際先進(jìn)的運(yùn)維水平減少故障發(fā)生,增加營收運(yùn)維不成為公司業(yè)務(wù)和產(chǎn)品迭代的瓶頸對(duì)公司的價(jià)值對(duì)CTO/運(yùn)維總監(jiān)
的價(jià)值總體功能數(shù)據(jù)整合全面管理性能監(jiān)控?cái)?shù)據(jù)業(yè)務(wù)數(shù)據(jù)日志數(shù)據(jù)網(wǎng)絡(luò)數(shù)據(jù)機(jī)器學(xué)習(xí)智能分析異常自動(dòng)檢測(cè)關(guān)聯(lián)分析故障診斷拓?fù)浣Y(jié)構(gòu)和配置KPI提取和整體健康評(píng)判解決方案故障排除方案推薦系統(tǒng)自動(dòng)恢復(fù)容量分析預(yù)測(cè)安全部署流程基于Hadoop的大數(shù)據(jù)平臺(tái)及數(shù)據(jù)服務(wù)運(yùn)維知識(shí)庫及自反饋學(xué)習(xí)全方位監(jiān)控+智能分析排障+優(yōu)化解決方案=最好用的運(yùn)維工具多維度運(yùn)維數(shù)據(jù)整合關(guān)聯(lián)系統(tǒng)、應(yīng)用指標(biāo)日志,業(yè)務(wù)文件事件智能運(yùn)維處理分析系統(tǒng)智能解決方案–自動(dòng)發(fā)現(xiàn)異?,F(xiàn)代IT系統(tǒng)指標(biāo)眾多,運(yùn)維人員難以及時(shí)在其中發(fā)現(xiàn)問題隱患現(xiàn)代IT系統(tǒng)結(jié)構(gòu)復(fù)雜,運(yùn)維人員難以準(zhǔn)確推測(cè)出關(guān)鍵指標(biāo)的走勢(shì)和正常范圍問題和痛點(diǎn)解決方案利用大數(shù)據(jù)算法分析指標(biāo)歷史數(shù)據(jù),計(jì)算數(shù)據(jù)正常范圍和預(yù)測(cè)趨勢(shì)機(jī)器自動(dòng)標(biāo)注異常點(diǎn),可以靈活設(shè)置報(bào)警用戶標(biāo)注和自反饋算法提煉更精準(zhǔn)的算法模型智能解決方案–快速故障定位定位問題:指標(biāo)關(guān)聯(lián)算法定位問題于某個(gè)服務(wù)和節(jié)點(diǎn)分析問題:日志關(guān)聯(lián)整合、聚類、對(duì)比分析獲取更多信息,發(fā)現(xiàn)故障根源解決問題:不斷完善和獲取反饋的知識(shí)庫提供解決方案推薦智能解決方案–容量分析和預(yù)測(cè)展現(xiàn)資源使用現(xiàn)狀算法自動(dòng)計(jì)算和預(yù)測(cè)未來不同時(shí)間點(diǎn)的資源使用情況為企業(yè)提前規(guī)劃采購計(jì)劃存儲(chǔ)空間、內(nèi)存、CPU的消耗現(xiàn)狀及預(yù)測(cè)智能解決方案–專業(yè)的支持,專家報(bào)告和方案匯聚海內(nèi)外云計(jì)算、互聯(lián)網(wǎng)專家,從業(yè)十?dāng)?shù)年,曾就職于著名互聯(lián)網(wǎng)公司,硅谷和海歸回國。一流的專業(yè)服務(wù),提供現(xiàn)場(chǎng)或電話咨詢,實(shí)時(shí)支撐客戶各項(xiàng)技術(shù)需求。提供專家報(bào)告,優(yōu)化IT云架構(gòu)系統(tǒng)、服務(wù)配置、提升性能。提供最新的穩(wěn)定版本推薦,提供各大數(shù)據(jù)服務(wù)間匹配版本規(guī)范??傮w架構(gòu)模塊化設(shè)計(jì),標(biāo)準(zhǔn)數(shù)據(jù)讀寫接口,利于整合、融入生態(tài)系統(tǒng)展現(xiàn)層業(yè)務(wù)邏輯層數(shù)據(jù)存儲(chǔ)數(shù)據(jù)處理層數(shù)據(jù)采集層總覽綜合展現(xiàn)數(shù)據(jù)處理中間件探針操作系統(tǒng)應(yīng)用服務(wù)器(Tomcat,Weblogic)中間件(Redis,Mysql)熱數(shù)據(jù)緩存業(yè)務(wù)數(shù)據(jù)業(yè)務(wù)探針網(wǎng)絡(luò)網(wǎng)絡(luò)系統(tǒng)探針CPUJVM硬件環(huán)境及系統(tǒng)監(jiān)控I/O磁盤內(nèi)存值班管理處置流程運(yùn)維管理事件管理配置管理應(yīng)用健康健康評(píng)判資源計(jì)劃時(shí)序型數(shù)據(jù)庫智能分析運(yùn)維服務(wù)故障分析朔源自動(dòng)問題檢測(cè)標(biāo)準(zhǔn)數(shù)據(jù)接口時(shí)序型數(shù)據(jù)庫分布式海量存儲(chǔ)系統(tǒng)日志挖掘運(yùn)維知識(shí)庫運(yùn)維管理門戶\三方數(shù)據(jù)源ITSM其他分應(yīng)用展現(xiàn)日志收集器標(biāo)準(zhǔn)數(shù)據(jù)接口探針架構(gòu)運(yùn)行環(huán)境(ExecutionRuntime)Agent平臺(tái)主程序MainLoopFileWatcherSenderThreadRead/WriteQueueCollectorThreadParserUAgent升級(jí)配置ProcessWatcherMysqlcollectorWeblogicCollectorHBaseCollectorInit.dBuildDeployBatchDeploy04Cloudwiz部分功能展示統(tǒng)一監(jiān)控–總覽(高管駕駛艙)快速判斷系統(tǒng)健康,關(guān)鍵信息一覽無遺統(tǒng)一監(jiān)控–由粗到細(xì)系統(tǒng)服務(wù)機(jī)器進(jìn)程統(tǒng)一監(jiān)控–由粗到細(xì)系統(tǒng)服務(wù)機(jī)器進(jìn)程統(tǒng)一監(jiān)控–由粗到細(xì)統(tǒng)一監(jiān)控–指標(biāo)監(jiān)控(多種服務(wù),多種指標(biāo))統(tǒng)一監(jiān)控–日志監(jiān)控(全文搜索)智能報(bào)警–全面,靈活智能分析–故障溯源(學(xué)習(xí)故障歷史反饋,直接溯源根因)智能分析–關(guān)聯(lián)分析(關(guān)聯(lián)指標(biāo),事件,日志)
智能分析–日志分析(日志聚類,日志對(duì)比)智能分析–運(yùn)維知識(shí)庫(專業(yè)知識(shí)傳承共享)05Cloudwiz案例電網(wǎng)大數(shù)據(jù)平臺(tái)的各種服務(wù)及系統(tǒng)案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)HBaseHiveHadoopTomcatZookeeperStormSparkMySQLCentOSKafkaFlume案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)客戶HBase每過3-4天全面死機(jī),只能重啟,嚴(yán)重影響業(yè)務(wù)挖掘日志,發(fā)現(xiàn)死機(jī)前HBase節(jié)點(diǎn)出現(xiàn)長時(shí)間停頓,被zookeeper服務(wù)器誤診為此節(jié)點(diǎn)死亡匹配知識(shí)庫,找出原因?yàn)镠Base節(jié)點(diǎn)進(jìn)行內(nèi)存Swap,而更深層次的原因?yàn)榉?wù)器時(shí)鐘漂移提出解決方案供客戶選擇客戶采納建議進(jìn)行實(shí)施,徹底排除故障目標(biāo)一:為國家電網(wǎng)的智能電網(wǎng)戰(zhàn)略提供不間斷的、穩(wěn)定的大數(shù)據(jù)計(jì)算平臺(tái)問題和挑戰(zhàn):主要存儲(chǔ)服務(wù)HBase每隔幾天會(huì)出現(xiàn)宕機(jī),因?yàn)殄礄C(jī)經(jīng)常發(fā)生在半夜,運(yùn)維人員不能及時(shí)得到報(bào)警,造成大數(shù)據(jù)平臺(tái)長達(dá)數(shù)小時(shí)的停運(yùn),直接影響平臺(tái)上運(yùn)行的分析工作。因?yàn)椴荒芘挪閱栴}根源,此問題不斷發(fā)生。解決:指標(biāo)、日志整合分析查找故障根源,知識(shí)庫推薦解決方案。問題完全解決。配置報(bào)警規(guī)則,及時(shí)發(fā)現(xiàn)問題。服務(wù)器上CPU使用率被自動(dòng)探測(cè)出有異常升高,如紅點(diǎn)所示,cpu.usr在22:00-00:00和9:00左右25%,而平時(shí)一般在8%。需要找出原因。案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)目標(biāo)二:在運(yùn)維國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)過程中,及時(shí)發(fā)現(xiàn)、查找并解決可能造成重大問題的誤操作、誤配置等運(yùn)維問題。問題和挑戰(zhàn):如何及時(shí)發(fā)現(xiàn)問題并在短時(shí)間內(nèi)發(fā)現(xiàn)根源,對(duì)任何運(yùn)維團(tuán)隊(duì)都是一個(gè)極大的挑戰(zhàn)。解決:指標(biāo)的智能關(guān)聯(lián)分析能夠輔助運(yùn)維人員快速查找故障根源Cloudwiz系統(tǒng)自動(dòng)查找和匹配出相關(guān)聯(lián)的指標(biāo),提供故障根源推斷案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)目標(biāo)二:運(yùn)維國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)過程中及時(shí)發(fā)現(xiàn)、查找并解決可能造成重大問題的誤操作、誤配置等運(yùn)維問題。問題和挑戰(zhàn):如何及時(shí)發(fā)現(xiàn)問題并在短時(shí)間內(nèi)發(fā)現(xiàn)根源,對(duì)任何運(yùn)維團(tuán)隊(duì)都是一個(gè)極大的挑戰(zhàn)。。解決:指標(biāo)的智能關(guān)聯(lián)分析能夠輔助運(yùn)維人員快速查找故障根源選擇hbase.regionserver.server.writeRequestCount對(duì)比cpu.usr。兩條曲線非常吻合。說明cpu的升高是由于hbase的write數(shù)量增加引起的。客戶馬上意識(shí)到最近一個(gè)修改導(dǎo)致寫操作會(huì)增加。經(jīng)過修改以后,cpu正常下來。案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)目標(biāo)二:運(yùn)維國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)過程中及時(shí)發(fā)現(xiàn)、查找并解決可能造成重大問題的誤操作、誤配置等運(yùn)維問題。問題和挑戰(zhàn):如何及時(shí)發(fā)現(xiàn)問題并在短時(shí)間內(nèi)發(fā)現(xiàn)根源,對(duì)任何運(yùn)維團(tuán)隊(duì)都是一個(gè)極大的挑戰(zhàn)。解決:指標(biāo)的智能關(guān)聯(lián)分析能夠輔助運(yùn)維人員快速查找故障根源。上圖是可用磁盤空間的實(shí)時(shí)數(shù)據(jù)。下圖是統(tǒng)計(jì)的趨勢(shì)線。根據(jù)趨勢(shì),目前可用磁盤空間49GB在62天后用完。用戶可以及時(shí)安排應(yīng)急方案和設(shè)備采購計(jì)劃案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)目標(biāo)三:有效地進(jìn)行國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)的日常運(yùn)維工作,優(yōu)化架構(gòu),及時(shí)升級(jí)到最新且穩(wěn)定的版本以排出已知的問題。問題和挑戰(zhàn):對(duì)運(yùn)維團(tuán)隊(duì)的技術(shù)要求很高,一般團(tuán)隊(duì)較難在短時(shí)間內(nèi)達(dá)到,致使運(yùn)維面臨瓶頸解決:Cloudwiz的專家團(tuán)隊(duì)能夠與客戶的專業(yè)團(tuán)隊(duì)協(xié)同工作,幫助客戶的技術(shù)團(tuán)隊(duì)迅速成長,或者完全接手客戶的運(yùn)維工作。專家報(bào)告提供專門針對(duì)客戶系統(tǒng)的貼身診斷和優(yōu)化技術(shù)報(bào)告。案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)大數(shù)據(jù)系統(tǒng)不同服務(wù)最佳版本和版本間依賴性推薦、演進(jìn)方案目標(biāo)三:有效地進(jìn)行國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)的日常運(yùn)維工作,優(yōu)化架構(gòu),及時(shí)升級(jí)到最新且穩(wěn)定的版本以排出已知的問題。問題和挑戰(zhàn):對(duì)運(yùn)維團(tuán)隊(duì)的技術(shù)要求很高,一般團(tuán)隊(duì)較難在短時(shí)間內(nèi)達(dá)到,致使運(yùn)維面臨瓶頸解決:Cloudwiz的專家團(tuán)隊(duì)能夠與客戶的專業(yè)團(tuán)隊(duì)協(xié)同工作,幫助客戶的技術(shù)團(tuán)隊(duì)迅速成長,或者完全接手客戶的運(yùn)維工作。專家報(bào)告提供專門針對(duì)客戶系統(tǒng)的貼身診斷和優(yōu)化技術(shù)報(bào)告。案例:國家電網(wǎng)大數(shù)據(jù)平臺(tái)專家報(bào)告優(yōu)化系統(tǒng)、配置、架構(gòu),提升性能目標(biāo)三:有效地進(jìn)行國家電網(wǎng)大數(shù)據(jù)計(jì)算平臺(tái)的日常運(yùn)維工作,優(yōu)化架構(gòu),及時(shí)升級(jí)到最新且穩(wěn)定的版本以排出已知的問題。問題和挑戰(zhàn):對(duì)運(yùn)維團(tuán)隊(duì)的技術(shù)要求很高,一般團(tuán)隊(duì)較難在短時(shí)間內(nèi)達(dá)到,致使運(yùn)維面臨瓶頸解決:Cloudwiz的專家團(tuán)隊(duì)能夠與客戶的專業(yè)團(tuán)隊(duì)協(xié)同工作,幫助客戶的技術(shù)團(tuán)隊(duì)迅速成長,或者完全接手客戶的運(yùn)維工作。專家報(bào)告提供專門針對(duì)客戶系統(tǒng)的貼身診斷和優(yōu)化技術(shù)報(bào)告。案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)測(cè)試應(yīng)用系統(tǒng):售后管理系統(tǒng)(到站)、售后管理系統(tǒng)(上門)安裝部署:生產(chǎn)環(huán)境使用產(chǎn)品:大數(shù)據(jù)平臺(tái)、應(yīng)用健康分析目標(biāo)系統(tǒng)概況案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)目標(biāo)一:提供整體應(yīng)用系統(tǒng)的運(yùn)維監(jiān)控。對(duì)整個(gè)應(yīng)用系統(tǒng)從上到下(應(yīng)用,中間件,系統(tǒng))的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)可視化監(jiān)控,幫助運(yùn)維人員對(duì)整個(gè)系統(tǒng)一目了然。問題和挑戰(zhàn):應(yīng)用系統(tǒng)服務(wù)種類多,運(yùn)維數(shù)據(jù)來源多,包括各系統(tǒng)吐出來的指標(biāo)、日志、業(yè)務(wù)文本文件等。內(nèi)部團(tuán)隊(duì)肩負(fù)日常運(yùn)維的工作,沒有余力進(jìn)行研發(fā)。解決:Cloudwiz專長于對(duì)服務(wù)器端的各指標(biāo)、日志及業(yè)務(wù)數(shù)據(jù)進(jìn)行收集、呈現(xiàn)、整合和關(guān)聯(lián)分析,進(jìn)行快速交付。1.性能監(jiān)控?cái)?shù)據(jù):系統(tǒng)參數(shù)監(jiān)控案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)目標(biāo)一:提供整體應(yīng)用系統(tǒng)的運(yùn)維監(jiān)控。對(duì)整個(gè)應(yīng)用系統(tǒng)從上到下(應(yīng)用,中間件,系統(tǒng))的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)可視化監(jiān)控,幫助運(yùn)維人員對(duì)整個(gè)系統(tǒng)一目了然。問題和挑戰(zhàn):應(yīng)用系統(tǒng)服務(wù)種類多,運(yùn)維數(shù)據(jù)來源多,包括各系統(tǒng)吐出來的指標(biāo)、日志、業(yè)務(wù)文本文件等。內(nèi)部團(tuán)隊(duì)肩負(fù)日常運(yùn)維的工作,沒有余力進(jìn)行研發(fā)。解決:Cloudwiz專長于對(duì)服務(wù)器端的各指標(biāo)、日志及業(yè)務(wù)數(shù)據(jù)進(jìn)行收集、呈現(xiàn)、整合和關(guān)聯(lián)分析,進(jìn)行快速交付。2.采集業(yè)務(wù)數(shù)據(jù)
業(yè)務(wù)數(shù)據(jù)文件:記錄文件上傳狀態(tài),進(jìn)行解析$cat~/viz/oneAPM_data/Log/fcheck_2016-09-08.txt0:01---->Wait文件[0],06文件[1],TCP連接[32].0:02---->Wait文件[0],06文件[0],TCP連接[5].
正在上傳文件數(shù)量等待上傳文件數(shù)量TCP鏈接數(shù)量業(yè)務(wù)數(shù)據(jù)文件解析展示:記錄文件上傳狀態(tài)案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)目標(biāo)一:提供整體應(yīng)用系統(tǒng)的運(yùn)維監(jiān)控。對(duì)整個(gè)應(yīng)用系統(tǒng)從上到下(應(yīng)用,中間件,系統(tǒng))的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)可視化監(jiān)控,幫助運(yùn)維人員對(duì)整個(gè)系統(tǒng)一目了然。問題和挑戰(zhàn):應(yīng)用系統(tǒng)服務(wù)種類多,運(yùn)維數(shù)據(jù)來源多,包括各系統(tǒng)吐出來的指標(biāo)、日志、業(yè)務(wù)文本文件等。內(nèi)部團(tuán)隊(duì)肩負(fù)日常運(yùn)維的工作,沒有余力進(jìn)行研發(fā)。解決:Cloudwiz專長于對(duì)服務(wù)器端的各指標(biāo)、日志及業(yè)務(wù)數(shù)據(jù)進(jìn)行收集、呈現(xiàn)、整合和關(guān)聯(lián)分析,進(jìn)行快速交付。3、轉(zhuǎn)化日志數(shù)據(jù):
解析格式化日志文件,提取監(jiān)控指標(biāo)[dell_server_1]#tail-faccess.log82--[07/Sep/2016:09:46:00+0800]"GET/dell/codebase/jq1.7/jquery-1.7.2.jsHTTP/1.1"304083--[07/Sep/2016:09:46:00+0800]"GET/dell/wxzy/wxd.jsp?orderno=80906808312HTTP/1.1"200083--[07/Sep/2016:09:27:59+0800]"POST/dell/input_serviceactionHTTP/1.1"3010
訪問客戶IP訪問時(shí)間訪問類型訪問結(jié)果轉(zhuǎn)化日志數(shù)據(jù)展示:案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)目標(biāo)二:提升運(yùn)維效率,幫助運(yùn)維人員發(fā)現(xiàn)指標(biāo)規(guī)律并進(jìn)行異常的提前預(yù)警。問題和挑戰(zhàn):數(shù)據(jù)種類多,數(shù)據(jù)量大,運(yùn)維人員難以手工完成上述任務(wù)。解決:Cloudwiz的主動(dòng)智能運(yùn)維功能,自動(dòng)利用歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)規(guī)律并預(yù)測(cè)系統(tǒng)的運(yùn)行指標(biāo),提前發(fā)現(xiàn)異常問題并報(bào)警?;诖髷?shù)據(jù)分析的異常自動(dòng)檢測(cè)報(bào)警問題發(fā)現(xiàn):業(yè)務(wù)文件上傳出現(xiàn)堵塞這個(gè)點(diǎn)比平時(shí)這個(gè)時(shí)刻的值高出很多,表示這個(gè)時(shí)刻的文件上傳數(shù)比平時(shí)高這兩個(gè)點(diǎn)比規(guī)律值低出很多,表示這個(gè)時(shí)刻的文件上傳數(shù)比平時(shí)低案例:中國鐵路集團(tuán)總公司應(yīng)用系統(tǒng)目標(biāo)二:提升運(yùn)維效率,幫助運(yùn)維人員發(fā)現(xiàn)指標(biāo)規(guī)律并進(jìn)行異常的提前預(yù)警。問題和挑戰(zhàn):數(shù)據(jù)種類多,數(shù)據(jù)量大,運(yùn)維人員難以手工完成上述任務(wù)。解決:Cloudwiz的主動(dòng)智能運(yùn)維功能,自動(dòng)利用歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)規(guī)律并預(yù)測(cè)系統(tǒng)的運(yùn)行指標(biāo),提前發(fā)現(xiàn)異常問題并報(bào)警。問題發(fā)現(xiàn):服務(wù)器負(fù)載不均衡,外部服務(wù)訪問在不同服務(wù)器節(jié)點(diǎn)上不均衡案例:中國鐵路集團(tuán)總公司
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度古樹遷移與移植合同3篇
- 2025關(guān)于車輛合作協(xié)議合同范文
- 2024汽油運(yùn)輸及環(huán)保處理綜合服務(wù)合同3篇
- 2025房地產(chǎn)按揭合同研究
- 2025年度酒吧股份收益權(quán)轉(zhuǎn)讓及監(jiān)管服務(wù)合同3篇
- 2025版新材料研發(fā)與生產(chǎn)線改造借款合同3篇
- 二零二五年度安全認(rèn)證危險(xiǎn)化學(xué)品運(yùn)輸合同范本3篇
- 2025企業(yè)的刑事委托合同范本
- 二零二五年度廠房租賃合同補(bǔ)充協(xié)議:關(guān)于租賃合同備案登記及解除及續(xù)簽及終止及違約責(zé)任及稅費(fèi)承擔(dān)3篇
- 2025年度機(jī)器設(shè)備購買與技術(shù)引進(jìn)合同6篇
- (完整版)人教版高中物理新舊教材知識(shí)對(duì)比
- 最好用高速公路機(jī)電維修手冊(cè)
- 家庭管理量表(FaMM)
- 土默特右旗高源礦業(yè)有限責(zé)任公司高源煤礦2022年度礦山地質(zhì)環(huán)境年度治理計(jì)劃
- 【金屬非金屬礦山(地下礦山)安全管理人員】考題
- 腰椎間盤突出癥的射頻治療
- 神經(jīng)外科手術(shù)的ERAS管理策略
- mt煤礦用氮?dú)夥罍缁鸺夹g(shù)
- ASTM-B117-16-鹽霧實(shí)驗(yàn)儀的標(biāo)準(zhǔn)操作規(guī)程(中文版)
- 【超星爾雅學(xué)習(xí)通】《老子》《論語》今讀網(wǎng)課章節(jié)答案
- 配電箱采購技術(shù)要求
評(píng)論
0/150
提交評(píng)論