




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 NC v6.1 NMC技術使用手冊NC v6.1 NMC技術使用手冊 UAP中心 編著目錄第一章開始使用NMC41.1概述41.1.1名詞解釋41.1.2技術架構51.1.3監(jiān)控服務之間的關系61.1.4核心特性61.1.5帶來的好處61.1.6基于NMC的插件開發(fā)71.2部署和使用71.2.1單機的部署71.2.2集群的部署71.2.3 WAS啟用安全管理81.2.4服務器端主要的配置文件91.2.5服務器端部署的幾個注意事項91.2.6 NMC客戶端的獲取101.2.7啟動客戶端101.2.8客戶端使用的幾種模式111.2.9利用郵件傳輸協(xié)議進行遠程監(jiān)控111.2.10客戶端主要的配置文
2、件13第二章實時監(jiān)控142.1概述142.2 OverView142.2.1功能概述152.2.2參數(shù)152.2.3詳細功能介紹152.3進程監(jiān)控162.3.1功能概述172.3.2參數(shù)172.3.3詳細功能介紹182.4線程監(jiān)控222.4.1功能概述222.4.2參數(shù)222.4.3詳細功能介紹232.5數(shù)據(jù)庫監(jiān)控272.5.1功能概述272.5.2參數(shù)282.5.3詳細功能介紹292.6客戶端監(jiān)控312.6.1功能概述322.6.2參數(shù)322.6.3 NC系統(tǒng)的配置322.6.4詳細功能介紹342.7CPU352.7.1功能概述352.7.2參數(shù)362.7.3詳細功能介紹362.8內存監(jiān)控3
3、72.8.1功能概述372.8.2參數(shù)372.8.3詳細功能介紹382.9緩存監(jiān)控382.9.1功能概述382.9.2參數(shù)382.9.3詳細功能介紹382.10最佳實踐392.10.1不同背景的人的監(jiān)控策略392.10.2以問題為中心的監(jiān)控實踐39第三章離線分析413.1概述413.2消息中心423.2.1功能概述423.2.2參數(shù)433.2.3詳細功能介紹443.3日志抽取503.3.1功能概述513.3.2參數(shù)513.3.3詳細功能介紹513.4日志錄制553.4.1功能概述553.4.2參數(shù)563.4.3詳細功能介紹563.5日志分析573.5.1功能概述583.5.2參數(shù)583.5.3
4、詳細功能介紹593.6最佳實踐62第四章集群管理644.1概述644.2安全設置644.2.1功能概述654.2.2參數(shù)654.2.3詳細功能介紹654.3進程管理654.3.1功能概述664.3.2參數(shù)664.3.3詳細功能介紹664.4典型模型層元素664.4.1功能概述674.4.2參數(shù)674.4.3詳細功能介紹674.5補丁管理674.5.1功能概述684.5.2參數(shù)694.5.3詳細功能介紹694.6最佳實踐72第一章 開始使用NMCUAP 技術紅皮書系列 第74 / 51頁本章內容概要:l 概述l 部署和使用1.1概述要保障規(guī)模不斷擴大的應用并保障穩(wěn)定高效,服務器集群和負載均衡是必
5、由之路,開始集群站點在個數(shù)位時可以人工進行管理,但當站點變成幾十、幾百時,靠人工來管理和維護無疑成為災難,于是自動化、智能型、可視化的主動監(jiān)控系統(tǒng)-NMC應運而生。NMC是先進的性能監(jiān)控、性能分析、系統(tǒng)管理平臺。NMC將極大地提高性能監(jiān)控、性能分析、系統(tǒng)管理的效率,從而獲得更好的服務質量和客戶滿意度。對于大規(guī)模的復雜的IT系統(tǒng),NMC將變得不可或缺。在監(jiān)控方面,它融入了先進的性能監(jiān)控思想,比如分布式監(jiān)控服務、多層穿透、信息采集和分析分離、事件驅動的快照機制等,監(jiān)控的對象覆蓋了NC性能關注的所有方面,包括數(shù)據(jù)庫,中間件,客戶端等等。在性能分析方面,它具有強大的日志抽取、分析能力,提供了豐富的圖表
6、展現(xiàn)功能,可以對NC、JVM、線程、快照、CPU、內存,客戶端,在線用戶等日志進行抽取和分析,同時預置了大量的分析模型。在系統(tǒng)管理方面,它采用了主動發(fā)現(xiàn)主動管理的思想,可以在中間件出現(xiàn)故障時主動管理,從而提高系統(tǒng)可靠性;集成的補丁管理工具可以幫助管理員對補丁進程快速部署和回滾,極大提高集群環(huán)境下補丁管理的效率。1.1.1名詞解釋監(jiān)控域:一個服務中心和一組受管于這個服務中心的監(jiān)控實例的集合。這些監(jiān)控實例可以分布在多個物理服務器上。監(jiān)控實例由一組監(jiān)控服務組成。在一個監(jiān)控域中,所有的監(jiān)控實例管理的監(jiān)控服務都將其監(jiān)控資源通過服務管理器向服務中心注冊,監(jiān)控服務資源由服務中心統(tǒng)一對外發(fā)布。服務中心(Ser
7、vice Center) :一個監(jiān)控域的核心管理進程,用于注冊監(jiān)控域內所有的服務資源,同時提供服務啟動控制、訪問日志、服務請求路由、安全檢查、動態(tài)參數(shù)刷新功能。一個監(jiān)控域內有且只有一個服務中心,所有的監(jiān)控實例必須設置服務中心服務器。監(jiān)控客戶端只需要連接服務中心服務器即可訪問整個監(jiān)控域的服務資源。監(jiān)控域和服務中心關系如圖1-1:圖1.1監(jiān)控域-服務中心的關系消息:監(jiān)控服務產(chǎn)生的警告。消息可以驅動生成快照。比如,線程監(jiān)控發(fā)現(xiàn)某個任務執(zhí)行時間超過3分鐘,于是產(chǎn)生一條消息。這條消息驅動生成了中間件和數(shù)據(jù)庫的快照??煺眨簩ο到y(tǒng)運行時生成的詳細的運行態(tài)信息。這些信息用于幫助具體地定位問題。比如中間件的線程
8、詳細堆棧,SQL堆棧。數(shù)據(jù)庫的執(zhí)行計劃等??煺障⒔壎?。1.1.2技術架構圖1.2 NMC技術架構NMC客戶端是集成的監(jiān)控UI,是基于插件的UI框架;客戶端通過多種協(xié)議與服務中心通信,包括HTTP(s),Email,JMS;服務中心接到客戶端請求后,服務中心管理器通過服務定位器對服務進行定位,將請求的服務資源將請求路由到相應的監(jiān)控進程;監(jiān)控進程將請求轉交給服務管理器,通過服務管理器將請求轉交給具體的服務實例處理;一個監(jiān)控域中可以有一個或者多個監(jiān)控實例。1.1.3監(jiān)控服務之間的關系圖1.3監(jiān)控服務的關系NMC一個很重要的優(yōu)勢就是服務之間可以相互穿透,比如進程到線程再到數(shù)據(jù)庫信息的穿透、客戶端到線
9、程信息的穿透。在多層架構的系統(tǒng)中,這種層與層之間的監(jiān)控信息的穿透可以幫助你更加系統(tǒng)地,精確地分析問題。監(jiān)控服務都會生成日志和產(chǎn)生消息,這些日志和消息可以進一步成為日志分析的數(shù)據(jù)來源。1.1.4核心特性集成的性能監(jiān)控、問題分析、系統(tǒng)管理的平臺;提供HTTP、Email、OFFLine等多種連接或者使用模式;支持多個監(jiān)控域。每個監(jiān)控域支持多個服務器、多種類型的監(jiān)控服務;從客戶端到中間件,數(shù)據(jù)庫的無縫的全面的監(jiān)控體系;支持中間件層和數(shù)據(jù)庫層信息的相互穿透;支持客戶端日志和服務器端日志的相互穿透;提供強大的中間件進程級的監(jiān)控和管理功能;提供細粒度的線程監(jiān)控功能;提供了強大靈活的日志抽取和分析功能;提供
10、了一種事件驅動的進行主動監(jiān)控主動管理的功能;集成了補丁管理的功能;實現(xiàn)了監(jiān)控服務的安全和監(jiān)控目標安全的隔離。1.1.5帶來的好處可獲得對系統(tǒng)的高度洞察力。使用NMC的實時監(jiān)控可以獲得實時掌握系統(tǒng)的運行狀態(tài),無論是系統(tǒng)概要的層面還是細粒度的線程層面,都一覽無余。對日志和消息的分析可以評估系統(tǒng)整體運行狀態(tài)、預測風險??焖侔l(fā)現(xiàn)和定位問題。無論通過實時監(jiān)控還是離線分析,都可以快速發(fā)現(xiàn)定位性能問題。相對于傳統(tǒng)的監(jiān)控工具,NMC可以更加快速地幫助你定位性能問題。提高系統(tǒng)可用性。進程監(jiān)控服務提供的主動管理,故障自動回復的功能可提高系統(tǒng)的可用性。即,當進程監(jiān)控服務檢測到中間件不響應時自動將其重啟,或者將備份的
11、服務器加入到集群,從而實現(xiàn)系統(tǒng)的高可用性。簡潔高效的工作流。比如日志錄制提供了響應終端用戶的服務工作流,補丁掛你和進程定時重啟提供了補丁維護的工作流。管理變得簡單。系統(tǒng)管理員可以徹底地從補丁管理和中間件管理中解脫出來,把精力放到更加重要的事情上去。1.1.6基于NMC的插件開發(fā)NMC無論是服務器端還是客戶端都采用支持插件的架構,無論是已有的監(jiān)控服務還是新開發(fā)的監(jiān)控服務很容易打包成NMC的服務,進而集成到NMC。圖1.4開發(fā)NMC插件1.2部署和使用1.2.1單機的部署單機只需要啟動單個NMC server即可,此時,這個NMC server同時充當服務中心和監(jiān)控服務器。啟動方法:Cd %NCH
12、OME%/NMC/server./startmonitor.bat(%NCHOME%特指NC實際安裝路徑的變量。主要以windows平臺作為示例。)1.2.2集群的部署集群環(huán)境即需要監(jiān)控多個服務器目標,需要在每個物理服務器上啟動一個NMC server。具體步驟如下:在每個節(jié)點上指定服務中心地址。可以通過configure.bat命令,也可以直接修改./conf/service.xml中service center 部分來實現(xiàn)。圖1.5配置服務中心先啟動服務中心服務器啟動節(jié)點服務器特別注意:如果重啟服務中心服務器,則節(jié)點服務器必須重啟!1.2.3 WAS啟用安全管理WAS 啟用安全管理時,NM
13、C如果要對WAS進行管理(比如啟動,停止),需要一些特殊配置。以下通過一個實際的例子來說明:WASHome:/u01/IBM/WEBSphere/AppServerWAS安全管理用戶名/密碼:root/rootroot具體步驟如下:create trust key store一定要用WAS帶的keytool。導出證書:WAS_home/java/bin下執(zhí)行以下命令:keytool-export -v -keystore /u01/IBM/WEBSphere/AppServer/profiles/Dmgr01/config/cells/ncprd01Cell01/key.p12 -storep
14、ass WEBAS -storetype PKCS12 -alias default -file /nchome/NMC/server/ibm.cer導入證書:在WAS_home/java/bin下執(zhí)行以下命令:keytool -import -v -noprompt -keystore /nchome/NMC/server/WASkeystore -storepass rootroot -file /yc57gold/NMC/server/ibm.cer -alias ufida.cer trustcacerts修改 perties配置文件,添加如下參數(shù):adminus
15、ername=rootadminpassword=rootroot.ssl.trustStore=/nchome/NMC/server/WASkeystore.ssl.trustStorePassword=rootroot修改startmonitor0.sh(bat),用WAS的JDK啟動;export JAVA_HOME=/u01/IBM/WEBSphere/AppServer/java啟動NMC一定要使用startmonitor0.sh(bat)命令啟動服務;1.2.4服務器端主要的配置文件./conf/service.xml服務實例和服務中心的配置文件,是核心配置文件,主要可進行如下配置
16、:服務中心地址每個服務的屬性是否啟動;是否域內單例;是否生成消息;對于消息的處理方式(快照或者警告)。./conf/perties各種監(jiān)控服務的參數(shù)的配置文件,是一個核心的配置文件,可以通過如下方式修改:直接編輯文件;通過configure.bat來修改; NMC客戶端的參數(shù)配置,這種方式直接生效不需要重啟實例。./conf/perties日志配置文件??梢酝ㄟ^直接修改文件,修改后必須重啟實例才能生效。./conf/perties郵件服務器配置文件。郵件服務器主要用于消息中心和通過郵件方式訪問監(jiān)控服務(見通過郵件訪問監(jiān)控服務部
17、分),可以通過直接修改配置文件或者configure.bat。圖1.6配置郵件服務器心1.2.5服務器端部署的幾個注意事項對中間件和數(shù)據(jù)庫的監(jiān)控依賴于%NCHOME%/ierp/bin/prop.xml文件,為了部署方便,建議將監(jiān)控服務和NC中間件代碼部署在一個服務器上。如果要單獨部署,需要在perites中指定prop.xml。如果在WAS管理控制臺中更改了單個Server或者集群中某個成員Server的端口,一定要在NC的prop.xml文件中修改該對應的端口,要保證prop.xml和真實環(huán)境信息的一致性。Linux/UNIX環(huán)境特別注意要將NMC/server/bi
18、n和NMC/server/目錄下的文件賦予可執(zhí)行權限。把任務放到后臺執(zhí)行(nohup)。JRE_HOME要設置為JDK1.5或者以上的版本。修改NMC端口需要修改NMC/server/conf/server.conf,NMC/server/conf/services.xml,%NCHOME%/resource/perties三個文件。如果是數(shù)據(jù)庫是RAC環(huán)境,需要在prop.xml文件中將數(shù)據(jù)源拆分成兩個針對單個實例的數(shù)據(jù)源,這樣可以保證做快照和數(shù)據(jù)庫檢查的性能,可以單獨提供一個prop.xml用于NMC。比如:<databaseUrl>jdbc:oracle
19、:thin:(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=1)(PORT=1521)(ADDRESS=(PROTOCOL=TCP)(HOST=2)(PORT=1521)(LOAD_BALANCE=yes)(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=ncdata)</databaseUrl>1.2.6 NMC客戶端的獲取客戶端可以用以下兩種方式獲得:直接使用%NCHOME%/NMC/client;或者從服務器上下載一個最新的客戶端。下載地址為http:/s
20、ervicecenterhost:port/NMC/client.exe 比如:12:9999/NMC/client.exe1.2.7啟動客戶端設置JAVA_HOME進入客戶端目錄,執(zhí)行monitorconsole.bat。圖1.7NMC客戶端登錄對話框1.2.8客戶端使用的幾種模式HTTP(默認):使用HTTP傳輸協(xié)議訪問監(jiān)控服務。EMAIL:使用郵件傳輸協(xié)議來訪問監(jiān)控服務。主要用于無法通過HTTP協(xié)議訪問遠程監(jiān)控服務器的情況。這種傳輸方式提供了更靈活的接入方式。OFFLINE:脫機模式。主要用于基于消息和日志的分析。1.2.9利用郵件傳輸協(xié)議進行遠程監(jiān)控利
21、用郵件傳輸協(xié)議進行遠程監(jiān)控是一種非常靈活的連接方式。只要保證服務器端能收郵件,客戶端能發(fā)郵件就可以進行實時監(jiān)控。主要的配置如下:在服務中心服務器配置郵件服務器圖1.8配置郵件服務器配置conf/services.xml將maillistner服務設置為啟動:<service><serviceName>maillistner</serviceName> <implementClass>nc.monitor.service.mailreceiver.MailListener</implementClass> <isStart>
22、true</isStart> <isSingle>true</isSingle> <isNeedSecurityCheck>true</isNeedSecurityCheck></service>配置perties修改如下屬性:#遠程調用消息處理器#收郵件fromPOP_REMOTECALL_EMAILADDR=srv#發(fā)送郵件時指定的郵件fromSMTP_SRC_MAIL_ADDR=monitor#郵件訪問控制列表,用;格開MAIL_ACCESS_RULE=liujb;#郵件不滿足規(guī)則將郵件從郵件服
23、務器上刪除DelMail_OutOfRule=false注意:監(jiān)聽的郵件帳號最好是專用帳號!客戶端登陸時,選擇登陸的傳輸方式為Email。圖1.9選擇email作為通信方式1.2.10客戶端主要的配置文件./conf/resource/domain.xml:登錄過的監(jiān)控域的歷史記錄。./conf/resource/resource-client.xml客戶端插件的配置文件。./conf/SQL/fixSQL.cfg數(shù)據(jù)庫監(jiān)控腳本配置文件。./conf/SQL/logSQL.cfg日志分析預置腳本配置文件。第二章 實時監(jiān)控本章內容概要:l 概述l 進程監(jiān)控l 線程監(jiān)控l 數(shù)據(jù)庫監(jiān)控l 客戶端監(jiān)控
24、l 內存監(jiān)控l 緩存監(jiān)控2.1概述實時監(jiān)控是常規(guī)的監(jiān)控方法。問題正在發(fā)生,或者你正在客戶現(xiàn)場,實時監(jiān)控可以讓你第一時間撲捉到當前系統(tǒng)正在發(fā)生什么,問題的定位和解決方案隨之而來。NMC支持實時監(jiān)控的服務主要的包括:OverView、進程監(jiān)控、線程監(jiān)控、數(shù)據(jù)庫監(jiān)控、CPU、內存,客戶端監(jiān)控等。OverView提供了一個系統(tǒng)概要;進程監(jiān)控提供了進程級的信息;線程監(jiān)控提供線程級的信息;CPU和內存監(jiān)控提供系統(tǒng)級的信息;客戶端監(jiān)控提供客戶端的性能和系統(tǒng)在線人數(shù)的信息。每個服務都提供了監(jiān)控整個系統(tǒng)的某個部分的任務,把這些服務的信息整合起來就看到整個系統(tǒng)的全景。NMC實時監(jiān)控有如下優(yōu)勢:可多層信息穿透。這種
25、層與層之間的直接關聯(lián)可更加全面深入的定位和分析問題;從客戶端到中間件在到數(shù)據(jù)庫的端到端的無縫監(jiān)控;完整的信息 。NMC提供的全方位,各個層次,滿足各種監(jiān)控需要的信息。2.2 OverView圖2.1 OverView2.2.1功能概述提供一個部署結構樣式的全局的系統(tǒng)運行狀況視圖,包括系統(tǒng)運行狀態(tài)、每個中間件的JVM heap信息、線程信息、數(shù)據(jù)庫的活動會話、集群吞吐量、在線用戶數(shù)、最新的系統(tǒng)消息等。當系統(tǒng)出現(xiàn)異常,會有警告提示。2.2.2參數(shù)無2.2.3詳細功能介紹自動刷新設置:設置視圖的自動刷新時間間隔。單位為秒,默認為5秒刷新一次;點擊數(shù)據(jù)庫組件進入數(shù)據(jù)庫監(jiān)控節(jié)點,點擊中間件組件進入線程監(jiān)
26、控節(jié)點。2.3進程監(jiān)控圖2.2進程監(jiān)控-JVM視圖圖2.3進程監(jiān)控-WEB線程視圖程圖2.4進程監(jiān)控-數(shù)據(jù)庫activesession視圖2.3.1功能概述進程監(jiān)控服務主要實現(xiàn)如下功能:對中間件狀態(tài)檢查,包括端口響應的時間和內存使用的情況,比如,當發(fā)現(xiàn)中間件不能正常工作,則可以選擇對其自動重啟或者動態(tài)加入一個備份的中間件;將JVM HEAP的使用情況、中間件響應時間、WEB thread及serivce thread信息采樣,將采樣信息寫入日志,通過日志分析可以對系統(tǒng)進行性能評估和性能診斷;提供每個進程吞吐量的視圖;更新數(shù)據(jù)庫連接池的信息和數(shù)據(jù)庫活動會話的信息;對中間件進行管理,比如重啟,生成
27、JAVACORE,HEAPDUMP,設置定時重啟等。2.3.2參數(shù)NodeAgentHost中間件管理服務器地址,WEBSPHERE DM服務器的地址默認為,如果為WEBLOGIC中間件,則為WEBLOGIC manager的地址。NodeAgentPort中間件管理服務器的端口,WEBSPHERE DM的端口默認為8879,如果沒有啟集群,則為所在服務器的NodeAgent的端口,默認為8880,如果中間件為WEBLOGIC,默認端口為7001。Servertype中間件服務器的類型,默認為WAS,可以選擇WAS,WEBLOGIC,NC。Adminusername中間件管理
28、員。如果WAS admin 啟用了安全管理,則需要設置。如果服務器為WEBLOGIC,此參數(shù)必須設置。Adminpassword中間件管理員密碼。如果WAS admin 啟用了安全管理,則需要設置,WEBLOGIC中間件此參數(shù)必須設置。Propfile默認為././ierp/bin/prop.xml,修改此參數(shù)必須重啟監(jiān)控服務。notResponseThreshold中間件端口響應時間的閥值,單位為毫秒。即當響應時間超過這個閥值,則認為端口探測失敗,默認為5000毫秒。此參數(shù)需要和fail.trytimes配合使用。fail.trytimes端口探測的次數(shù),即如果連續(xù)fail.trytimes
29、次此端口探測失敗,則認為中間件已經(jīng)不能正常工作,需要重啟。默認為8。此參數(shù)需要和notResponseThreshold配合使用。servlet默認為service/monitorservlet,不需要修改。MemoryThreshold內存報警閥值。此值算法如下heap free/heap total。默認為0.005。此參數(shù)需要和MemoryTrytimes配合使用。MemoryTrytimes連續(xù)java heap探測的次數(shù),即當連續(xù)這些次數(shù)探測失敗,則發(fā)送快照消息或者重啟中間件。默認為10次。此參數(shù)需要和MemoryThreshold配合使用。logDuration進行中間件信息采樣同
30、時將信息寫入日志的時間間隔,默認為10秒。日志會寫入./logs/mw/。restartWhenCheckResponsefailure檢查端口失敗是否重啟.。默認為truerestartWhenCheckMemoryfailure檢測JVM內存失敗是否重啟,如果為否,則只是發(fā)送報警消息,默認為false。dumpHeapWhenRestart檢查中間件失敗是否要做HEAP DUMP,默認為false。dumpThreadWhenRestart檢查中間件失敗是否要做THREAD DUMP,默認為false。N1_PLUGIN_FILEN+1 Standby 需要指定HIS插件的配置文件,默認為
31、空。N1_STANDBYSERVER_KEYN+1 Standby 需要指定HIS插件的備份中間件,默認為空。EnableLOCKGC中間件重啟時是否做LOCKGC,默認true。如果為true,則中間件重啟時將這個中間件的PKLOCK全部清除。2.3.3詳細功能介紹中間件-管理-啟動對選擇的中間件進行啟動,支持右鍵。中間件-管理-重啟對選擇的中間件進行重啟,支持右鍵。中間件-管理-停止。對選擇的中間件進行啟動,支持右鍵。中間件-管理-定時設置定時重啟,支持右鍵。如下圖,則設置ncMem01每隔7天凌晨零點自動重啟。圖2.5設置自動重啟中間件-管理-DUMPHEAP對所選擇的中間件生成HEAP
32、DUMP, 支持右鍵。中間件-管理-DUMPTHREAD對所選擇的中間件生成THREADDUMP, 支持右鍵。中間件-GC對所選擇的中間件做FULL GC,右鍵功能。中間件-監(jiān)控-線程監(jiān)控對選擇的中間件穿透到線程監(jiān)控節(jié)點,支持右鍵。中間件-監(jiān)控-全局監(jiān)控進入全局監(jiān)控節(jié)點,即對所有的中間件在一個視圖中進行監(jiān)控。中間件-定時刷新設置設置進程視圖自動刷新的時間間隔,默認為5秒。圖2.6設置自動刷新中間件-NCSNAPSHOT對選擇的中間件做快照,這個快照需要到消息中心同步才能看到。中間件-刷新刷新當前視圖。中間件-詳細信息說明雙擊任何表行,則自動彈出其詳細信息。圖2.7進程監(jiān)控詳細信息字段解釋:字段
33、說明服務名中間件名稱狀態(tài)中間件當前狀態(tài),目前有三種狀態(tài):Running、down、starting主機中間件服務器地址端口中間件端口重啟定時定時重啟的配置,可以通過右鍵或者管理->定時設置WEB線程池WEBcontainer線程池的大小WEB線程遠程調用線程數(shù)服務線程后臺服務的線程數(shù)JVMmax(m)JVM heap的設置(max)JVMtotal(m)JVM heap當前的total值JVMfree(m)JVM heap當前的free值JVMused(m)JVM heap used上次端口檢查耗時最近一次端口探測的響應時間可管理如果啟動WEBSPHERE DM或者WEBLOGIC ma
34、nager,則為true,否則為false.可管理意味著可以遠程對中間件進行啟動,關閉,生成HEAPDUMP、THREADDUMP。當監(jiān)控服務發(fā)現(xiàn)中間件不響應時,可以根據(jù)監(jiān)控服務配置的管理策略對其自動重啟.如果不能管理,則意味著只能做監(jiān)控數(shù)據(jù)庫-刷新對數(shù)據(jù)庫監(jiān)控視圖進行刷新。數(shù)據(jù)庫-查詢進入所選擇的數(shù)據(jù)庫的查詢節(jié)點。數(shù)據(jù)庫監(jiān)控詳細信息說明選中上面的任何一行,如newSQL所在的行,然后雙擊,則彈出下面的對話框:圖2.8數(shù)據(jù)庫詳細信息字段說明數(shù)據(jù)源數(shù)據(jù)源名稱數(shù)據(jù)庫類型數(shù)據(jù)庫類型連接字符串數(shù)據(jù)庫的jdbc 連接串連接池大小顯示為default-max連接池已用在對應的中間件連接池中有多少連接為使用
35、狀態(tài)dbActiveSessions數(shù)據(jù)庫的活動會話數(shù)最近檢查時間最近進行數(shù)據(jù)庫健康檢查的時間2.4線程監(jiān)控圖2.9數(shù)線程監(jiān)控2.4.1功能概述實時對線程信息細粒度的監(jiān)控,包括當前業(yè)務動作、線程堆棧、SQL堆棧、性能信息、業(yè)務信息、線程狀態(tài),等待事件等等;對單個線程穿透到數(shù)據(jù)庫;終止一個線程;查詢垃圾線程;對單個線程進行獨立跟蹤;聯(lián)查業(yè)務,聯(lián)查操作員詳細信息等業(yè)務功能。2.4.2參數(shù)MW_THREAD_CHECK_INTERVAL中間件WEB線程檢查時間間隔,單位為秒,默認為120s。注意:WEB線程處理的是從客戶端發(fā)起的請求。MW_THREAD_CHECK_MAXCOSTTIME中間件一個W
36、EB線程運行時間的閥值,單位為秒,超過這個時間仍沒有結束則發(fā)送快照消息,默認為180秒。MW_THREAD_CHECK_MAXCOUNTOFSQL中間件一個WEB線程執(zhí)行的SQL最大數(shù)量,如果超過這個值,則發(fā)送快照消息,默認為1000個。MW_THREAD_CHECK_MAXCOSTOFONESQL=120中間件一個線程最耗時的SQL閥值,單位為秒,如果SQL的耗時超過這個值,則發(fā)送快照消息,默認為120秒。2.4.3詳細功能介紹視圖線程詳細信息選中任何一個線程雙擊,則彈出詳細對話框圖2.10線程詳細對話框可以看到詳細的線程信息。字段解釋:字段說明服務全局模式下中間件的名稱線程名稱線程名稱線程
37、狀態(tài)當前線程狀態(tài)業(yè)務動作當前的業(yè)務操作當前事件當前線程正在做的事件(見線程事件)主要的事件包括:獲取數(shù)據(jù)庫連接SQL翻譯、執(zhí)行SQL、調用EJB、序列化、往客戶端寫數(shù)據(jù)、調用master、線程到數(shù)據(jù)庫的映射、回滾,提交等性能統(tǒng)計當前線程到當前的性能統(tǒng)計(詳見性能統(tǒng)計字段解釋)耗時當前線程運行到目前的執(zhí)行時間,單位為毫秒遠程調用方法遠程調用方法客戶端地址發(fā)起遠程調用的客戶端地址操作員發(fā)起遠程調用的操作員主鍵操作員編碼發(fā)起遠程調用的操作員名稱操作員名稱發(fā)起遠程調用的操作員名稱.性能統(tǒng)計字段解釋:字段說明SQLcosttime當前線程所有SQL的累計執(zhí)行時間(不包括fetch 結果集)readres
38、ulttime當前線程fetch 結果集的累計時間,單位為毫秒readrownum當前線程累計fetch了多少條記錄writetoclienttime當前線程寫數(shù)據(jù)到客戶端的時間(網(wǎng)絡耗時),單位為毫秒writetoclientbytes當前線程寫到客戶端的總字節(jié)數(shù)readfromclienttime 當前線程從客戶端讀請求的耗時,單位為毫秒readfromclientbytes當前線程從可客戶端讀請求的字節(jié)數(shù)notclosedconnectioncount當前線程沒有關閉的數(shù)據(jù)庫連接數(shù)Sql詳細信息線程SQL堆棧解釋:字段說明Sql第一條為統(tǒng)計信息,包括SQL執(zhí)行數(shù)量總計、SQL執(zhí)行時間總計
39、(不包括fetch結果集),占用數(shù)據(jù)庫連接數(shù)總計執(zhí)行狀態(tài)有兩種狀態(tài):running、finished耗時Sql執(zhí)行時間數(shù)據(jù)庫連接執(zhí)行SQL的數(shù)據(jù)庫連接ID數(shù)據(jù)源執(zhí)行SQL的數(shù)據(jù)源名稱注意:任何有SQL的地方,都可以通過鼠標選擇這個SQL進行格式化,從而使SQL更加易讀。例如將如下這段詳細信息格式化:<record><SQL>SELECT pk_jobbasfil, pk_deptdoc,pk_psndoc, pk_custdoc, pk_vendoc,pk_jobmngfil, sealflag, remcode, memo,pk_corp FROM bd_jobmng
40、fil where pk_jobmngfil in ( select pk from DBCache_bd_jobmngfil )</SQL><數(shù)據(jù)庫連接id>5623780</數(shù)據(jù)庫連接id><數(shù)據(jù)源>njpz</數(shù)據(jù)源><執(zhí)行狀態(tài)>執(zhí)行完畢</執(zhí)行狀態(tài)><執(zhí)行耗時>3</執(zhí)行耗時><讀取記錄數(shù)>0</讀取記錄數(shù)></record>格式化后的結果:<record>< SQL > select pk_jobbasfil , pk
41、_deptdoc , pk_psndoc , pk_custdoc , pk_vendoc , pk_jobmngfil , sealflag , remcode , memo ,pk_corpfrom bd_jobmngfilwhere pk_jobmngfil in ( select pk from DBCache_bd_jobmngfil ) < / SQL ><數(shù)據(jù)庫連接id>5623780</數(shù)據(jù)庫連接id><數(shù)據(jù)源>njpz</數(shù)據(jù)源><執(zhí)行狀態(tài)>執(zhí)行完畢</執(zhí)行狀態(tài)><執(zhí)行耗時>3&l
42、t;/執(zhí)行耗時><讀取記錄數(shù)>0</讀取記錄數(shù)></record>調式模式一個線程如果是調試狀態(tài),則這個線程的所有的數(shù)據(jù)庫操作都會將線程信息映射到數(shù)據(jù)庫,大部分情況默認即可。全局調試開:除服務線程外的所有的線程默認都是調試模式;全局調試關:所有的線程都不是調試模式.選擇調試用戶:將選擇的用戶的遠程調用設置為調試模式,此時全局模式自動為關閉狀態(tài).取消用戶調試:取消用戶調試模式. 服務線程調試開:在全局模式為開的情況下,服務線程處于調試狀態(tài). 服務線程調試關:服務線程設置為非調試狀態(tài).匯總顯示將當前視圖的所有線程信息顯示在一個對話框內。
43、顯示過濾設置當前視圖的顯示過濾條件,如圖:圖2.11顯示過濾的設置注意,顯示服務指的是是否顯示后臺服務(不同于遠程調用)。垃圾線程垃圾線程是指在服務器端運行的對客戶沒有意義的線程。比如客戶正在做一個查詢,但沒等查詢出 結果就直接關掉IE, 此時的線程就是垃圾線程??梢酝ㄟ^垃圾線程這個功能將垃圾線程查出來,進一步可以kill掉此線程。聯(lián)查數(shù)據(jù)庫如果線程是DEBUG模式,則可以穿透到數(shù)據(jù)庫端看這個線程在數(shù)據(jù)庫執(zhí)行什么事件,比如執(zhí)行什么SQL,這個SQL為什么慢,進一步可以查看鎖或者執(zhí)行計劃等信息。聯(lián)查操作員聯(lián)查所選線程的操作員的詳細信息,比如電話號碼,郵件等等,可以直接與這個操作員聯(lián)系。kill殺
44、掉所選線程,但這個線程必須滿足如下條件:線程是DEBUG模式;該線程正在執(zhí)行SQL。聯(lián)查業(yè)務聯(lián)查當前線程打開哪些業(yè)務節(jié)點,方便業(yè)務方面的定位。單個線程右鍵單個線程僅僅針對這個線程的對話框,這個對話框聚集了這個線程相關的所有信息,可以隨時刷新這個線程。圖2.12單個線程2.5數(shù)據(jù)庫監(jiān)控圖2.13數(shù)據(jù)庫監(jiān)控2.5.1功能概述 提供一組數(shù)據(jù)庫健康檢查的服務,當發(fā)現(xiàn)數(shù)據(jù)庫有性能問題時,發(fā)送快照或者報警消息; 提供客戶端可以調用的數(shù)據(jù)庫操作方法; 預置了ORACLE,DB2,SQLSERVER監(jiān)控腳本。2.5.2參數(shù)DB_RUNTIMECHECK_DURATION數(shù)據(jù)庫健康檢查時間間隔,單位為秒,-1不
45、監(jiān)控,只是供客戶端操縱,檢查失敗會發(fā)送快照消息。默認為10秒。HEALTH_RUNTIME_CHECK_DB_SQL_X進行健康檢查時執(zhí)行的腳本,個數(shù)最大為4個,檢查失敗后會發(fā)送快照消息。數(shù)據(jù)庫健康檢查目前只是支持ORACLE.如果是RAC環(huán)境,則將v$session 改為gv$session默認HEALTH_RUNTIME_CHECK_DB_SQL_1=select sid,serial#,client_identifier,machine from v$session where username=upper('user') and status='ACTIVE
46、39; and last_call_et>60 order by last_call_et descDB_DUMP_SQL_X生成數(shù)據(jù)庫快照時的執(zhí)行腳本,個數(shù)最大為8個,如果是RAC環(huán)境,需要將腳本中的視圖轉為GV視圖,要注意測試一下這些腳本的效率! 默認為DB_DUMP_SQL_1=select t.*,'dba_waiters' tablename from dba_waiters t;DB_DUMP_SQL_2=select s.client_identifier, s.sid, s.serial#,SQL.SQL_fulltext, s.last_call_et,
47、 s.event, SQL.SQL_ID, child_number,s.SQL_hash_value from v$session s, v$SQL SQLwhere s.SQL_address = SQL.ADDRESS and s.username = upper('user') and s.status = 'ACTIVE' and s.last_call_et>10 order by sid DB_DUMP_SQL_3=select * from (select hash_value|'*'|rpad('|'|su
48、bstr(lpad(' ',1*(depth-1)|operation|decode(options, null,'',' '|options), 1, 32), 33, ' ')|'|'| rpad(decode(id, 0, '- '|to_char(hash_value)|' -' , substr(decode(substr(object_name, 1, 7), 'SYS_LE_', null, object_name) |' ',1, 20
49、), 21, ' ')|'|'| lpad(decode(cardinality,null,' ', decode(sign(cardinality-1000), -1, cardinality|' ', decode(sign(cardinality-1000000), -1, trunc(cardinality/1000)|'K', decode(sign(cardinality-1000000000), -1, trunc(cardinality/1000000)|'M', trunc(car
50、dinality/1000000000)|'G'), 7, ' ') | '|' | lpad(decode(bytes,null,' ', decode(sign(bytes-1024), -1, bytes|' ', decode(sign(bytes-1048576), -1, trunc(bytes/1024)|'K', decode(sign(bytes-1073741824), -1, trunc(bytes/1048576)|'M', trunc(bytes/10737
51、41824)|'G'), 6, ' ') | '|' | lpad(decode(cost,null,' ', decode(sign(cost-10000000), -1, cost|' ', decode(sign(cost-1000000000), -1, trunc(cost/1000000)|'M', trunc(cost/1000000000)|'G'), 8, ' ') | '|' as "Explain plan"
52、from v$SQL_plan where hash_value in (select s.SQL_hash_value from v$session s where s.username = upper('user') and s.status = 'ACTIVE' and s.last_call_et>10 )進行健康檢查的腳本,檢查失敗后會發(fā)送WARNING消息。DB_CONFCHECK_DURATION進行配置檢查的時間間隔,單位為秒,-1為不檢查。HEALTH_CONF_CHECK_DB_SQL_X進行數(shù)據(jù)庫配置監(jiān)控檢查的SQL。ACTIVESE
53、SSSION_CHECK_DURATION活動會話更新時間間隔,單位秒。默認為為10秒。2.5.3詳細功能介紹常用腳本客戶端預置了常用的監(jiān)控腳本,配置文件在client/conf/SQL/fixSQL.cfg,可以根據(jù)需要修改這個配置文件。這些腳本可以通過監(jiān)控下拉菜單或者選擇行的右鍵功能來執(zhí)行。圖2.14常用腳本執(zhí)行對SQL文本區(qū)的SQL執(zhí)行。如果有多個SQL,需要選擇所要執(zhí)行的Sql,如果只有一條SQL,則只執(zhí)行這條SQL。格式化對SQL文本區(qū)選擇的SQL格式化。聯(lián)查線程對所選擇的SQL反向聯(lián)查到中間件線程信息。圖2.15聯(lián)查線程界面圖2.16聯(lián)查線程導出SQL將查詢結果導出到SQL文件(i
54、nsert)。導出文本將查詢結果導出到文本文件。導出XML將查詢結果導出到XML文件。2.6客戶端監(jiān)控圖2.17客戶端性能監(jiān)控圖2.18在線用戶監(jiān)控圖2.19在線用戶歷史分析2.6.1功能概述對客戶端的性能進行監(jiān)控。包括CPU、IO、網(wǎng)絡、java Heap、是否啟用壓縮、是否啟用緩存等信息進行監(jiān)控。NC客戶端通過登錄觸發(fā)執(zhí)行一個監(jiān)控任務將監(jiān)控結果發(fā)給NMC服務器。NMC Client對收集上來的數(shù)據(jù)進行分析。如下圖。圖2.20客戶端監(jiān)控架構對在線用戶進行實時監(jiān)控和歷史分析。2.6.2參數(shù)USER_COUNT_INTERVAL=120服務器查詢在線用戶時間間隔,單位秒,默認為120秒。2.6.3 NC系統(tǒng)的配置要進行客戶端監(jiān)控,需要在NC系統(tǒng)執(zhí)行前臺任務分配,保證用戶登錄系統(tǒng)時觸發(fā)監(jiān)控任務。打開節(jié)點客戶化->系統(tǒng)維護->前臺任務->前臺任務分配選擇“客戶端性能測試”增加任務。圖2.21客戶端任務分配選擇用戶(可以多選)選擇執(zhí)行方式。 輸入?yún)?shù)啟用壓縮(true|false):客戶端是否啟用壓縮方式傳輸圖2.21客戶端任務分配2.6.4詳細功能介紹刷新把最新的客戶端監(jiān)控數(shù)據(jù)加載到視圖中。顯示過濾設置視圖顯示的過濾條件。圖2.22顯示過濾監(jiān)控信息字段解釋:項目說明用戶ID登錄的userid用戶編碼用戶編碼用戶名稱用戶名稱主機名監(jiān)控的主機名IP地址
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 科學備考攻略
- 節(jié)氣新聞傳播策略
- 教育技術與學習策略
- 合作服務協(xié)議合同范本
- 中介首付合同范本
- 升降平臺車合同范本
- 醫(yī)院員工招聘合同范本
- 各種電機購銷合同范本
- 臨床生物化學復習試題含答案(一)
- 臨終病人護理練習測試卷
- 小兒推拿法操作評分標準
- 心腦血管疾病的危險因素與管理1
- 第一單元練習卷(單元測試)2023-2024學年統(tǒng)編版語文六年級下冊
- 2016年4月自考00040法學概論試題及答案
- 2024中國碳普惠發(fā)展與實踐案例研究報告
- 2024年中國檢驗認證集團招聘筆試參考題庫附帶答案詳解
- 人教版九年級數(shù)學下冊《第二十六章反比例函數(shù)》測試卷單元測試卷-帶有參考答案
- 公園售票員管理制度
- 本科:交通管理專業(yè)培養(yǎng)方案(管理學院)
- 《汽車電子電氣系統(tǒng)構造與拆裝》課件 項目三 起動系統(tǒng)檢修
- 《安徒生童話》閱讀指導課件
評論
0/150
提交評論