版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
ICS35.240
CCSL70
團體標準
T/CESAXXXX—202X
人工智能智能服務(wù)智能微服務(wù)保障技
術(shù)要求
Artificialintelligence–Intelligentservice-Technicalrequirements
forintelligentmicro-serviceguarantee
(征求意見稿)
在提交反饋意見時,請將您知道的相關(guān)專利連同支持性文件一并附上。
已授權(quán)的專利證明材料為專利證書復(fù)印件或扉頁,已公開但尚未授權(quán)的專利申請
證明材料為專利公開通知書復(fù)印件或扉頁,未公開的專利申請的證明材料為專利申請
號和申請日期。
202X-XX-XX發(fā)布202X-XX-XX實施
中國電子工業(yè)標準化技術(shù)協(xié)會發(fā)布
T/CESAXXXX—202X
前言
本文件按照GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)
定起草。
本文件由中國科學(xué)院軟件研究所提出。
本文件由中國電子技術(shù)標準化研究院、中國電子工業(yè)標準化技術(shù)協(xié)會歸口。
本文件起草單位:
本文件主要起草人:
IV
T/CESAXXXX—202X
人工智能智能服務(wù)智能微服務(wù)保障技術(shù)要求
1范圍
本文件規(guī)定了智能微服務(wù)適配保障的服務(wù)監(jiān)測、資源監(jiān)測、保障方法和效果驗證四部分的技術(shù)要求。
本文件適用于人工智能領(lǐng)域多種智能服務(wù)產(chǎn)品和應(yīng)用的研發(fā)、運維和使用。
2規(guī)范性引用文件
本文件沒有規(guī)范性引用文件。
3術(shù)語和定義
T/CESAXXXX-202X中界定的以及下列術(shù)語和定義適用于本文件。
3.1服務(wù)適配保障serviceadaptationandguarantee
在智能微服務(wù)長期運行時,通過多種手段保障已適配服務(wù)的正常、穩(wěn)定和高效運行。
3.2服務(wù)質(zhì)量qualityofservice
通過每秒鐘支持的用戶數(shù)、每秒鐘處理的用戶請求數(shù)來表示的指標。
3.3啟發(fā)式方法heuristics
根據(jù)歷史服務(wù)保障經(jīng)驗,通過人工方法設(shè)置若干條服務(wù)質(zhì)量保障原則。
3.4學(xué)習(xí)方法learningbasedmethod
不進行顯式的服務(wù)保障原則設(shè)置,使用AI模型自主學(xué)習(xí)出特定服務(wù)質(zhì)量的設(shè)置。
3.5服務(wù)負載serviceworkload
單位時間內(nèi)服務(wù)的訪問數(shù)量,用于評估服務(wù)適配保障后的真實可用效果。
3.6服務(wù)資源serviceresources
服務(wù)適配保障時,智能微服務(wù)所使用的各類軟硬件資源。
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
CPU:中央處理器(CentralProcessingUnit)
GPU:圖形處理器(GraphicProcessingUnit)
1
T/CESAXXXX—202X
I/O:輸入/輸出(Input/Output)
5智能微服務(wù)適配保障流程
智能微服務(wù)適配保障依托于智能服務(wù)適配平臺(標準CESA/XXXX),在智能微服務(wù)適配演化(標準
CESA/XXXX)后的長期運維階段,使用本適配保障流程,及時發(fā)現(xiàn)并解決智能微服務(wù)的相關(guān)異常,保障
智能化微服務(wù)的穩(wěn)定、正常運行。智能微服務(wù)適配保障流程包含以下四個步驟:
a)服務(wù)監(jiān)測:使用軟件方法收集智能微服務(wù)長期運行時的服務(wù)數(shù)據(jù),所有數(shù)據(jù)按照固定的數(shù)據(jù)格
式存儲,并提供查詢,檢索,統(tǒng)計等功能,為服務(wù)保障方法提供基本的適配保障輸入,主要包
括:智能微服務(wù)元數(shù)據(jù),提供該服務(wù)的開放商和用戶等信息;業(yè)務(wù)處理軌跡,給出服務(wù)代碼的
運行過程和調(diào)用關(guān)系描述,以及運行過程中相應(yīng)的性能數(shù)據(jù);資源使用情況,記錄一次請求服
務(wù)的資源開銷;
b)資源監(jiān)測:使用軟件方法收集智能微服務(wù)運行所處軟硬件環(huán)境的資源數(shù)據(jù),所有數(shù)據(jù)按照固定
的數(shù)據(jù)格式存儲,并提供查詢,檢索,統(tǒng)計等功能,也為服務(wù)保障方法提供基本的輸入,其具
體包括:物理機、虛擬機、容器資源等,提供計算、存儲、網(wǎng)絡(luò)和I/O等方面當前可用、已用
資源信息;多種資源按照一定條件聚合后的數(shù)據(jù),提供按照分區(qū)等條件下的整體資源使用情況
以及各部分資源使用占比等;多種資源之間的關(guān)聯(lián)性數(shù)據(jù),提供資源間之間的使用順序和關(guān)聯(lián)
關(guān)系;
c)保障方法:根據(jù)上述服務(wù)、資源監(jiān)測流程中收集到的服務(wù)和軟硬件監(jiān)測數(shù)據(jù),保障方法配置相
關(guān)的保障規(guī)則和學(xué)習(xí)模型,能夠得到滿足一定負載需求的智能微服務(wù)以及其需要的資源配置,
其通過基于特定的規(guī)則和學(xué)習(xí)的兩類保障方法實現(xiàn):基于規(guī)則的保障方法包括是否類、數(shù)值類、
閾值類和自定義規(guī)則,用于明確是否強制使用某些資源以及使用資源的具體容量;基于學(xué)習(xí)的
保障方法包括待學(xué)習(xí)數(shù)據(jù)、參數(shù)、模型和輸出結(jié)果,用于滿足學(xué)習(xí)方法正常運行所需的的所有
要素;
d)效果驗證:根據(jù)保障方法的具體選型,效果驗證能夠運行智能微服務(wù),并將保障方法作用于服
務(wù)運行,其提供監(jiān)測數(shù)據(jù)的收集和日志導(dǎo)出能力,用于驗證服務(wù)運行時的監(jiān)測結(jié)果是否符合保
障方法的要求,并驗證是否達到相應(yīng)服務(wù)質(zhì)量的需求。
2
T/CESAXXXX—202X
服務(wù)監(jiān)測
服務(wù)自身元數(shù)據(jù)
服務(wù)請求業(yè)務(wù)處理軌跡
保障方法效果驗證
服務(wù)資源使用變化度量
是否類規(guī)則待學(xué)習(xí)數(shù)據(jù)
負載發(fā)生
監(jiān)測數(shù)據(jù)數(shù)值類規(guī)則學(xué)習(xí)參數(shù)
方法監(jiān)測收集服務(wù)運行
資源監(jiān)測閾值類規(guī)則學(xué)習(xí)模型試用
物理機資源使用監(jiān)測日志導(dǎo)出
自定義規(guī)則學(xué)習(xí)輸出
虛擬機/容器資源監(jiān)測
異構(gòu)資源聚合監(jiān)測
異構(gòu)資源關(guān)聯(lián)性監(jiān)測
圖1智能微服務(wù)適配保障
6功能要求
6.1服務(wù)、資源監(jiān)測要求
服務(wù)、資源監(jiān)測包含但不限于以下要求:
a)應(yīng)支持智能微服務(wù)的可用資源、已用資源等的數(shù)值類型符合Bool、Float32、Float64,Int32,
Int64,Double32、Double64、TimeStamp、Blob這幾種,與主流數(shù)據(jù)庫數(shù)據(jù)類型相符;
b)應(yīng)支持智能微服務(wù)運行時主流的軟件平臺的資源監(jiān)測,包括容器(Docker、Containerd等),
虛擬機等軟件的運行資源監(jiān)測;
c)應(yīng)支持智能微服務(wù)運行所需的硬件資源監(jiān)測,包括CPU、GPU等計算資源,以及磁盤、網(wǎng)絡(luò)、
I/O等資源;
d)應(yīng)支持智能服務(wù)運行時業(yè)務(wù)處理軌跡的監(jiān)測,包括調(diào)用關(guān)系,執(zhí)行時間以及調(diào)用是否成功等信
息;
e)應(yīng)支持服務(wù)調(diào)用軌跡等非數(shù)值型監(jiān)測數(shù)據(jù)以Json、Yaml格式保存,包括前驅(qū)、后繼節(jié)點、邊
連通性、時間權(quán)重等信息;
f)應(yīng)支持服務(wù)監(jiān)測數(shù)據(jù)的查詢,檢索以及分析的功能,包括數(shù)據(jù)聚合,平均,計算極值和方差等
統(tǒng)計功能;
g)應(yīng)支持資源監(jiān)測的整個過程以非侵入的探針、鉤子函數(shù)或數(shù)據(jù)推送方式實現(xiàn),避免與原有服務(wù)
或相關(guān)治理框架的沖突;
h)應(yīng)支持監(jiān)測時間間隔、監(jiān)測協(xié)議、監(jiān)測數(shù)據(jù)存放等監(jiān)測配置項提取為獨立的配置文件,提升監(jiān)
測的適用范圍;
i)應(yīng)支持監(jiān)測結(jié)果的存放、可視化展示、安裝等環(huán)節(jié)符合云原生要求,保障監(jiān)測框架能快速與已
有監(jiān)測框架的快速整合。
6.2保障方法要求
3
T/CESAXXXX—202X
保障方法的要求包含但不限于以下要求:
a)應(yīng)支持來自主流AI框架(Tensorflow、Pytorch、Onnx)的AI模型作為保障方法中的學(xué)習(xí)模
型,其使用的算子、控制語句等具有一定的通用性;
b)應(yīng)支持保障方法中的數(shù)據(jù)集符合一般的數(shù)據(jù)集規(guī)范,形成相關(guān)說明文檔,包括數(shù)據(jù)量大小、單
條監(jiān)測數(shù)據(jù)的格式、數(shù)據(jù)集標準等;
c)應(yīng)支持保障方法中的保障規(guī)則以是否、數(shù)值、閾值或其他自定義形式來準確描述服務(wù)保障的行
為、使用條件和預(yù)期效果;
d)應(yīng)支持保障規(guī)則中的自定義形式符合一定的規(guī)范,形成相關(guān)的說明文檔,包括規(guī)則的數(shù)據(jù)輸入,
輸出以及可用的范例等。
e)應(yīng)支持某一特定的保障方法以虛擬機容器鏡像方法進行封裝,可獨立運行;
j)應(yīng)支持保障方法以非侵入的方式實現(xiàn),對智能微服務(wù)和異構(gòu)資源管控時避免與原有服務(wù)和其他
治理框架的沖突。
f)應(yīng)支持某一特定的保障方法遵循通用的監(jiān)測協(xié)議和配置生效方式,支持Http、Https,TCP/UDP
等幾種主流的配置方式;
g)應(yīng)支持服務(wù)保障方法明確對智能微服務(wù)的管控能力邊界,如增加、減少資源使用,遷移分配異
構(gòu)資源等;
h)應(yīng)支持服務(wù)保障方法明確對異構(gòu)資源的管控能力邊界,如CPU、GPU的容量、線程分配,異構(gòu)
資源的更新、刪除,資源間的動態(tài)拓撲關(guān)系等。
6.3效果驗證要求
效果驗證的要求包含但不限于以下要求:
a)應(yīng)支持效果驗證關(guān)鍵功能組件不少于負載發(fā)生、服務(wù)運行、日志導(dǎo)出和監(jiān)測收集四項,以保證
驗證效果真實可信;
b)應(yīng)支持監(jiān)測收集支持標簽或注解機制,以區(qū)分服務(wù)保障的測試或真實運行環(huán)境;
c)應(yīng)支持日志導(dǎo)出環(huán)節(jié)包含對保障效果的總結(jié)性評價:在使用多少資源時能對多少服務(wù)負載達到
多少的吞吐量,以量化保障后的服務(wù)質(zhì)量。
d)應(yīng)支持服務(wù)運行環(huán)節(jié)的啟動指定與Kubernetes、VMware、KVM啟動兼容的啟動腳本,避免和特
定研發(fā)語言、業(yè)務(wù)的耦合。
e)應(yīng)支持負載發(fā)生支持泊松分布、隨機分布等若干種特定的負載特點,以模擬真實智能微服務(wù)的
使用場景。
4
T/CESAXXXX—202X
目次
前言.................................................................錯誤!未定義書簽。
1范圍................................................................................1
2規(guī)范性引用文件......................................................................1
3術(shù)語和定義..........................................................................1
4縮略語..............................................................................1
5智能微服務(wù)適配保障流程..............................................................2
6功能要求............................................................................3
6.1服務(wù)、資源監(jiān)測要求..............................................錯誤!未定義書簽。
6.2保障方法要求....................................................錯誤!未定義書簽。
6.3效果驗證要求....................................................................4
III
T/CESAXXXX—202X
人工智能智能服務(wù)智能微服務(wù)保障技術(shù)要求
1范圍
本文件規(guī)定了智能微服務(wù)適配保障的服務(wù)監(jiān)測、資源監(jiān)測、保障方法和效果驗證四部分的技術(shù)要求。
本文件適用于人工智能領(lǐng)域多種智能服務(wù)產(chǎn)品和應(yīng)用的研發(fā)、運維和使用。
2規(guī)范性引用文件
本文件沒有規(guī)范性引用文件。
3術(shù)語和定義
T/CESAXXXX-202X中界定的以及下列術(shù)語和定義適用于本文件。
3.1服務(wù)適配保障serviceadaptationandguarantee
在智能微服務(wù)長期運行時,通過多種手段保障已適配服務(wù)的正常、穩(wěn)定和高效運行。
3.2服務(wù)質(zhì)量qualityofservice
通過每秒鐘支持的用戶數(shù)、每秒鐘處理的用戶請求數(shù)來表示的指標。
3.3啟發(fā)式方法heuristics
根據(jù)歷史服務(wù)保障經(jīng)驗,通過人工方法設(shè)置若干條服務(wù)質(zhì)量保障原則。
3.4學(xué)習(xí)方法learningbasedmethod
不進行顯式的服務(wù)保障原則設(shè)置,使用AI模型自主學(xué)習(xí)出特定服務(wù)質(zhì)量的設(shè)置。
3.5服務(wù)負載serviceworkload
單位時間內(nèi)服務(wù)的訪問數(shù)量,用于評估服務(wù)適配保障后的真實可用效果。
3.6服務(wù)資源serviceresources
服務(wù)適配保障時,智能微服務(wù)所使用的各類軟硬件資源。
4縮略語
下列縮略語適用于本文件。
AI:人工智能(ArtificialIntelligence)
CPU:中央處理器(CentralProcessingUnit)
GPU:圖形處理器(GraphicProcessingUnit)
1
T/CESAXXXX—202X
I/O:輸入/輸出(Input/Output)
5智能微服務(wù)適配保障流程
智能微服務(wù)適配保障依托于智能服務(wù)適配平臺(標準CESA/XXXX),在智能微服務(wù)適配演化(標準
CESA/XXXX)后的長期運維階段,使用本適配保障流程,及時發(fā)現(xiàn)并解決智能微服務(wù)的相關(guān)異常,保障
智能化微服務(wù)的穩(wěn)定、正常運行。智能微服務(wù)適配保障流程包含以下四個步驟:
a)服務(wù)監(jiān)測:使用軟件方法收集智能微服務(wù)長期運行時的服務(wù)數(shù)據(jù),所有數(shù)據(jù)按照固定的數(shù)據(jù)格
式存儲,并提供查詢,檢索,統(tǒng)計等功能,為服務(wù)保障方法提供基本的適配保障輸入,主要包
括:智能微服務(wù)元數(shù)據(jù),提供該服務(wù)的開放商和用戶等信息;業(yè)務(wù)處理軌跡,給出服務(wù)代碼的
運行過程和調(diào)用關(guān)系描述,以及運行過程中相應(yīng)的性能數(shù)據(jù);資源使用情況,記錄一次請求服
務(wù)的資源開銷;
b)資源監(jiān)測:使用軟件方法收集智能微服務(wù)運行所處軟硬件環(huán)境的資源數(shù)據(jù),所有數(shù)據(jù)按照固定
的數(shù)據(jù)格式存儲,并提供查詢,檢索,統(tǒng)計等功能,也為服務(wù)保障方法提供基本的輸入,其具
體包括:物理機、虛擬機、容器資源等,提供計算、存儲、網(wǎng)絡(luò)和I/O等方面當前可用、已用
資源信息;多種資源按照一定條件聚合后的數(shù)據(jù),提供按照分區(qū)等條件下的整體資源使用情況
以及各部分資源使用占比等;多種資源之間的關(guān)聯(lián)性數(shù)據(jù),提供資源間之間的使用順序和關(guān)聯(lián)
關(guān)系;
c)保障方法:根據(jù)上述服務(wù)、資源監(jiān)測流程中收集到的服務(wù)和軟硬件監(jiān)測數(shù)據(jù),保障方法配置相
關(guān)的保障規(guī)則和學(xué)習(xí)模型,能夠得到滿足一定負載需求的智能微服務(wù)以及其需要的資源配置,
其通過基于特定的規(guī)則和學(xué)習(xí)的兩類保障方法實現(xiàn):基于規(guī)則的保障方法包括是否類、數(shù)值類、
閾值類和自定義規(guī)則,用于明確是否強制使用某些資源以及使用資源的具體容量;基于學(xué)習(xí)的
保障方法包括待學(xué)習(xí)數(shù)據(jù)、參數(shù)、模型和輸出結(jié)果,用于滿足學(xué)習(xí)方法正常運行所需的的所有
要素;
d)效果驗證:根據(jù)保障方法的具體選型,效果驗證能夠運行智能微服務(wù),并將保障方法作用于服
務(wù)運行,其提供監(jiān)測數(shù)據(jù)的收集和日志導(dǎo)出能力,用于驗證服務(wù)運行時的監(jiān)測結(jié)果是否符合保
障方法的要求,并驗證是否達到相應(yīng)服務(wù)質(zhì)量的需求。
2
T/CESAXXXX—202X
服務(wù)監(jiān)測
服務(wù)自身元數(shù)據(jù)
服務(wù)請求業(yè)務(wù)處理軌跡
保障方法效果驗證
服務(wù)資源使用變化度量
是否類規(guī)則待學(xué)習(xí)數(shù)據(jù)
負載發(fā)生
監(jiān)測數(shù)據(jù)數(shù)值類規(guī)則學(xué)習(xí)參數(shù)
方法監(jiān)測收集服務(wù)運行
資源監(jiān)測閾值類規(guī)則學(xué)習(xí)模型試用
物理機資源使用監(jiān)測日志導(dǎo)出
自定義規(guī)則學(xué)習(xí)輸出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年湖南客運應(yīng)用能力考試是什么
- 2024年南京客運資格證應(yīng)用能力考試題目
- 2024年攀枝花道路客運輸從業(yè)資格證考試
- 2024年海南客運考試應(yīng)用能力試題題庫及答案
- 2024年遼陽客運從業(yè)資格證試題
- 智能家居網(wǎng)絡(luò)覆蓋行業(yè)的消費市場分析
- 2024年西寧客運從業(yè)資格證實際操作考試內(nèi)容是什么
- 可再生能源行業(yè)相關(guān)項目經(jīng)營管理報告
- 云計算資產(chǎn)評估行業(yè)發(fā)展全景調(diào)研與投資趨勢預(yù)測研究報告
- 綠色能源行業(yè)的消費心理分析
- 《預(yù)防踩踏》課件
- 美團騎手安全培訓(xùn)課件
- T-JLA 006-2023 微集式計量開關(guān)技術(shù)規(guī)范
- 藏象學(xué)說概論
- 秋季腹瀉知識講座
- (人教A版(2019)選擇性必修第一冊)高二上學(xué)期數(shù)學(xué) 1.4.2用空間向量研究距離、夾角問題 教案
- GB/T 3499-2023原生鎂錠
- 《人民防空知識》PPT班會課件
- 道路運輸企業(yè)交通安全隱患排查清單
- 《經(jīng)營十二條詳解》課件
- 單位籃球協(xié)會管理制度
評論
0/150
提交評論