版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS國(guó)際標(biāo)準(zhǔn)分類號(hào)
CCS中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類號(hào)
團(tuán)體標(biāo)準(zhǔn)
T/CESXXX-XXXX
電力人工智能樣本存儲(chǔ)技術(shù)要求
Technicalrequirementsforsamplestorageofpowerartificialintelligence
(征求意見稿)
XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施
中國(guó)電工技術(shù)學(xué)會(huì)發(fā)布
T/CESXXX—XXXX
電力人工智能樣本存儲(chǔ)技術(shù)要求
1范圍
本文件規(guī)定了電力行業(yè)人工智能樣本包含圖像、文本、音頻電力樣本處理技術(shù)中樣本存儲(chǔ)技術(shù)總
體架構(gòu)、基本要求和各項(xiàng)技術(shù)指標(biāo)。
本文件適用于電力行業(yè)人工智能平臺(tái)樣本存儲(chǔ)的建設(shè)、管理和使用。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T41867-2022信息技術(shù)人工智能術(shù)語(yǔ)
GB/T25000.51-2017軟件工程軟件產(chǎn)品質(zhì)量要求和評(píng)價(jià)體系(SQuaRE)質(zhì)量測(cè)量框架
Q/GDW12118—2021人工智能平臺(tái)架構(gòu)及技術(shù)要求
T/CES129-2022電力人工智能平臺(tái)樣本規(guī)范
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
3.1
樣本存儲(chǔ)系統(tǒng)Samplestoragesystem
指實(shí)現(xiàn)樣本存儲(chǔ)技術(shù)的軟硬件系統(tǒng),包括樣本數(shù)據(jù)庫(kù)、樣本文件系統(tǒng)、樣本元數(shù)據(jù)管理系統(tǒng)等。
3.2
樣本存儲(chǔ)效率Samplestorageefficiency
指樣本存儲(chǔ)系統(tǒng)在存儲(chǔ)和訪問樣本數(shù)據(jù)時(shí)所消耗的時(shí)間、空間和資源的指標(biāo)。
3.3
樣本數(shù)據(jù)Sampledata
其具備的特征能夠反映總體數(shù)據(jù)情況的一部分個(gè)體數(shù)據(jù)
3.4
文件格式fileformat
存儲(chǔ)介質(zhì)對(duì)存儲(chǔ)信息制定的編碼方式,用于識(shí)別內(nèi)部?jī)?chǔ)存的資料。
4符號(hào)、代號(hào)和縮略語(yǔ)
下列符號(hào)、代號(hào)和縮略語(yǔ)適用于本文件。
4.1符號(hào)
無(wú)
4.2代號(hào)
無(wú)
4.3縮略語(yǔ)
JPEG:聯(lián)合圖像專家組(JointPhotographicExpertsGroup)
PNG:便攜式網(wǎng)絡(luò)圖型(PortableNetworkGraphics)
5電力人工智能樣本存儲(chǔ)總體架構(gòu)
3
T/CESXXX—XXXX
電力人工智能樣本存儲(chǔ)技術(shù)總體架構(gòu)包括:
a)樣本數(shù)據(jù),指用于電力人工智能訓(xùn)練和應(yīng)用的原始數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)
構(gòu)化數(shù)據(jù)可以分為文本類、音頻類和圖像類三種類型,每種類型都有自己的格式和規(guī)范。樣本數(shù)據(jù)需要
被存儲(chǔ)在一個(gè)高性能、高可靠、高可用的樣本文件系統(tǒng)中,以便于快速地讀取和處理。
b)樣本元數(shù)據(jù),指對(duì)樣本數(shù)據(jù)的描述性信息,包括但不限于編號(hào)、類型、來源、標(biāo)簽、質(zhì)量、時(shí)
間、位置等內(nèi)容。每個(gè)樣本數(shù)據(jù)都應(yīng)該有一個(gè)唯一的編號(hào),用于標(biāo)識(shí)和關(guān)聯(lián)。樣本元數(shù)據(jù)需要被存儲(chǔ)在
一個(gè)高效、安全、靈活的樣本數(shù)據(jù)庫(kù)中,以便于進(jìn)行增刪改查等操作。
c)樣本元數(shù)據(jù)管理系統(tǒng),指用于實(shí)現(xiàn)樣本數(shù)據(jù)庫(kù)和樣本文件系統(tǒng)之間的關(guān)聯(lián)和協(xié)同的系統(tǒng),主要有
三個(gè)功能:通過樣本編號(hào)建立一一對(duì)應(yīng)的關(guān)系,通過樣本元數(shù)據(jù)進(jìn)行檢索和定位,通過樣本元數(shù)據(jù)進(jìn)行
同步和更新。這個(gè)系統(tǒng)需要保證數(shù)據(jù)的一致性、完整性和可用性。
圖1電力人工智能樣本存儲(chǔ)技術(shù)總體架構(gòu)圖
6樣本存儲(chǔ)技術(shù)基本要求
6.1樣本數(shù)據(jù)格式
樣本數(shù)據(jù)應(yīng)采用統(tǒng)一的文件格式進(jìn)行存儲(chǔ),以便于后續(xù)的處理和分析。原則上同批次樣本文件
中,單個(gè)文件最大不得超過該批次樣本文件平均大小的200%,最小不得小于平均大小的50%。各類
型樣本數(shù)據(jù)具體格式如下:
a)文本類樣本數(shù)據(jù)應(yīng)采用TXT、JSON、XML、CSV等常見的文本文件格式進(jìn)行存儲(chǔ),每個(gè)文件應(yīng)包
含一段或多段文本。
b)音頻類樣本數(shù)據(jù)應(yīng)采用WAV、MP3、WMA、WAV、APE、FLAC、OGG、AAC等常見的音頻文件格式進(jìn)
行存儲(chǔ),每個(gè)文件應(yīng)包含一段或多段音頻。
c)圖像類樣本數(shù)據(jù)應(yīng)采用JPEG、PNG、BMP、SVG、WEBP、EPS等常見的圖像文件格式進(jìn)行存儲(chǔ),
每個(gè)文件應(yīng)包含一個(gè)圖像。
d)視頻類樣本數(shù)據(jù)應(yīng)采用MP4、M4V、WEBM、MOV、AVI、DIV等常見的視頻文件格式進(jìn)行存儲(chǔ),每
個(gè)文件應(yīng)包含一段視頻。
6.2樣本元數(shù)據(jù)
樣本元數(shù)據(jù)是對(duì)樣本數(shù)據(jù)的描述性信息,包括但不限于以下內(nèi)容:
a)樣本編號(hào):唯一標(biāo)識(shí)每個(gè)樣本數(shù)據(jù)的編碼。
b)樣本類型:表示樣本數(shù)據(jù)屬于圖像、音頻或文本類。
c)樣本來源:表示樣本數(shù)據(jù)的獲取方式和來源渠道。
4
T/CESXXX—XXXX
d)樣本標(biāo)簽:表示樣本數(shù)據(jù)所屬的類別或?qū)傩浴?/p>
e)樣本質(zhì)量:表示樣本數(shù)據(jù)的清晰度、完整度、有效性等質(zhì)量屬性。
f)樣本時(shí)間:表示樣本數(shù)據(jù)的采集或生成時(shí)間。
g)樣本位置:表示樣本數(shù)據(jù)與電力系統(tǒng)中的設(shè)備或場(chǎng)景的關(guān)聯(lián)位置。
h)其他信息:根據(jù)不同的應(yīng)用場(chǎng)景,可以增加其他與樣本數(shù)據(jù)相關(guān)的信息。
6.3樣本數(shù)據(jù)庫(kù)
樣本數(shù)據(jù)庫(kù)是用于存儲(chǔ)和管理樣本元數(shù)據(jù)的數(shù)據(jù)庫(kù)系統(tǒng),應(yīng)具備以下功能:
a)支持對(duì)樣本元數(shù)據(jù)進(jìn)行增、刪、改、查等基本操作。
b)支持對(duì)樣本元數(shù)據(jù)進(jìn)行分類、分組、排序、篩選等高級(jí)操作。
c)支持對(duì)樣本元數(shù)據(jù)進(jìn)行備份、恢復(fù)、遷移等維護(hù)操作。
d)支持對(duì)樣本元數(shù)據(jù)進(jìn)行安全、權(quán)限、審計(jì)等管理操作。
6.4樣本文件系統(tǒng)
樣本文件系統(tǒng)是用于存儲(chǔ)和管理樣本數(shù)據(jù)的文件系統(tǒng),應(yīng)具備以下功能:
a)支持對(duì)樣本數(shù)據(jù)進(jìn)行存儲(chǔ)、讀取、刪除等基本操作。
b)支持對(duì)樣本數(shù)據(jù)進(jìn)行壓縮、加密、解密等高級(jí)操作。
c)支持對(duì)樣本數(shù)據(jù)進(jìn)行備份、恢復(fù)、遷移等維護(hù)操作。
d)支持對(duì)樣本數(shù)據(jù)進(jìn)行安全、權(quán)限、審計(jì)等管理操作。
e)支持對(duì)樣本數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換操作。
6.5樣本元數(shù)據(jù)管理系統(tǒng)
樣本元數(shù)據(jù)管理系統(tǒng)是用于實(shí)現(xiàn)樣本數(shù)據(jù)庫(kù)和樣本文件系統(tǒng)之間的關(guān)聯(lián)和協(xié)同的系統(tǒng),應(yīng)具備以
下功能:
a)支持通過樣本編號(hào)在樣本數(shù)據(jù)庫(kù)和樣本文件系統(tǒng)之間建立一一對(duì)應(yīng)的關(guān)系。
b)支持通過樣本元數(shù)據(jù)在樣本數(shù)據(jù)庫(kù)和樣本文件系統(tǒng)之間進(jìn)行檢索和定位。
c)支持通過樣本元數(shù)據(jù)在樣本數(shù)據(jù)庫(kù)和樣本文件系統(tǒng)之間進(jìn)行同步和更新。
7樣本存儲(chǔ)技術(shù)技術(shù)指標(biāo)
7.1樣本存儲(chǔ)容量
指樣本存儲(chǔ)系統(tǒng)能夠存儲(chǔ)的最大樣本數(shù)據(jù)量,單位為GB或TB;原則上應(yīng)大于現(xiàn)有樣本量,同時(shí)
為滿足后續(xù)使用,應(yīng)按實(shí)際情況預(yù)備適宜富余量。
7.2樣本存儲(chǔ)速度
指樣本存儲(chǔ)系統(tǒng)在存儲(chǔ)或讀取樣本數(shù)據(jù)時(shí)的平均速度,單位為MB/s或GB/s;原則上平均讀寫速
度下限為100MB/s,不設(shè)上限。
7.3樣本存儲(chǔ)可靠性
指樣本存儲(chǔ)系統(tǒng)在正常運(yùn)行條件下,能夠保證樣本數(shù)據(jù)不丟失、不損壞、不篡改的概率,單位
為%;原則上應(yīng)為100%。
7.4樣本存儲(chǔ)可用性
指樣本存儲(chǔ)系統(tǒng)在正常運(yùn)行條件下,能夠正常響應(yīng)用戶請(qǐng)求的概率,單位為%;原則上應(yīng)大于
80%,盡可能達(dá)到100%。
7.5樣本存儲(chǔ)安全性
指樣本存儲(chǔ)系統(tǒng)在正常運(yùn)行條件下,能夠保證樣本數(shù)據(jù)不被非法獲取和篡改的概率,單位為%;
原則上應(yīng)為100%。
7.6樣本存儲(chǔ)時(shí)效性
5
T/CESXXX—XXXX
對(duì)于部分存在時(shí)效性限制的樣本,應(yīng)依據(jù)實(shí)際場(chǎng)景和使用要求制定合適的時(shí)效限制,在選取樣本
時(shí)應(yīng)選取在規(guī)定可用時(shí)效限制內(nèi)的樣本,從而保證所選取的樣本的時(shí)效性以及實(shí)際訓(xùn)練任務(wù)的順利推
進(jìn)。
6
T/CESXXX—XXXX
參考文獻(xiàn)
[1]GB/T41867-2022信息技術(shù)人工智能術(shù)語(yǔ)
[2]GB/T25000.51-2017軟件工程軟件產(chǎn)品質(zhì)量要求和評(píng)價(jià)體系(SQuaRE)質(zhì)量測(cè)量框架
[3]Q/GDW12118—2021人工智能平臺(tái)架構(gòu)及技術(shù)要求
[4
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 金融行業(yè)前臺(tái)咨詢工作總結(jié)
- 營(yíng)銷行業(yè)創(chuàng)新實(shí)踐總結(jié)
- 無(wú)人駕駛技術(shù)的前景展望
- IT行業(yè)銷售員工作總結(jié)
- 電力行業(yè)可再生能源發(fā)展顧問工作總結(jié)
- 書店美容院保安工作經(jīng)驗(yàn)
- 金融行業(yè)中理財(cái)咨詢顧問的工作要求
- 旅游行業(yè)導(dǎo)游培訓(xùn)總結(jié)
- 【八年級(jí)下冊(cè)地理湘教版】專項(xiàng)04 時(shí)政地理
- 2024年稅務(wù)師題庫(kù)附參考答案【輕巧奪冠】
- 安全與急救學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024-2025學(xué)年度廣東省春季高考英語(yǔ)模擬試卷(解析版) - 副本
- 2024電力安全工器具及小型施工機(jī)具預(yù)防性試驗(yàn)規(guī)程
- 基于單片機(jī)的2.4G無(wú)線通信系統(tǒng)
- 《建筑力學(xué)》期末機(jī)考資料
- 廣東省廣州市2023-2024學(xué)年三年級(jí)上學(xué)期英語(yǔ)期中試卷(含答案)
- DB11T 1282-2022 數(shù)據(jù)中心節(jié)能設(shè)計(jì)規(guī)范
- GB/T 44694-2024群眾性體育賽事活動(dòng)安全評(píng)估工作指南
- 【二年級(jí)】上冊(cè)道德與法治-14 家鄉(xiāng)物產(chǎn)養(yǎng)育我 教學(xué)設(shè)計(jì)(表格式)人教版道德與法治 二年級(jí)上冊(cè)
- 陶笛欣賞課件
- IEC60068系列標(biāo)準(zhǔn)清單
評(píng)論
0/150
提交評(píng)論