版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
CNAS-GLXXX:202X第2頁共30頁
醫(yī)學(xué)實(shí)驗(yàn)室基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制方法
建立及評(píng)估指南
1范圍
本文件為醫(yī)學(xué)實(shí)驗(yàn)室開展患者數(shù)據(jù)作為實(shí)時(shí)質(zhì)量控制方法的建立、評(píng)估以
及信息系統(tǒng)的應(yīng)用提供指導(dǎo),也適用于即時(shí)檢驗(yàn)(POCT)系統(tǒng)檢測(cè)。
本文件適用于申請(qǐng)認(rèn)可或已獲認(rèn)可的醫(yī)學(xué)實(shí)驗(yàn)室,也可供評(píng)審員在現(xiàn)場(chǎng)評(píng)
審過程中參考使用。
2規(guī)范性引用文件
下列文件對(duì)于本指南的應(yīng)用是必不可少的。凡是注明日期的引用文件,僅
該版本適用于本指南。凡是未注明日期的引用文件,其最新版本(包括所有的
修改部分)適用于本指南。
GB/T19000質(zhì)量管理體系—基礎(chǔ)和術(shù)語
GB/T20468臨床實(shí)驗(yàn)室定量測(cè)定室內(nèi)質(zhì)量控制指南
GB/T29790即時(shí)檢驗(yàn)質(zhì)量和能力的要求
GB/T36344信息技術(shù)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)
GB/T41867信息技術(shù)人工智能術(shù)語
GB/T5271.31信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)
3術(shù)語和定義
GB/T22576和ISO15189界定的術(shù)語和定義適用于本文件。為方便使用列出
以下術(shù)語和定義:
3.1質(zhì)量控制qualitycontrol
質(zhì)量管理的一部分,致力于滿足質(zhì)量要求。
[GB/T19000-2016,定義3.3.7]
3.2基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制Patient-basedreal-timequality
control;PBRTQC
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第3頁共30頁
使用患者樣本實(shí)時(shí)計(jì)算的參數(shù)作為質(zhì)量控制的一種形式。
3.3數(shù)據(jù)data
信息的可再解釋的形式化表示,以適用于通信、解釋或處理。
注:可以通過人工或自動(dòng)手段處理數(shù)據(jù)。
[GB/T33644-2018,定義2.1]
3.4數(shù)據(jù)集dataset
具有一定主題,可以標(biāo)識(shí)并可以被計(jì)算機(jī)化處理的數(shù)據(jù)集合。
[GB/T33644-2018,定義2.6]
3.5被控變量controlledvariable
監(jiān)測(cè)過程內(nèi)被監(jiān)測(cè)的研究對(duì)象。
3.6運(yùn)算程序operationprogram
基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制方法所需的算法及其對(duì)應(yīng)的參數(shù)。
注:在本指南中,術(shù)語“運(yùn)算程序”的參數(shù)具有廣泛的含義包括但不限于
以下內(nèi)容:
a)截?cái)嘞辴runcationlimit;TL
b)控制限controllimit;CL
c)步長(zhǎng)blocksize
3.7步長(zhǎng)blocksize
監(jiān)測(cè)過程中固定長(zhǎng)度的患者數(shù)量。
3.8超參數(shù)superparameter
算法過程中涉及的內(nèi)部參數(shù)。
3.9學(xué)習(xí)策略learningstrategy
學(xué)習(xí)技術(shù)的使用優(yōu)先于其應(yīng)用的一種規(guī)劃。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第4頁共30頁
[GB/T5271.31-2006,定義31.01.05]
3.10監(jiān)督(式)學(xué)習(xí)supervisedlearning
獲得的知識(shí)的正確性通過來自外部知識(shí)源的反饋加以測(cè)試的學(xué)習(xí)策略。
[GB/T5271.31-2006,定義31.03.08]
3.11無監(jiān)督學(xué)習(xí)unsupervisedlearning
一種學(xué)習(xí)策略,它在于觀察并分析不同的實(shí)體以及確定某些子集能分組到
一定的類別里,而無需在獲得的知識(shí)上通過來自外部知識(shí)源的反饋,以實(shí)現(xiàn)任
何正確性測(cè)試。
[GB/T5271.31-2006,定義31.01.09]
3.12分類模型classificationmodel
<機(jī)器學(xué)習(xí)>一種對(duì)給定輸人數(shù)據(jù),輸出其所屬的一個(gè)或多個(gè)類別的機(jī)器學(xué)習(xí)
模型。
[GB/T41867-2022,定義3.2.6]
3.13回歸模型regressionmodel
以給定數(shù)值為輸入,預(yù)期的輸出為連續(xù)變量的機(jī)器學(xué)習(xí)模型。
[GB/T41867-2022,定義3.2.8]
3.14機(jī)器學(xué)習(xí)machinelearning
通過計(jì)算技術(shù)優(yōu)化模型參數(shù)的過程,使模型的行為反映數(shù)據(jù)或經(jīng)驗(yàn)。
[GB/T41867-2022,定義3.2.10]
3.15機(jī)器學(xué)習(xí)模型machinelearningmodel
一種基于輸入數(shù)據(jù)或信息生成推理或預(yù)測(cè)的計(jì)算結(jié)構(gòu)。
示例:如果一個(gè)單變量線性方程()經(jīng)由線性回歸訓(xùn)練,則結(jié)
果模型為。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第5頁共30頁
注:一個(gè)機(jī)器學(xué)習(xí)模型是基于機(jī)器學(xué)習(xí)算法訓(xùn)練的結(jié)果。
[GB/T41867-2022,定義3.2.11]
3.16機(jī)器學(xué)習(xí)算法machineearningalgorithm
依據(jù)給定的準(zhǔn)則,根據(jù)數(shù)確定機(jī)器學(xué)習(xí)模型參數(shù)的算法。
示例:考慮求解一個(gè)單變量線性函數(shù),其中是輸出或結(jié)果,
是輸入,是截距(時(shí)的值),是權(quán)重。在機(jī)器學(xué)習(xí)中,確定線性函數(shù)的
截距和權(quán)重的過程稱為線性回歸。
[GB/T41867-2022,定義3.2.12]
3.17數(shù)據(jù)標(biāo)注datalabelling
給數(shù)據(jù)樣本指定目標(biāo)變量和賦值的過程。
[GB/T41867-2022,定義3.2.29]
3.18允許總誤差allowabletotalerror,TEa
指分析過程需要達(dá)到的質(zhì)量目標(biāo),即單次測(cè)量或單次檢測(cè)結(jié)果內(nèi)不精密度
(隨機(jī)誤差)和偏倚(系統(tǒng)誤差)可允許的最大誤差范圍。
注1:在質(zhì)量控制計(jì)劃中,假定無標(biāo)本特異性影響,因?yàn)闃?biāo)本特異性屬方
法整體性能的一部分,非質(zhì)量控制監(jiān)測(cè)范圍。
注2:有些出版物將允許總誤差稱為“ATE”。
[CLSIC244thed,術(shù)語]
3.19系統(tǒng)測(cè)量誤差systematicmeasurementerror
簡(jiǎn)稱系統(tǒng)誤差(systematicerror)
在重復(fù)測(cè)量中保持恒定不變或按可預(yù)見方式變化的測(cè)量誤差的分量。
[JJF1001-2011,定義5.4]
3.20隨機(jī)測(cè)量誤差randommeasurementerror
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第6頁共30頁
簡(jiǎn)稱隨機(jī)誤差(randomerror)
在重復(fù)測(cè)量中按不可預(yù)見方式變化的測(cè)量誤差的分量。
[JJF1001-2011,定義5.6]
3.21瞬態(tài)誤差transienterror
隨樣本而來去或影響后續(xù)樣本的誤差。
注:在質(zhì)量控制中,瞬態(tài)誤差是發(fā)生在樣本檢測(cè)過程中的錯(cuò)誤,通常是樣
本準(zhǔn)備階段及分析前產(chǎn)生的,如微小凝塊、微小氣泡、干擾物質(zhì)等,這類錯(cuò)誤
由于在分析前、分析后缺乏識(shí)別標(biāo)記,本質(zhì)上是隨機(jī)發(fā)生的。
3.22特異性specificity
在出現(xiàn)干擾現(xiàn)象(影響量)時(shí),實(shí)驗(yàn)或檢測(cè)程序能夠正確地識(shí)別或定量確
定某一實(shí)體物質(zhì)的能力。
注:在質(zhì)量控制中,是指當(dāng)特定原因變異確實(shí)不存在時(shí),質(zhì)量控制系統(tǒng)能
夠指出特定原因變異不存在的概率。
[WS/T415-2013,術(shù)語2.8]
3.23敏感度sensitivity
測(cè)量系統(tǒng)的示值變化除以相應(yīng)的被測(cè)量值變化所得的商。
注1:在質(zhì)量控制中,是指質(zhì)量控制系統(tǒng)檢測(cè)誤差的能力。
注2:在定性實(shí)驗(yàn)中,是指實(shí)驗(yàn)方法獲得陽性結(jié)果的能力。
[WS/T415-2013,術(shù)語2.7]
3.24分析中檢查IntraSpectCheck
樣本檢測(cè)過程中對(duì)異常的傳感器錯(cuò)誤進(jìn)行實(shí)時(shí)的監(jiān)測(cè)。
4概述
基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制方法是采用算法軟件動(dòng)態(tài)監(jiān)測(cè)患者數(shù)據(jù),實(shí)
現(xiàn)對(duì)檢測(cè)過程分析性能連續(xù)監(jiān)控的質(zhì)量控制方法。該類方法將針對(duì)儀器的質(zhì)量
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第7頁共30頁
控制問題轉(zhuǎn)化為針對(duì)數(shù)據(jù)的分析問題,按照算法原理可分為統(tǒng)計(jì)學(xué)方法和機(jī)器
學(xué)習(xí)方法。其中,統(tǒng)計(jì)學(xué)方法是基于歷史數(shù)據(jù)統(tǒng)計(jì)分析得出用于檢測(cè)應(yīng)用階段
的最優(yōu)控制限;機(jī)器學(xué)習(xí)方法采用學(xué)習(xí)策略構(gòu)建出用于檢測(cè)應(yīng)用階段的機(jī)器學(xué)
習(xí)模型。
歷
統(tǒng)計(jì)學(xué)方法
史
數(shù)據(jù)清洗分析處理浮動(dòng)特征值計(jì)算最優(yōu)控制限
檢
測(cè)
機(jī)器學(xué)習(xí)方法
數(shù)
數(shù)據(jù)清洗分析處理模型訓(xùn)練
據(jù)最優(yōu)模型
圖1基于患者數(shù)據(jù)的質(zhì)量控制算法構(gòu)建流程
5數(shù)據(jù)采集
5.1數(shù)據(jù)選擇
應(yīng)選擇相對(duì)穩(wěn)定的患者人群的檢測(cè)結(jié)果,排除分析系統(tǒng)改變以外的變異因
素,包括但不限于:
1)病、生理因素導(dǎo)致的個(gè)體生物學(xué)變異;
2)待測(cè)物整體人群中的不同亞組,如兒童、性別、孕產(chǎn)期等;
3)患者類型的影響,如一周內(nèi)某天實(shí)驗(yàn)室檢測(cè)透析室患者,當(dāng)天肌酐檢測(cè)數(shù)
量標(biāo)本數(shù)增多,導(dǎo)致該時(shí)段的平均肌酐濃度的檢測(cè)值升高;
4)對(duì)于某些測(cè)試,因臨床解釋不同導(dǎo)致的樣本結(jié)果錯(cuò)誤診斷和分類。
5.2數(shù)據(jù)排除
對(duì)于同一檢驗(yàn)項(xiàng)目,實(shí)驗(yàn)室存在如下情況數(shù)據(jù)時(shí),應(yīng)制定人工或自動(dòng)手段
清洗數(shù)據(jù)的規(guī)則,包括但不限于以下情況:
1)檢測(cè)的標(biāo)本為非患者結(jié)果,如質(zhì)控品結(jié)果及科研用途的標(biāo)本結(jié)果;
2)檢測(cè)的標(biāo)本類型不同,如肌酐項(xiàng)目的血清標(biāo)本和尿液標(biāo)本;
3)多地點(diǎn)或場(chǎng)所使用的檢測(cè)系統(tǒng),如中心實(shí)驗(yàn)室、急診實(shí)驗(yàn)室、發(fā)熱門診
實(shí)驗(yàn)室;
4)不符合運(yùn)算程序要求。
注:基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制運(yùn)算程序?qū)?shù)據(jù)要求不同,如delta
check運(yùn)算程序需要收集相同患者兩次臨近標(biāo)本的檢測(cè)結(jié)果。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第8頁共30頁
5.3采集方式
1)實(shí)驗(yàn)室宜選擇不少于一年患者歷史數(shù)據(jù),分年齡、性別、臨床服務(wù)、醫(yī)
囑申請(qǐng)科室、日期和時(shí)間繪制散點(diǎn)圖,觀察數(shù)據(jù)分布情況、單位時(shí)間內(nèi)測(cè)試數(shù)
量等,用于數(shù)據(jù)篩選;
2)應(yīng)保持患者數(shù)據(jù)的時(shí)間序列特征,并保證每個(gè)患者數(shù)據(jù)的可追溯性;
3)患者的描述性信息可作為運(yùn)算程序的數(shù)據(jù)參數(shù),包括,患者唯一識(shí)別號(hào)、
性別、年齡、申請(qǐng)科室、臨床診斷、用藥情況等。
6數(shù)據(jù)處理
6.1失控仿真[1]
當(dāng)真實(shí)場(chǎng)景中誤差場(chǎng)景和類型覆蓋范圍不全時(shí),實(shí)驗(yàn)室應(yīng)充分評(píng)估可能存
在的誤差類型并進(jìn)行數(shù)據(jù)仿真,如系統(tǒng)誤差(包括比例誤差和恒定誤差)、隨
機(jī)誤差等。
1)系統(tǒng)誤差按如下公式計(jì)算:
恒定誤差:
′??×?????×???????????????????(1)
注:′為引入恒定誤差的檢測(cè)結(jié)果;為質(zhì)量在控的檢驗(yàn)結(jié)果;??為誤
差因子,取值為±1/6、±1/4、±1/2、±1、±1.5;?????為項(xiàng)目的允許總
誤差;?為所有質(zhì)量在控檢驗(yàn)結(jié)果的平均值。
比例誤差:
′×(??×?????)?????????????????(2)
注:x為引入比例誤差的檢測(cè)結(jié)果;為質(zhì)量在控的檢驗(yàn)結(jié)果;??為誤
差因子,取值為-0.5、-0.48、-0.46、...、0.46、0.48、0.5。
2)隨機(jī)誤差按如下公式計(jì)算:
xxe???????????????????????(3)
注1:為引入隨機(jī)誤差的檢測(cè)結(jié)果;為質(zhì)量在控的檢驗(yàn)結(jié)果;為引
入的噪音成分。
注2:隨機(jī)誤差分布類型可分為含高斯分布、形分布、均勻分布三類。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第9頁共30頁
高斯分布隨機(jī)失控狀態(tài)中的高斯分布誤差采用高斯抽樣方式生成,均值滿
足±0.3、±0.5、0倍?????,標(biāo)準(zhǔn)差滿足1/3、1/2、1.5、3倍的原檢測(cè)結(jié)果
的標(biāo)準(zhǔn)差;U形分布隨機(jī)失控狀態(tài)中的U形分布噪音采用高斯抽樣方式生成,
均值滿足±0.3、±0.5、0倍?????,標(biāo)準(zhǔn)差滿足1/3、1/2、1.5、3倍的原檢
測(cè)結(jié)果的標(biāo)準(zhǔn)差;均勻分布隨機(jī)失控狀態(tài)中的均勻分布噪音是采用均勻抽
樣方式生成,上下限范圍滿足±0.3、±0.5、0倍?????或1/3、1/2、1.5、3
倍的原檢測(cè)結(jié)果的標(biāo)準(zhǔn)差。
6.2樣本擴(kuò)充
在建立方法階段,當(dāng)患者數(shù)據(jù)的數(shù)量不滿足建立需求時(shí),應(yīng)通過數(shù)據(jù)衍生
以擴(kuò)充數(shù)據(jù)量。衍生時(shí)應(yīng)基于數(shù)據(jù)特征進(jìn)行仿造,加隨機(jī)噪聲的方式擴(kuò)充患者
數(shù)據(jù)集。
7方法建立
實(shí)驗(yàn)室應(yīng)根據(jù)患者數(shù)據(jù)分布特點(diǎn)及質(zhì)量控制要求,進(jìn)行方法的建立、優(yōu)化
及應(yīng)用,并記錄。
7.1檢測(cè)范圍約束
實(shí)驗(yàn)室對(duì)患者數(shù)據(jù)清洗后,應(yīng)約束數(shù)據(jù)的有效檢測(cè)范圍,如去除特殊科室、
特殊時(shí)間段對(duì)應(yīng)的人群樣本。對(duì)所得患者數(shù)據(jù)進(jìn)行過濾時(shí),比例應(yīng)控制在5%以
內(nèi)。
7.2數(shù)據(jù)攔截
實(shí)驗(yàn)室應(yīng)對(duì)患者數(shù)據(jù)的離群值進(jìn)行攔截處理。應(yīng)根據(jù)不同方法設(shè)置截?cái)嘞?/p>
(truncationlimit,TL)進(jìn)行數(shù)據(jù)攔截,包括:
1)統(tǒng)計(jì)學(xué)方法應(yīng)至少比較兩種攔截方式,如去除和替換離群值。
示例:采用Winsorization方法替換離群值。如公式(4)所示,其中x
指處理前數(shù)值,x’指處理后數(shù)值:
????
′{,替換
????
{??????????????(4)
??
′{,去除
??
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第10頁共30頁
2)機(jī)器學(xué)習(xí)方法應(yīng)至少比較兩種聚類算法,宜采用無監(jiān)督(式)學(xué)習(xí)算法,
如孤立森林、K鄰近等。
7.3數(shù)據(jù)轉(zhuǎn)態(tài)
應(yīng)測(cè)試患者數(shù)據(jù)轉(zhuǎn)正態(tài)的方式,尋找符合檢測(cè)項(xiàng)目的轉(zhuǎn)態(tài)方法。
示例:Box-Cox轉(zhuǎn)正態(tài)方式處理,數(shù)據(jù)變換方式如公式(5)所示,其中x’
指處理前數(shù)值,x’’指處理后數(shù)值:
′,????
′′
{??????????????(5)
{,
??
7.4樣本建立
應(yīng)根據(jù)不同算法的原理,提取患者數(shù)據(jù)特征并轉(zhuǎn)化為建立方法所需的質(zhì)量
控制樣本。
7.4.1統(tǒng)計(jì)學(xué)方法
提取患者數(shù)據(jù)特征值的算法應(yīng)包括但不限于以下種類:
1)固定數(shù)量患者數(shù)據(jù)的平均值(MA);
2)在1)的基礎(chǔ)上引入加權(quán)平均值(EWMA);
3)固定數(shù)量患者數(shù)據(jù)的中位數(shù)(MM);
4)固定數(shù)量患者數(shù)據(jù)的統(tǒng)計(jì)中位數(shù)(HD50);
5)固定數(shù)量患者數(shù)據(jù)的統(tǒng)計(jì)標(biāo)準(zhǔn)差(MovSD);
6)固定數(shù)量患者數(shù)據(jù)的超出臨床決定限的特殊數(shù)據(jù)個(gè)數(shù)(MovSO)。
建立方法的過程應(yīng)至少包含3種特征提取算法,計(jì)算出的特征值相當(dāng)于質(zhì)量
控制變量作為后續(xù)操作的樣本素材。
7.4.2機(jī)器學(xué)習(xí)方法
對(duì)患者數(shù)據(jù)應(yīng)進(jìn)行預(yù)處理以滿足建立模型需求,包括但不限于以下步驟:
數(shù)據(jù)標(biāo)準(zhǔn)化、按固定長(zhǎng)度組織隊(duì)列,將處理后的數(shù)據(jù)做為后續(xù)操作的樣本素材,
劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
7.5運(yùn)算程序的建立
統(tǒng)計(jì)學(xué)方法程序建立應(yīng)從樣本中得出數(shù)值范圍做為質(zhì)量控制的控制限。機(jī)
器學(xué)習(xí)方法程序建立應(yīng)包括兩種場(chǎng)景:采用回歸算法用于學(xué)習(xí)樣本的控制限,
或者采用分類算法直接用于判斷質(zhì)量控制結(jié)果。實(shí)驗(yàn)室應(yīng)對(duì)每個(gè)檢驗(yàn)項(xiàng)目的運(yùn)
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第11頁共30頁
算程序進(jìn)行參數(shù)設(shè)置,并定期評(píng)估調(diào)整。
7.5.1控制限選取方法
實(shí)驗(yàn)室應(yīng)根據(jù)被控變量的分布情況選擇適宜的控制限,用于判斷在控和失
控狀態(tài)。不同的方法控制限的性質(zhì)和單位不同,如,統(tǒng)計(jì)學(xué)方法控制限的性質(zhì)
和單位取決于7.4.1提取特征對(duì)應(yīng)的算法;機(jī)器學(xué)習(xí)的分類模型控制限的性質(zhì)
為預(yù)測(cè)概率。
其中,統(tǒng)計(jì)學(xué)方法的控制限計(jì)算方法包括但不限于:
1)對(duì)稱統(tǒng)計(jì)法:控制限下限(lowercontrollimit,LCL)和控制限上限
(uppercontrollimit,UCL)設(shè)置公式為:???×,其中?、為被控
變量的均值和標(biāo)準(zhǔn)差,n為倍數(shù);
2)所有日統(tǒng)計(jì)法:如適用,采用模擬多個(gè)實(shí)驗(yàn)日方式時(shí),以所有實(shí)驗(yàn)日下
被控變量的0.5%和99.5%分位數(shù)做為控制限的下限和上限;
3)日極值統(tǒng)計(jì)法:如適用,采用模擬多個(gè)實(shí)驗(yàn)日方式時(shí),統(tǒng)計(jì)每個(gè)模擬實(shí)
驗(yàn)日被控變量的最小值,在所有模擬實(shí)驗(yàn)日的最小值中取5%分位數(shù)做為控制限
下限;同樣的方式,取所有模擬實(shí)驗(yàn)日患者數(shù)據(jù)最大值的95%分位數(shù)做為控制限
上限。
7.5.2機(jī)器學(xué)習(xí)模型
如適用,應(yīng)根據(jù)程序的目標(biāo)進(jìn)行相應(yīng)的樣本標(biāo)注以完成監(jiān)督(式)學(xué)習(xí)。
若采用回歸模型,應(yīng)將7.5.1得出的控制限做為被預(yù)測(cè)值;若采用分類模型,應(yīng)
將6.1或6.2得出的失控?cái)?shù)據(jù)和在控?cái)?shù)據(jù)按7.4.2形成樣本,將數(shù)據(jù)質(zhì)量狀態(tài)做為
分類標(biāo)簽。
訓(xùn)練模型所用算法應(yīng)包括但不限于:邏輯回歸(LogisticRegression)、
決策樹(DecisionTree)、支持向量機(jī)(SupportVectorMachine,SVM)、K
最近鄰(K-NearestNeighbors,K-NN)、隨機(jī)森林(RandomForest)、神經(jīng)
網(wǎng)絡(luò)(NeuralNetwork)、貝葉斯分類器(NaiveBayesClassifier)
7.6運(yùn)算程序的優(yōu)化與驗(yàn)證
實(shí)驗(yàn)室應(yīng)結(jié)合應(yīng)用需求制定適宜的優(yōu)化過程及參數(shù)設(shè)置規(guī)則,包括:
1)如適用,應(yīng)對(duì)各參數(shù)給出合理取值范圍,在所有參數(shù)的組合下進(jìn)行遍歷
實(shí)驗(yàn),按照合理的尋優(yōu)法則選出最佳參數(shù)。適用于或者針對(duì)參數(shù)設(shè)立目標(biāo)函數(shù),
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第12頁共30頁
如褪火算法、遺傳算法等優(yōu)化算法選擇最佳參數(shù)。
2)采用機(jī)器學(xué)習(xí)方法時(shí),應(yīng)根據(jù)選擇算法特點(diǎn)進(jìn)行模型調(diào)優(yōu)??烧{(diào)節(jié)的因
素有:步長(zhǎng)長(zhǎng)度、過濾數(shù)據(jù)比例,分類算法的超參數(shù),調(diào)節(jié)過程方法包括但不
限于網(wǎng)格搜索或經(jīng)驗(yàn)法,調(diào)節(jié)期間通過驗(yàn)證集觀察,驗(yàn)證方法包括但不限于交
叉驗(yàn)證。
8運(yùn)算程序的評(píng)估內(nèi)容和方法
8.1評(píng)估內(nèi)容
8.1.1臨床評(píng)估
8.1.1.1評(píng)估指標(biāo)
1)混淆矩陣相關(guān)指標(biāo)包括:準(zhǔn)確度(ACC)、真陽率(TPR)、真陰率
(TNR)、假陽率(FPR)、假陰率(FNR);
2)臨床驗(yàn)證的指標(biāo)包括:從引入誤差到報(bào)警所經(jīng)過的患者樣本數(shù)量
(Nped),所有測(cè)試天數(shù)中Nped平均數(shù)(ANped)、所有測(cè)試天數(shù)中,Nped中位
數(shù)(MNped)、所有測(cè)試天數(shù)中,Nped95分位數(shù)(Nped_95)、不穩(wěn)定指標(biāo)(I)。
注:I=NPed的四分位數(shù)間距/MNPed,I值表征一批數(shù)據(jù)的離散程度,
可反應(yīng)所有測(cè)試天的NPed結(jié)果的穩(wěn)定性,I值越大說明算法越不穩(wěn)定。
8.1.1.2具體方案
1)實(shí)驗(yàn)室應(yīng)根據(jù)檢驗(yàn)項(xiàng)目的預(yù)期用途和性能要求,制定適宜的質(zhì)量控制合
格標(biāo)準(zhǔn),評(píng)估的數(shù)據(jù)至少達(dá)到10000個(gè)。
2)實(shí)驗(yàn)室制定評(píng)估標(biāo)準(zhǔn)時(shí),應(yīng)參考制造商或研發(fā)者聲明、相關(guān)標(biāo)準(zhǔn)、公開
發(fā)表的臨床應(yīng)用指南和專家共識(shí)等。
3)方法臨床評(píng)估結(jié)果應(yīng)滿足誤差檢出概率達(dá)95%以上,且假失控概率/假陽
性率在1%以下,且評(píng)估結(jié)果應(yīng)結(jié)合質(zhì)控圖進(jìn)行量化展示,如誤差檢出圖、柱狀
圖等。
4)采用機(jī)器學(xué)習(xí)方法時(shí),應(yīng)增加對(duì)算法模型性能的評(píng)估。
8.1.2計(jì)量學(xué)評(píng)估
采用計(jì)量學(xué)評(píng)估應(yīng)至少包括以下方法一種:
1)將基于患者數(shù)據(jù)的質(zhì)量控制算法軟件的計(jì)算結(jié)果溯源至數(shù)字量具;
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第13頁共30頁
2)將基于患者數(shù)據(jù)的質(zhì)量控制算法軟件的計(jì)算結(jié)果溯源至算法量具。
通過上述方法,將算法模型的輸出結(jié)果溯源至物理世界的實(shí)際量值,并通
過一條具有測(cè)量不確定度、不間斷的計(jì)量溯源鏈,最終溯源到國(guó)家基標(biāo)準(zhǔn),實(shí)
現(xiàn)輸出結(jié)果準(zhǔn)確性的計(jì)量學(xué)評(píng)價(jià),并使同類算法軟件的輸出結(jié)果具備一定的可
比性。
8.1.3前瞻性臨床評(píng)估
收集臨床出現(xiàn)的質(zhì)量失控的數(shù)據(jù),應(yīng)將數(shù)字孿生后進(jìn)行質(zhì)量控制方法性能
評(píng)估,至少半年進(jìn)行一次評(píng)估,孿生前質(zhì)量失控?cái)?shù)據(jù)應(yīng)至少達(dá)到500條。
9評(píng)估方法
9.1實(shí)施前評(píng)估
實(shí)驗(yàn)室在正式實(shí)施自行開發(fā)/引進(jìn)具有基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制運(yùn)算程序
的軟件之前,應(yīng)對(duì)程序的功能、參數(shù)、規(guī)則進(jìn)行評(píng)估,確保符合實(shí)驗(yàn)室的要求。
評(píng)估的內(nèi)容應(yīng)包含但不限于:
1)應(yīng)對(duì)運(yùn)算程序的所有功能、規(guī)則及參數(shù)進(jìn)行評(píng)估,保證其性能符合實(shí)驗(yàn)
室的要求;
2)應(yīng)逐一評(píng)估運(yùn)算程序所涉及的檢測(cè)項(xiàng)目和樣品類型;
3)應(yīng)評(píng)估運(yùn)算程序識(shí)別患者數(shù)據(jù)出現(xiàn)報(bào)警的具體位置;
4)評(píng)估時(shí)間宜不少于3個(gè)月和/或患者數(shù)據(jù)不少于50000條。
9.2必要時(shí)評(píng)估
在使用運(yùn)算程序過程中,若發(fā)生儀器設(shè)備更新、運(yùn)算程序參數(shù)變更、信息
系統(tǒng)升級(jí)等可能影響其功能的改變都應(yīng)對(duì)其進(jìn)行評(píng)估,確保符合要求后方可繼
續(xù)使用。評(píng)估的內(nèi)容、數(shù)據(jù)量可由實(shí)驗(yàn)室根據(jù)變更內(nèi)容確定。
9.3定期評(píng)估
由指定人員對(duì)運(yùn)算程序進(jìn)行復(fù)核。至少半年進(jìn)行一次評(píng)估,評(píng)估數(shù)據(jù)量不
少于10000份。
9.4評(píng)估參數(shù)
9.4.1假性失控概率(,falsepositiverate)
采用質(zhì)量在控?cái)?shù)據(jù)輸入算法進(jìn)行計(jì)算。
???∑?×%???????????????(6)
??=?
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第14頁共30頁
式中:
??——在控?cái)?shù)據(jù)個(gè)數(shù);
?——第個(gè)實(shí)際判定結(jié)果,取值為0(判定在控狀態(tài))或者1(判定
失控狀態(tài))。
9.4.2誤差檢出概率(T,truepositiverate)
采用質(zhì)量失控?cái)?shù)據(jù)輸入算法進(jìn)行計(jì)算。
????∑?×%????????????????(7)
??=?
式中:
??——失控?cái)?shù)據(jù)個(gè)數(shù);
?——第個(gè)實(shí)際判定結(jié)果,取值為0(判定在控狀態(tài))或者1(判定
失控狀態(tài))。
9.4.3誤差檢出前影響的患者標(biāo)本數(shù)
從誤差引入到檢出所影響的患者樣本數(shù)(NPed)、NPed的均值(ANPed)、
NPed的中位數(shù)(MNPed)、95分位數(shù)NPed(95NPed)的結(jié)果及不穩(wěn)定指數(shù)(I)。
10信息化功能要求
醫(yī)學(xué)實(shí)驗(yàn)室可使用實(shí)驗(yàn)室信息系統(tǒng)或者中間件實(shí)施基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)
量控制。實(shí)驗(yàn)室可自行設(shè)置或采用已具備本方法程序的信息系統(tǒng)實(shí)施基于患者
數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制。
10.1實(shí)驗(yàn)室信息系統(tǒng)要求
實(shí)驗(yàn)室信息系統(tǒng)應(yīng)具備信息收集、數(shù)據(jù)提取、數(shù)據(jù)導(dǎo)出等功能,至少包含
以下信息:
1)患者識(shí)別號(hào);
2)患者性別;
3)患者出生日期/年齡(至少小數(shù)點(diǎn)后一位)
4)實(shí)驗(yàn)室檢測(cè)日期及時(shí)間(小時(shí)、分鐘、秒);
5)運(yùn)算程序的參數(shù);
6)實(shí)驗(yàn)室標(biāo)本類型;
7)實(shí)驗(yàn)室儀器檢測(cè)非患者材料(外部QC、透析液、動(dòng)物研究樣本、研究樣
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第15頁共30頁
本等);
8)標(biāo)本收集條件(如,定時(shí)收集的標(biāo)本);
9)標(biāo)本申請(qǐng)科室;
10)臨床申請(qǐng)內(nèi)容/類型;
11)實(shí)驗(yàn)室檢測(cè)結(jié)果;
12)使用的試劑批號(hào);
13)檢測(cè)狀態(tài)標(biāo)簽(如,儀器、溶血、黃疸、血脂指數(shù)等);
14)初次檢測(cè)或復(fù)測(cè)標(biāo)本;
15)檢測(cè)項(xiàng)目的單位;
16)患者歷史結(jié)果。
10.2使用要求
1)應(yīng)有簡(jiǎn)單易操作的用戶界面,方便操作人員選擇、提取運(yùn)算程序的參
數(shù);
2)應(yīng)具備數(shù)據(jù)變換的計(jì)算功能,如自然對(duì)數(shù)、平方根、Boxcox、冪變換,
以及各種比率的計(jì)算等。
3)應(yīng)具備一定統(tǒng)計(jì)分析功能,允許用戶計(jì)算簡(jiǎn)單的統(tǒng)計(jì)數(shù)據(jù),如平均值、
中位數(shù)、百分位數(shù)及標(biāo)準(zhǔn)差等;
4)應(yīng)具備參數(shù)計(jì)算功能,如數(shù)據(jù)截?cái)?、參與計(jì)算的患者標(biāo)本數(shù)等;
5)應(yīng)具備數(shù)據(jù)模擬仿真功能;
6)應(yīng)提供幾種可選不同工作原理算法,如移動(dòng)均值、指數(shù)加權(quán)移動(dòng)均值、
移動(dòng)中位數(shù)和機(jī)器學(xué)習(xí)算法等;
7)應(yīng)有明確定義的實(shí)時(shí)警報(bào)形式,并可在故障排除后進(jìn)行確認(rèn)和重置。
在檢查警報(bào)后,應(yīng)該能夠重置算法并排除特定患者;
8)應(yīng)記錄確認(rèn)報(bào)警人的姓名和時(shí)間,且用戶可在質(zhì)量控制圖上進(jìn)行報(bào)警
注釋,并生成報(bào)告;
9)應(yīng)可隨時(shí)進(jìn)行質(zhì)量控制運(yùn)算而不觸發(fā)失控報(bào)警;
10)應(yīng)具備數(shù)據(jù)可視化功能,可進(jìn)行質(zhì)控圖展示,包括但不限于Levey-
Jenney圖、Z分?jǐn)?shù)圖、MNped曲線圖(圖2),以及柱狀圖等。
示例:MNped曲線圖
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第16頁共30頁
圖2MNped圖
10.3數(shù)據(jù)安全
實(shí)驗(yàn)室應(yīng)保證數(shù)據(jù)存儲(chǔ)、傳輸和備份的完整性:
1)信息系統(tǒng)應(yīng)保證實(shí)驗(yàn)室數(shù)據(jù)存儲(chǔ)介質(zhì)的存放、運(yùn)輸?shù)任锢戆踩?/p>
2)數(shù)據(jù)獲取、傳輸和使用應(yīng)符合安全及患者隱私的法規(guī)要求;
3)如需將數(shù)據(jù)傳輸?shù)降谌綉?yīng)用程序,應(yīng)對(duì)數(shù)據(jù)集進(jìn)行去標(biāo)識(shí)處理。
10.4設(shè)施和環(huán)境條件:
實(shí)驗(yàn)室宜選擇在Windows或Linux下運(yùn)行,運(yùn)算工具包括但不限于:
Python3.7.3“numpy”,”pandas”,“sklearn”等工具包。
10.5患者數(shù)據(jù)采集設(shè)施:
在實(shí)施室間質(zhì)量評(píng)價(jià)時(shí),應(yīng)具備以下功能:
1)數(shù)據(jù)過濾:選擇門診患者數(shù)據(jù),實(shí)驗(yàn)室可自定義步長(zhǎng)、時(shí)間窗口長(zhǎng)度、
過濾周末及節(jié)假日患者數(shù)據(jù)功能。
2)算法考量:宜采用統(tǒng)計(jì)學(xué)方法更為穩(wěn)定的MM算法,可計(jì)算每日中位
數(shù)或浮動(dòng)中位數(shù)。
3)分組原則:應(yīng)按照專業(yè)、項(xiàng)目設(shè)計(jì)分組方法,如:血細(xì)胞分析項(xiàng)目可按
儀器分組,生化項(xiàng)目可按方法學(xué)分組。對(duì)實(shí)驗(yàn)室數(shù)少或儀器數(shù)量少的組,可缺
省組處理;或通過散點(diǎn)圖區(qū)別顯示方式,若實(shí)驗(yàn)室所使用的儀器有別于其他實(shí)
驗(yàn)室,散點(diǎn)圖中對(duì)該實(shí)驗(yàn)室數(shù)據(jù)顏色加以區(qū)分,該實(shí)驗(yàn)室數(shù)據(jù)僅用于監(jiān)測(cè),不參
均值和控制限計(jì)算。
4)控制限設(shè)置:應(yīng)根據(jù)方法原則上遵循:基于患者數(shù)據(jù)的室間質(zhì)量評(píng)價(jià)的
控制限宜小于該項(xiàng)目的室間質(zhì)評(píng)標(biāo)準(zhǔn),而大于室內(nèi)質(zhì)控標(biāo)準(zhǔn)??蛇x擇基于生物
學(xué)變異的偏移標(biāo)準(zhǔn)設(shè)置控制限,兩者取較大值。在實(shí)際操作中可根據(jù)項(xiàng)目的穩(wěn)
定性進(jìn)行適當(dāng)調(diào)整。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第17頁共30頁
5)提供信息:實(shí)驗(yàn)室可依據(jù)單個(gè)實(shí)驗(yàn)室、同實(shí)驗(yàn)室組或所有儀器組提供長(zhǎng)
期中位數(shù)、長(zhǎng)效精密度、同組偏移或所有設(shè)備靶值等信息。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GL0XX:202X第18頁共30頁
附錄A
(資料性)
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制算法中英文對(duì)照
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制算法中英文對(duì)照見表A.1。
表A.1基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制算法中英文對(duì)照表
英文簡(jiǎn)稱英文全稱中文全稱
AONAverageofnormal正態(tài)平均值法
MAMovingaverage移動(dòng)均值法
EWMAExponentiallyweightedmovingaverage指數(shù)加權(quán)移動(dòng)均值法
MMMovingmedian移動(dòng)中位數(shù)法
HD50Harrel-Davis50percentileestimatorHD統(tǒng)計(jì)中數(shù)法
MovSDMovingstandarddeviation移動(dòng)標(biāo)準(zhǔn)差法
MovSOMovingsumofoutliers移動(dòng)異常值法
MovSumMovingsumofnumberofpositivepatientresult移動(dòng)陽性患者結(jié)果總和
EAMMExponentiallyAdjustedMovingMean指數(shù)調(diào)整移動(dòng)平均值法
MQMovingquartile移動(dòng)四分位數(shù)法
DCDeltacheck差值校驗(yàn)法
MPMovingpercentiles移動(dòng)百分位數(shù)法
RFRandomforest隨機(jī)森林
LRLogisticRegression邏輯回歸
SVMSupportVectorMachine支持向量機(jī)
KNNK-NearestNeighbork-最近鄰
NBCNaiveBayesianClassifier樸素貝葉斯分類器
CNAS-GL0XX:202X第19頁共30頁
附錄B
(資料性)
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制統(tǒng)計(jì)學(xué)方法建立示例
B.1數(shù)據(jù)攔截與轉(zhuǎn)態(tài)
通過醫(yī)院實(shí)驗(yàn)室部實(shí)驗(yàn)室信息系統(tǒng)選取了11萬血小板(PLT)。首先對(duì)正
常數(shù)據(jù)進(jìn)行攔截,攔截限定義為正常數(shù)據(jù)的閾值邊界對(duì)應(yīng)的分位數(shù)t,t={0,
0.01,0.05,0.2,0.4},攔截限上限為:數(shù)據(jù)的(1-t)分位數(shù);攔截限下限
為:數(shù)據(jù)的t分位數(shù)。
攔截異常點(diǎn)的方式分替換與去除兩種形式。數(shù)據(jù)攔截后,進(jìn)一步的,轉(zhuǎn)態(tài)
方式分原型和BOXCOX轉(zhuǎn)態(tài)兩種形式,原型為neat型,指數(shù)據(jù)按原級(jí)處理。
B.2數(shù)據(jù)仿真
進(jìn)一步的,將樣本分為200天,每天1150個(gè)樣本,前150為正常樣本,后
1000引入誤差做為異常樣本。對(duì)誤差數(shù)據(jù)進(jìn)行模擬,將誤差定義為比例誤差、
恒定誤差隨機(jī)誤差。
B.3遍歷實(shí)驗(yàn)
步方式長(zhǎng)按照{(diào)10,30,50,90,110,130,150}的進(jìn)行搜索,所有實(shí)驗(yàn)操
作數(shù)量見表B.1。
表B.1遍歷實(shí)驗(yàn)次數(shù)表
算法過濾方式過濾限轉(zhuǎn)正態(tài)方式步長(zhǎng)控制限計(jì)算法
ewma25273
ma25273
mm25-73
hd50--273
movSD25273
movSO---73
進(jìn)一步的,將所有實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)見表B.2,其中所有引入的誤差因子做為
表頭,排列組合形式做為首列,統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果的指標(biāo):假陽性、真陽性、真陰
性、假陰性、累計(jì)ANPed(Nped的均值)、累計(jì)95NPed(Nped的95%分位數(shù))、
MNPed(Nped的中位數(shù))。進(jìn)一步的,在正常樣本的均值數(shù)列下計(jì)算控制限。
按照當(dāng)前的控制限對(duì)每日的1150個(gè)檢測(cè)樣本進(jìn)行實(shí)驗(yàn),其中1000個(gè)異常樣本
向前選取步長(zhǎng)寬度的樣本做為一個(gè)樣本的均值計(jì)算基礎(chǔ),當(dāng)檢測(cè)到超出控制限
即算作報(bào)警,當(dāng)前對(duì)應(yīng)的序號(hào)為Nped,如果1000個(gè)樣本均為檢出,計(jì)做1100。
CNAS-GLXXX:202X第20頁共30頁
表B.2實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)表
B.4結(jié)果尋優(yōu)
在結(jié)果尋優(yōu)步驟中,綜合統(tǒng)計(jì)結(jié)果表的各項(xiàng)指標(biāo),按照一定優(yōu)先級(jí)選擇最
佳的一種結(jié)果作為該網(wǎng)格搜索實(shí)驗(yàn)的最優(yōu)解。
1)將假陽列排序,保留假陽率<5%的部分;
2)在1)的條件下,保留識(shí)別率(真陽率)≥90%的部分;
3)將累計(jì)MNped排序,選擇最小值,篩選結(jié)果不唯一時(shí),進(jìn)一步地,比較
ANPed和95NPed選最小值。
原始數(shù)據(jù)尋優(yōu)結(jié)果如圖B.1和圖B.2所示:
圖B.1代碼尋優(yōu)結(jié)果輸出截圖
由此確定質(zhì)控步長(zhǎng)是130;控制下限為73.57049;控制上限為79.13615。
圖B.2MNped曲線
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GL0XX:202X第21頁共30頁
附錄C
(資料性)
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制機(jī)器學(xué)習(xí)技術(shù)方法建立示例
C.1數(shù)據(jù)準(zhǔn)備
以ALB為例,針對(duì)專向科室、人群類別。按照數(shù)據(jù)采集、數(shù)據(jù)處理、算法
選型、訓(xùn)練調(diào)優(yōu)、模型評(píng)估步驟進(jìn)行。
采集1095000個(gè)經(jīng)過臨床驗(yàn)證的在控患者連續(xù)在控報(bào)告。同時(shí),收集相
關(guān)患者信息,包括年齡、性別、科室、樣本類型、測(cè)量時(shí)間點(diǎn)。只采集了血清
樣本。所有包括患者數(shù)據(jù)均處于對(duì)照組質(zhì)量控制狀態(tài)。歷史數(shù)據(jù)要求。
由于原始樣本均認(rèn)定為無偏下的數(shù)據(jù),按照公式仿真偏差數(shù)據(jù):x’=x×
(1+n)。其中x表示包含人工誤差的患者數(shù)據(jù),x是原始患者數(shù)據(jù),x?表示數(shù)據(jù)集
的平均值。σ表示數(shù)據(jù)集的標(biāo)準(zhǔn)偏差。n是用于控制所引起的誤差大小的因子,
n=-50%,-48%,-46%,..........46%,48%,50%。
C.2特征工程設(shè)計(jì)
控制<20%分析誤差的閾值進(jìn)行數(shù)據(jù)過濾,以消除≥20%分析誤差的荒謬或極
值。該濾波算法是針對(duì)模型訓(xùn)練中采用的兩種分類算法而定制的。
其中數(shù)據(jù)過濾利用預(yù)設(shè)聚類模型,根據(jù)異常控制比例對(duì)歷史檢測(cè)數(shù)據(jù)進(jìn)行
聚類處理,以確定聚類結(jié)果,控制比在5%-50%范圍中遍歷;根據(jù)聚類結(jié)果對(duì)預(yù)
設(shè)的初始分類模型進(jìn)行訓(xùn)練,以確定質(zhì)控分類模型;通過質(zhì)控分類模型對(duì)測(cè)試
數(shù)據(jù)進(jìn)行誤差識(shí)別測(cè)試,并根據(jù)測(cè)試結(jié)果對(duì)應(yīng)的假陽率判斷是否滿足循環(huán)結(jié)束
條件,假陽率用于表征被誤判數(shù)據(jù)占測(cè)試數(shù)據(jù)的比例,5%以內(nèi)算達(dá)標(biāo),被誤判
數(shù)據(jù)包含在誤差識(shí)別測(cè)試的被剔除數(shù)據(jù)集中;若否,則根據(jù)預(yù)設(shè)調(diào)整規(guī)則調(diào)整
異常控制比例的取值,并重新根據(jù)調(diào)整后的異常控制比例對(duì)歷史檢測(cè)數(shù)據(jù)進(jìn)行
聚類處理,重新訓(xùn)練質(zhì)控分類模型,直至假陽率滿足循環(huán)結(jié)束條件。
C.3預(yù)訓(xùn)練
將無偏和加偏分別按相同的步長(zhǎng)組隊(duì),一個(gè)步長(zhǎng)內(nèi)的一批數(shù)據(jù)為一個(gè)整體,
形成針對(duì)機(jī)器學(xué)習(xí)分類模型的樣本,無偏數(shù)據(jù)下的樣本標(biāo)記為“0”類,加偏數(shù)
據(jù)下的樣本標(biāo)記為“1”類。對(duì)樣本進(jìn)行訓(xùn)練集、驗(yàn)證集、測(cè)試集劃分,用訓(xùn)練
集進(jìn)行模型訓(xùn)練。
CNAS-GLXXX:202X第22頁共30頁
根據(jù)臨床情況和數(shù)據(jù)分布,這些誤差被分為兩類:<20%和≥20%的分析誤差。
訓(xùn)練組和實(shí)驗(yàn)組的比率為8:2。
以RF算法為例,針對(duì)5.4%臨界比例誤差水平下的AST分析物,給出調(diào)優(yōu)
結(jié)果。關(guān)鍵參數(shù)的最佳組合為:樹數(shù)200,最大深度200,詳見表C.1。此外,
數(shù)據(jù)塊的大小也被定義為10。
表C.15.4%比例誤差分析物RF算法優(yōu)化結(jié)果
樹數(shù)最大深度訓(xùn)練精度測(cè)試精度
1001000.940.93
2001000.960.95
2002000.970.96
3001000.970.96
3002000.990.98
4001000.980.97
4002000.980.97
5001000.980.97
5002000.970.96
C.4模型訓(xùn)練
對(duì)于<20%的系統(tǒng)誤差和隨機(jī)誤差,由于數(shù)據(jù)分布的特點(diǎn),對(duì)分割模型進(jìn)行
了訓(xùn)練。將<20%系統(tǒng)誤差訓(xùn)練模型設(shè)置為“20、16、12、12、8、4、異常1”,
隨機(jī)誤差“10、12、8、4、1”。(模型優(yōu)化)
模型優(yōu)化的目的是提高模型對(duì)當(dāng)前數(shù)據(jù)集的預(yù)測(cè)能力。如果檢測(cè)≥20%的誤
差,預(yù)設(shè)算法本身的關(guān)鍵參數(shù),如樹的最大深度和樹的數(shù)量(n樹),調(diào)整塊大
小和值閾值的參數(shù)。如果檢測(cè)<20%錯(cuò)誤是預(yù)設(shè)塊大小和值閾值,則調(diào)整樹最大
深度和n個(gè)樹上的參數(shù)。
以5.4%臨界比例誤差水平的AST分析物為例,在原始數(shù)據(jù)預(yù)處理后,以10
步從50到500測(cè)量樹最大深度和n樹,并搜索了兩個(gè)參數(shù)的最佳組合。分別計(jì)
算了每個(gè)組合下的訓(xùn)練集和測(cè)試集的準(zhǔn)確性。此外,用步驟1測(cè)量5到100的
另一個(gè)參數(shù)。
可調(diào)節(jié)的因素有:步長(zhǎng)長(zhǎng)度、過濾數(shù)據(jù)比例,分類算法的超參數(shù),調(diào)節(jié)過
程方法包括但不限于網(wǎng)格搜索或經(jīng)驗(yàn)法,調(diào)節(jié)期間通過驗(yàn)證集觀察,驗(yàn)證方法
包括但不限于交叉驗(yàn)證。
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第23頁共30頁
C.5模型評(píng)估
表C.2RF算法不同類型關(guān)鍵誤差的預(yù)測(cè)得分
錯(cuò)誤類型項(xiàng)目假陽(%)AUC精確性靈敏度特異性不穩(wěn)定指標(biāo)
比例ALT1.890.98890.94170.93570.98110.29
C.6判斷規(guī)則
為了提高臨床場(chǎng)景中預(yù)測(cè)的準(zhǔn)確性,設(shè)計(jì)了兩級(jí)輸出窗口。設(shè)計(jì)一級(jí)窗口
輸出模型預(yù)測(cè)值,然后基于統(tǒng)計(jì)邏輯的二級(jí)窗口,以降低一級(jí)窗口輸出值的誤
率。二級(jí)窗口的邏輯設(shè)置為只有當(dāng)大于預(yù)定義的截止值時(shí),二級(jí)窗口中的異常
值才確定為異常。二級(jí)窗口可以修改并輸出最終正確的預(yù)測(cè)結(jié)果。
圖C.1檢測(cè)驗(yàn)證實(shí)驗(yàn)
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第24頁共30頁
附錄D
(資料性)
即時(shí)檢驗(yàn)血?dú)夥治龌诨颊邤?shù)據(jù)實(shí)時(shí)質(zhì)量控制方法示例
D.1基于患者數(shù)據(jù)的實(shí)時(shí)質(zhì)量控制檢查
以自動(dòng)化智能質(zhì)量管理模式為例,建立以患者樣本為質(zhì)控的處理系統(tǒng)機(jī)制,
在樣本檢測(cè)讀數(shù)階段,自動(dòng)化監(jiān)測(cè)影響檢測(cè)結(jié)果質(zhì)量的瞬態(tài)錯(cuò)誤。檢查模型如
下:
——使用患者樣本作為質(zhì)控;
——在樣本檢測(cè)期間對(duì)每個(gè)檢測(cè)項(xiàng)目進(jìn)行測(cè)定和分析;
——根據(jù)相關(guān)的算法處理,自動(dòng)檢測(cè)任何異常響應(yīng);
——若發(fā)生失控,應(yīng)拒絕報(bào)告受錯(cuò)誤影響的參數(shù),并重新測(cè)定。
D.2檢查示例
以血?dú)鈾z驗(yàn)中K+項(xiàng)目為例,在樣本檢測(cè)期間,檢查收集一定時(shí)間內(nèi)的樣本
的讀數(shù),通過異常傳感器響應(yīng)模式斜率形狀和系數(shù)來監(jiān)測(cè)整個(gè)檢測(cè)過程中持續(xù)
的樣本完整性質(zhì)量檢查,以保證患者結(jié)果的準(zhǔn)確度。樣本檢查流程如下圖D.1
所示,PBRTQC檢查如圖D.2所示。
樣本準(zhǔn)備
樣本吸樣
分析前系統(tǒng)檢查
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制分析中檢查
確認(rèn)結(jié)果
報(bào)告結(jié)果標(biāo)識(shí)異常
圖D.1樣本檢查流程圖
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GLXXX:202X第25頁共30頁
圖D.2PBRTQC檢查示例圖
202X年XX月XX日發(fā)布202X年XX月XX日實(shí)施
CNAS-GL0XX:202X第26頁共30頁
附錄E
(資料性)
基于患者數(shù)據(jù)實(shí)時(shí)質(zhì)量控制方法評(píng)價(jià)可視化示例
E.1異常數(shù)據(jù)模擬
對(duì)模擬異常數(shù)據(jù)的檢測(cè)是評(píng)價(jià)質(zhì)量控制方法效能的一個(gè)很重要的過程,此
過程需要在方法的假陽率已滿足要求的前提下進(jìn)行。針對(duì)此過程有三種主要的
展示圖用于遞進(jìn)地表示方法的效能,包括no_NPed圖,ANPed圖和PED圖。
E.2方法評(píng)價(jià)可視化
以紅細(xì)胞項(xiàng)目質(zhì)量控制為例展示三種PBRTQC評(píng)價(jià)可視化。
在模擬測(cè)試中,針對(duì)不同大小的偏差分別生成10個(gè)虛擬天,每天引入
1000個(gè)連續(xù)的模擬異常數(shù)據(jù),質(zhì)量控制方法需要在每個(gè)虛擬天中以一定數(shù)量為
單位依次檢測(cè)樣本,判斷機(jī)器是否出現(xiàn)異常。若正確識(shí)別異常觸發(fā)報(bào)警,則將
異常發(fā)生點(diǎn)到首次報(bào)警點(diǎn)所經(jīng)過的樣本數(shù)記為當(dāng)天的NPe
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年人教版PEP九年級(jí)科學(xué)上冊(cè)月考試卷含答案
- 2025年中圖版九年級(jí)地理下冊(cè)階段測(cè)試試卷含答案
- 2025年浙教新版必修1地理下冊(cè)階段測(cè)試試卷含答案
- 2025年仁愛科普版九年級(jí)地理上冊(cè)月考試卷
- 2025年安徽財(cái)貿(mào)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2025年塔城職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 2025年合肥信息技術(shù)職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025年廈門南洋職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025至2031年中國(guó)高速高溫連續(xù)式染帶機(jī)行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國(guó)廣州貼紙行業(yè)投資前景及策略咨詢研究報(bào)告
- 《梅大高速茶陽路段“5·1”塌方災(zāi)害調(diào)查評(píng)估報(bào)告》專題警示學(xué)習(xí)
- 2024年09月北京中信銀行北京分行社會(huì)招考(917)筆試歷年參考題庫附帶答案詳解
- 《大健康解讀》課件
- 2024年公司領(lǐng)導(dǎo)在新年動(dòng)員會(huì)上的講話樣本(3篇)
- 人教版道德與法治二年級(jí)下冊(cè)《第一單元 讓我試試看》大單元整體教學(xué)設(shè)計(jì)2022課標(biāo)
- 常州市2023-2024學(xué)年八年級(jí)上學(xué)期期末地理試卷(含答案解析)
- 道路安全教育課件
- 2023年浙江省衢州市中考語文試題(含答案解析)
- 《物流市場(chǎng)營(yíng)銷環(huán)境》課件
- 網(wǎng)咖成本預(yù)算明細(xì)表
- 醫(yī)務(wù)科運(yùn)用PDCA循環(huán)提高門診醫(yī)生準(zhǔn)時(shí)出診率PDCA成果匯報(bào)
評(píng)論
0/150
提交評(píng)論