版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、臨床統(tǒng)計(jì)學(xué):研究臨床研究資料中變異性及其變化規(guī)律的科學(xué)與藝術(shù)。統(tǒng)計(jì)學(xué)內(nèi)容要貫穿于臨床研究
中的資料搜集、整理、分析與結(jié)果解釋等全過程。
2、計(jì)量資料的統(tǒng)計(jì)描述及結(jié)果表達(dá):
統(tǒng)計(jì)圖表:各類圖表(頻數(shù)表、直方圖)
定量描述:臨床研究中對(duì)于服從正態(tài)分布者用均數(shù)土標(biāo)準(zhǔn)差;服從對(duì)數(shù)正態(tài)分布者改用幾何均數(shù)土標(biāo)
準(zhǔn)差;
對(duì)于其它不服從以上分布者,用中位數(shù)和四分位間距(IQR)表達(dá)。
3、計(jì)數(shù)資料的統(tǒng)計(jì)描述:率與比
率:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)。描述事件發(fā)生的強(qiáng)度和頻率
構(gòu)成比:A/(A+B+….)。事物內(nèi)部各組成部分所占的比重
相對(duì)比:A/BoA指標(biāo)為B指標(biāo)的若干倍或百分之幾。
計(jì)算率時(shí)要求分母不宜過?。环治鰰r(shí)不能以構(gòu)成比代率;病死率與死亡率不同。
4、臨床效應(yīng)量(effectsize)常被定義為有臨床意義或?qū)嶋H價(jià)值的干預(yù)效應(yīng)或差值。
5、效應(yīng)量(effectsize):指臨床上有意義的均數(shù)差值(均數(shù)差值是指試驗(yàn)組與對(duì)照組的均數(shù)之差)。必須
結(jié)合專業(yè)知識(shí)、指標(biāo)特點(diǎn)綜合判定差值的實(shí)際意義。
6、計(jì)數(shù)資料效應(yīng)量:
絕對(duì)指標(biāo):
絕對(duì)危險(xiǎn)降低率(absoluteriskreduction,ARR):對(duì)照組與試驗(yàn)組事件發(fā)生率之間的絕對(duì)差值%表示。此
值意味著試驗(yàn)組臨床事件發(fā)生率比對(duì)照組相同事件率的絕對(duì)差值,其值越大,臨床效果的意義自然會(huì)越大。
公式:ARR=P-A(%)P=對(duì)照組的事件率,如病死率人=試驗(yàn)組的事件率
相對(duì)指標(biāo):
相對(duì)危險(xiǎn)降低率(relativeriskreduction,RRR):此值的大小表示試驗(yàn)組比對(duì)照組治療后有關(guān)臨床事件發(fā)
生的相對(duì)危險(xiǎn)度下降的水平。公式:相對(duì)危險(xiǎn)降低率(RRR)=((P-A)/P)X100
P=對(duì)照組的事件率,如病死率人=試驗(yàn)組的事件率RR/OR
7、統(tǒng)計(jì)方法正確抉擇基本要素:資料類型、設(shè)計(jì)方案、樣本含量、數(shù)據(jù)結(jié)構(gòu)、特定條件
計(jì)量資料:假設(shè)檢驗(yàn)、t檢驗(yàn)、u檢驗(yàn)、方差分析、秩和檢驗(yàn)等
效應(yīng)量可信區(qū)間(95%可信區(qū)間):準(zhǔn)確度:95%、99%、90%
精度:為可信區(qū)間的寬度影響精度因素:準(zhǔn)確度、標(biāo)準(zhǔn)差、樣本量
計(jì)數(shù)資料:X2檢驗(yàn)、logistic回歸分析
率差值的可信區(qū)間估計(jì)說明兩個(gè)率差以及有無臨床價(jià)值。
8、統(tǒng)計(jì)結(jié)果的正確表達(dá):
(1)假設(shè)檢驗(yàn)?zāi)康氖歉鶕?jù)P值與檢驗(yàn)水準(zhǔn)的比較,并得到兩組總體均數(shù)是否有差異的推斷結(jié)論。
P值<a:兩組總體均數(shù)間差異有統(tǒng)計(jì)學(xué)意義;
P值>a:兩組總體均數(shù)間差異無統(tǒng)計(jì)學(xué)意義;
(P值在a附近時(shí),下結(jié)論應(yīng)慎重)。
不能表明“顯著性”差別的程度以及有無實(shí)際意義(臨床意義)
(2)可信區(qū)間:按照設(shè)計(jì)類型及相應(yīng)的公式分別計(jì)算出組間均數(shù)差值95%可信區(qū)間。
可信區(qū)間能提供更多的信息:能表明差別有無統(tǒng)計(jì)學(xué)意義,同時(shí)能顯示差別的程度及臨床意義,
但CI不能提供確切概率。因此,統(tǒng)計(jì)結(jié)果的表達(dá):P值與可信區(qū)間相結(jié)合,同時(shí)報(bào)告。
9、正確解釋與評(píng)價(jià)結(jié)果:真實(shí)性、重要性、適用性
(1)真實(shí)性解釋與評(píng)價(jià):統(tǒng)計(jì)推斷的結(jié)論具有概率性;只能有兩種結(jié)果,有統(tǒng)計(jì)學(xué)意義,無統(tǒng)計(jì)
學(xué)意義。但兩類結(jié)果同樣重要。特別是當(dāng)出現(xiàn)陰性結(jié)果時(shí),更應(yīng)該注意,因?yàn)榭赡苡蠭I型錯(cuò)
誤的存在,陰性結(jié)果可能又包括兩類:確實(shí)無統(tǒng)計(jì)學(xué)意義;或者出現(xiàn)假陰性。應(yīng)重點(diǎn)考察樣
本含量及檢驗(yàn)效能。
預(yù)防出現(xiàn)假陰性結(jié)果:正確估算樣本含量
樣本含量應(yīng)該足夠,不能過大或過小,否則兩者均可造成資源上的浪費(fèi)。
樣木含量的估算需要得到以下信息:以病死率為例:I型錯(cuò)誤率(a):0.05拒絕了實(shí)際上正確
的H0,即棄真,假陽性(H0為陰性,H1為陽性),誤診。II型錯(cuò)誤率(6):0.1-0.2不拒絕實(shí)際
上不成立的H0,即存?zhèn)危訇幮?,漏診。檢驗(yàn)效能(1-B),?般要求>0.8。新方法達(dá)到的最
小效應(yīng)量:1%,5%。傳統(tǒng)基線病死率:
(2)重要性評(píng)價(jià):綜合臨床意義與統(tǒng)計(jì)學(xué)意義
(3)評(píng)價(jià)統(tǒng)計(jì)結(jié)果的適用性:統(tǒng)計(jì)分析結(jié)果實(shí)際上是基于個(gè)體的平均水平。將平均水平結(jié)果應(yīng)用到
個(gè)體水平,忌生搬硬套。
10、公開發(fā)表論文中常見的統(tǒng)計(jì)學(xué)問題:需做而未做統(tǒng)計(jì)分析;統(tǒng)計(jì)分析方法不清,或未標(biāo)明;應(yīng)用
條件不滿足;錯(cuò)誤選用統(tǒng)計(jì)方法;結(jié)果解釋不合理;論文寫作方面:結(jié)果表達(dá)不完整、不清楚。
統(tǒng)計(jì)方法選擇不符合分析目的;分析方法選擇未結(jié)合資料特點(diǎn);未考慮混雜/偏倚對(duì)結(jié)果的影響
11、如何處理中等混雜或偏倚:對(duì)于能夠準(zhǔn)確測(cè)量的混雜因素:采用基線比較,必要時(shí)采用多元統(tǒng)計(jì)
分析方法。多個(gè)中心間基線資料比較:病人年齡構(gòu)成,出血量、術(shù)后死亡比例是否相同。對(duì)于不能夠
準(zhǔn)確的混雜因素,可以采用嚴(yán)格的設(shè)計(jì)加以控制,如分層、配對(duì)或盲法及隱藏等。如在隨訪調(diào)查中,
可對(duì)調(diào)查者盲法,避免調(diào)查性偏倚(厚此薄彼)。
12、如何減少樣本的抽樣誤差(s/n0.5):制定嚴(yán)格的研究對(duì)象納入和排除標(biāo)準(zhǔn):降低標(biāo)準(zhǔn)差
(對(duì)于大規(guī)模應(yīng)用性研究,保證代表性,標(biāo)準(zhǔn)不能過嚴(yán),在標(biāo)準(zhǔn)差不能有效降低的情況下,只有
采用下一步:)增大樣本含量:大樣本的臨床試驗(yàn)等。
一、統(tǒng)計(jì)在臨床研究中的作用與意義
?臨床研究中需要測(cè)試PICOT指標(biāo),以描述
-臨床與健康狀態(tài);
-反映研究/干預(yù)結(jié)果的形式;
?系列指標(biāo)的定量測(cè)試,必然有各種數(shù)據(jù):數(shù)據(jù)分析,臨床研究的結(jié)果表達(dá)與評(píng)價(jià)(真實(shí)性/適用性、重要
性),均需要借助統(tǒng)計(jì)學(xué)知識(shí)。
臨床統(tǒng)計(jì)學(xué)是:研究臨床研究資料中變異性及其變化規(guī)律的科學(xué)與藝術(shù)。
?統(tǒng)計(jì)學(xué)內(nèi)容要貫穿于臨床研究中的資料搜集、整理、分析與結(jié)果解釋等全過程。
?設(shè)計(jì)階段(根據(jù)研究目的與資料特點(diǎn),確定臨床指標(biāo),預(yù)設(shè)統(tǒng)計(jì)分析方法;同時(shí)需要估算樣本含量)
?研究組織實(shí)施、資料收集與整理階段:
一用相應(yīng)統(tǒng)計(jì)分析方法,評(píng)估質(zhì)量控制效果;
一檢查數(shù)據(jù)資料的完整性、失訪/原因統(tǒng)計(jì)。
一檢查極端值與異常值,分析原因與正確處理
?分析資料階段:檢查資料是否滿足預(yù)設(shè)統(tǒng)計(jì)方法的應(yīng)用條件,選用合適統(tǒng)計(jì)學(xué)方法。
二、臨床研究中相關(guān)數(shù)據(jù)采集與質(zhì)量控制
(一)、臨床研究指標(biāo)及時(shí)點(diǎn)的確定
1、觀察測(cè)試指標(biāo)的主要類別
?臨床/生物學(xué)指標(biāo):病死/復(fù)發(fā)/殘疾等。
?生存質(zhì)量及其相關(guān)指標(biāo):HRQL、QALYs
質(zhì)量調(diào)整壽命年
?經(jīng)濟(jì)學(xué)指標(biāo):
一成本:直接成本、間接成本等
一結(jié)局:效果、效益、效用
用于疾病負(fù)擔(dān)以及成本效果分析(CEA)、成本效益分析(CBA)、成本效用分析(CUA)等。
2、指標(biāo)設(shè)置應(yīng)全面和重點(diǎn)兼顧
1)以臨床試驗(yàn)常設(shè)指標(biāo)為例:(安全、有效、價(jià)廉)
?療效指標(biāo)
?不良反應(yīng)(副作用)指標(biāo)
?費(fèi)用(臨床經(jīng)濟(jì)學(xué))指標(biāo)
2)臨床終點(diǎn)觀察指標(biāo)的數(shù)量設(shè)置應(yīng)選擇重點(diǎn)、有代表性指標(biāo):不能過多(對(duì)于大規(guī)模研究,指標(biāo)過多往
往不能保證質(zhì)量)。
3)、替代指標(biāo)與臨床結(jié)局指標(biāo)
3、選擇測(cè)定次數(shù)與時(shí)點(diǎn)
?臨床研究中指標(biāo)測(cè)量時(shí)間與次數(shù)確定:效應(yīng)量變化特征曲線。
質(zhì)控應(yīng)體現(xiàn)在數(shù)據(jù)收集、整理、數(shù)據(jù)清理等不同階段。常用手段如:
?收集階段:
-培訓(xùn)記錄員與調(diào)查員,提高依從性
-盲法測(cè)量臨床軟指標(biāo)
-多個(gè)實(shí)驗(yàn)室標(biāo)準(zhǔn)樣品平行試驗(yàn)/標(biāo)準(zhǔn)校驗(yàn)曲線
?整理與清理:
-雙輸法錄入數(shù)據(jù)
5、數(shù)據(jù)質(zhì)量的影響因素
?與指標(biāo)本身有關(guān)(臨床硬指標(biāo)、臨床軟指標(biāo))
?客觀性、易量化
?靈敏度高
?精確性強(qiáng)
-與指標(biāo)數(shù)量及測(cè)量難易有關(guān):不宜過多指標(biāo)
?與收集方式有關(guān):
?實(shí)驗(yàn)室標(biāo)準(zhǔn)測(cè)試
?面對(duì)面訪談法;電話訪談:信訪
三、統(tǒng)計(jì)分析的基本內(nèi)容
?統(tǒng)計(jì)描述:反映樣本結(jié)果的基本特征
一統(tǒng)計(jì)圖表(各類表格或圖示)
一基本指標(biāo)(均數(shù)/標(biāo)準(zhǔn)差;率、構(gòu)成比)
?統(tǒng)計(jì)推斷:樣本推斷總體參數(shù)
一參數(shù)估計(jì)(點(diǎn)估計(jì)及其95%可信區(qū)間)
一假設(shè)檢驗(yàn):差別(均數(shù)、率)推斷;相關(guān)性推斷。
資料基本分型與分析
?數(shù)值變量資料(計(jì)量資料)
一統(tǒng)計(jì)描述
一統(tǒng)計(jì)推斷
?分類變量資料(計(jì)數(shù)資料)
一統(tǒng)計(jì)描述
一統(tǒng)計(jì)推斷
(一)、計(jì)量資料的統(tǒng)計(jì)描述及結(jié)果表達(dá)
?統(tǒng)計(jì)圖表:各類圖表(頻數(shù)表、直方圖)
?定量描述
一臨床研究中對(duì)于服從正態(tài)分布者用均數(shù)土標(biāo)準(zhǔn)差;服從對(duì)數(shù)正態(tài)分布者改用幾何均數(shù)土標(biāo)準(zhǔn)差
一對(duì)于其它不服從以上分布者,用中位數(shù)和四分位間距(IQR)表達(dá)。
正態(tài)性判斷
?正態(tài)性檢驗(yàn):判斷資料是否服從正態(tài)分布。
?其它判斷方法:
一統(tǒng)計(jì)圖表:eyeballtest
一均數(shù)與中位數(shù)差
一均數(shù)與標(biāo)準(zhǔn)差(均數(shù)±1S或2s中樣本例數(shù))
一醫(yī)學(xué)專業(yè)知識(shí)對(duì)資料的正態(tài)性進(jìn)行估計(jì)。
?分析時(shí)不能以構(gòu)成比代率
如某產(chǎn)院擬分析畸形兒與產(chǎn)婦分娩年齡的關(guān)系,檢查新生兒4470例,畸形兒116例。
母親年齡(歲)2123242526272829303133
畸形兒數(shù):12141924181913311
%0.861.71216211616112.60.860.86
結(jié)論:產(chǎn)婦年齡在24-29歲時(shí),畸形兒最多,占總數(shù)的92.2%,符合一般規(guī)律。
(三)臨床常用效應(yīng)量
?臨床效應(yīng)量(effectsize)常被定義為有臨床意義或?qū)嶋H價(jià)值的干預(yù)效應(yīng)或差值。
1、計(jì)量資料類型的效應(yīng)量
?效應(yīng)量(effectsize):臨床上有意義的均數(shù)差值(均數(shù)差值是指試驗(yàn)組與對(duì)照組的均數(shù)之差)。必須結(jié)合
專業(yè)知識(shí)、指標(biāo)特點(diǎn)綜合判定差值的實(shí)際意義。
2、計(jì)數(shù)資料效應(yīng)量
絕對(duì)指標(biāo):
?絕對(duì)危險(xiǎn)降低率(absoluteriskreduction,ARR):對(duì)照組與試驗(yàn)組事件發(fā)生率之間的絕對(duì)差值%表示。此值
意味著試驗(yàn)組臨床事件發(fā)生率比對(duì)照組相同事件率的絕對(duì)差值,其值越大,臨床效果的意義自然會(huì)越大。
公式:ARR=P-A(%)
P=對(duì)照組的事件率,如病死率人=試驗(yàn)組的事件率
?治療多少病例數(shù)才使一例患者獲益
(numberneededtotreat,NNT)
NNT=1/ARR
NNT=5vsNNT=500意義
高血壓患者藥物預(yù)防心?;蛩劳?/p>
觀察期NNT
一輕度高血壓5.5y10
一重度高血壓1.5y10
時(shí)間矯正(假設(shè)其每年發(fā)生率是一致的)
-NNT珈kNNT螭時(shí)阿X(觀察時(shí)間/矯正時(shí)|HJ)
-NNT1.5=1OX(5.5/1.5)=37
四、統(tǒng)計(jì)推斷的方法抉擇
?統(tǒng)計(jì)推斷內(nèi)容
一假設(shè)檢驗(yàn)
一參數(shù)估計(jì)(可信區(qū)間)
五、統(tǒng)計(jì)方法正確抉擇基本要素
一統(tǒng)計(jì)方法的正確抉擇至關(guān)重要。
五、統(tǒng)計(jì)方法正確抉擇基本要素
?資料類型
?設(shè)計(jì)方案
?樣本含量
?數(shù)據(jù)結(jié)構(gòu)
?特定條件
計(jì)量資料:統(tǒng)計(jì)推斷方法選擇
?假設(shè)檢驗(yàn)
-t檢驗(yàn)、U檢驗(yàn)、方差分析、秩和檢驗(yàn)等
?效應(yīng)量可信區(qū)間(95%可信區(qū)間):
/準(zhǔn)確度:95%、99%、90%
/精度:為可信區(qū)間的寬度
*影響精度因素:準(zhǔn)確度、標(biāo)準(zhǔn)差、樣本量
計(jì)數(shù)資料:統(tǒng)計(jì)推斷方法
?%卡方2檢驗(yàn)、logistic回歸分析
六、結(jié)果解釋與注意事項(xiàng)
(-統(tǒng)計(jì)結(jié)果的正確表達(dá)
?假設(shè)檢驗(yàn)?zāi)康氖歉鶕?jù)P值與檢驗(yàn)水準(zhǔn)的比較,并得到兩組總體均數(shù)是否有差異的推斷結(jié)論。
P值va:兩組總體均數(shù)間差異有統(tǒng)計(jì)學(xué)意義;
P值,a:兩組總體均數(shù)間差異無統(tǒng)計(jì)學(xué)意義;
(P值在a附近時(shí),下結(jié)論應(yīng)慎重)。
?不能表明“顯著性”差別的程度以及有無實(shí)際意義(臨床意義)
“顯著意義''定義
?英語表達(dá)為“significant”,它的正確意義應(yīng)當(dāng)是“有意義的、有重要性的”。
?俄語為3HaMMblM
?日語"有意”
?國(guó)內(nèi)只有極個(gè)別的英漢詞典把“significant”誤譯為“顯著的”。
?正確的說法應(yīng)是“差異有統(tǒng)計(jì)意義''或"差異有高度統(tǒng)計(jì)意義”。
“顯著意義''舉例
?“丙酸倍氯米松組患者吸入糖皮質(zhì)激素后.其氣道反應(yīng)性有顯著降低(P<0.05),而安慰劑組氣道反應(yīng)性無明
顯變化(P>0.05):對(duì)照組治療前后氣道反應(yīng)性無叨顯變化(P>0.05)。
?可信區(qū)間:按照設(shè)計(jì)類型及相應(yīng)的公式分別計(jì)算出組間均數(shù)差值95%可信區(qū)間??尚艆^(qū)間能提供更多的
信息:
一能表明差別有無統(tǒng)計(jì)學(xué)意義,
一同時(shí)能顯示差別的程度及臨床意義,
THCI不能提供確切概率。因此,統(tǒng)計(jì)結(jié)果的表達(dá):P值與可信區(qū)間相結(jié)合,同時(shí)報(bào)告。
(二)、正確解釋與評(píng)價(jià)結(jié)果
?真實(shí)性
?重要性
?適用性
檢測(cè)項(xiàng)目患者組(32)健康組(10)P值檢驗(yàn)效能
LAT-EF57.2±13.359.6±9.2>0.050.10
INF-EF76.8±15.282.0±14.3>0.050.17
SEPTAL-EF37.4±12.646.9±13.4>0.050.52
ESV29.3±8.527.3±7.3>0.05
EDV62.1±16.063.6±9.6>0.05
預(yù)防出現(xiàn)假陰性結(jié)果:正確估算樣本含量
?樣本含量應(yīng)該足夠,不能過大或過小,否則兩者均可造成資源上的浪費(fèi)。
?樣本含量的估算需要得到以下信息:以病死率為例:
-1型錯(cuò)誤率(a):0.05拒絕了實(shí)際上正確的HO,即棄真,假陽性(H0為陰性,H1為陽性),誤診。
-II型錯(cuò)誤率(6):0.1—0.2不拒絕實(shí)際上不成立的H0,即存?zhèn)?,假陰性,漏診。
一檢驗(yàn)效能(1-B),一般要求>0.8
—新方法達(dá)到的最小效應(yīng)量:1%,5%
-傳統(tǒng)基線病死率:
?根據(jù)課題設(shè)計(jì)方案和研究的主要內(nèi)容,實(shí)際上可簡(jiǎn)化為兩組:傳統(tǒng)手術(shù)組與微創(chuàng)手術(shù)組,因此選用公式:
一其中:a為I型錯(cuò)誤率0為II型錯(cuò)誤率
-P,為傳統(tǒng)手術(shù)的病死率=25%:p2為微創(chuàng)手術(shù)病死率=20%
2、重要性評(píng)價(jià):
綜合臨床意義與統(tǒng)計(jì)學(xué)意義
3、評(píng)價(jià)統(tǒng)計(jì)結(jié)果的適用性
七、臨床研究中常見統(tǒng)計(jì)問題
?臨床研究與統(tǒng)計(jì)方法的有機(jī)結(jié)合,兩者不能相互脫節(jié)。
公開發(fā)表論文中常見的統(tǒng)計(jì)學(xué)問題:
?需做而未做統(tǒng)計(jì)分析
?統(tǒng)計(jì)分析方法不清,或未標(biāo)明
?應(yīng)用條件不滿足
?錯(cuò)誤選用統(tǒng)計(jì)方法:
?結(jié)果解釋不合理:
?論文寫作方面:結(jié)果表達(dá)不完整、不清楚。
(一)、統(tǒng)計(jì)方法選擇不符合分析目的
表甲乙兩種療法的療效比較(例)
療效甲法乙法
痊愈1020
顯效3020
有效1030
無效2010
合計(jì)7080
資料特點(diǎn):?jiǎn)蜗蛴行虻挠?jì)數(shù)資料
分析目的:療效差別比較
采用方法:首選秩和檢驗(yàn)?卡方檢驗(yàn)?
(二)、分析方法選擇未結(jié)合資料特點(diǎn)
?根據(jù)資料類型與具體特點(diǎn)選擇合適的統(tǒng)計(jì)分析方法。
腦梗塞兩種治療方案比較研究
腦梗塞(卒中)兩種治療方案隨訪2年后其療效的比較,見表
表療效比較
結(jié)果分配內(nèi)科治療分配外科治療
外科治療1內(nèi)科治療2外科治療3內(nèi)科治療4
存活2年4829635420
死亡227156
合計(jì)5032336926
對(duì)該情況有三種分析方法
?功效分析(EfficacyAnalysis):只是2與3比較
?實(shí)效分析(TreatmentReceivedAnalysis):1+3與2+4比較
?意向性治療分析(ITT):1+2與3+4比較
上述資料的三種分析結(jié)果
三種分析方法的結(jié)果比較
分析方法內(nèi)科治療外科治療%2P
意向性治療分析29/373(7.8%)21/395(5.3%)1.90.17
功效分析EA27/323(8.4%)15/369(4.1%)5.60.018
實(shí)效分析TRA33/349(9.5%)17/419(4.1%)9.10.003
(三)、未考慮混雜/偏倚對(duì)結(jié)果的影響
混雜與偏倚也將直接影響統(tǒng)計(jì)結(jié)果的真實(shí)性,即可造成真實(shí)效應(yīng)低估及假陰性結(jié)果。
1、如何處理中等混雜或偏倚
?對(duì)于能夠準(zhǔn)確測(cè)量的混雜因素:采用基線比較,必要時(shí)采用多元統(tǒng)計(jì)分析方法。多個(gè)中心間基線資料比
較:病人年齡構(gòu)成,出血量、術(shù)后死亡比例是否相同。
?對(duì)于不能夠準(zhǔn)確的混雜因素,可以采用嚴(yán)格的設(shè)計(jì)加以控制,如分層、配對(duì)或盲法及隱藏等。如在隨訪
調(diào)查中,可對(duì)調(diào)查者盲法,避免調(diào)查性偏倚(厚此薄彼)。
2、如何減少樣本的抽樣誤差(s/n05)
?制定嚴(yán)格的研究對(duì)象納入和排除標(biāo)準(zhǔn):
降低標(biāo)準(zhǔn)差(對(duì)于大規(guī)模應(yīng)用性研究,保證代表性,標(biāo)準(zhǔn)不能過嚴(yán),在標(biāo)準(zhǔn)差不能有效降低的情況下,
只有采用下一步:)
?增大樣本含量:大樣本的臨床試驗(yàn)等。
概述與數(shù)值變量資料統(tǒng)計(jì)描述
一、概述與基本術(shù)語
■變異性與變量
■概率與頻率
■總體與樣本
■參數(shù)與統(tǒng)計(jì)量(抽樣分布)
參數(shù)與統(tǒng)計(jì)量的表達(dá)
類別參數(shù)符號(hào)統(tǒng)計(jì)量符號(hào)
均數(shù)
標(biāo)準(zhǔn)差
方差
相關(guān)系數(shù)
率
描述變異性:變量基本分類
■數(shù)值變量資料(計(jì)量、連續(xù)型變量資料)
■分類變量資料(計(jì)數(shù)、離散型變量資料)
?無序分類變量資料
?二分類變量資料
■無序多分類變量資料
?有序分類變量(半定量):反映等級(jí)或秩次。
二、數(shù)值變量資料的統(tǒng)計(jì)描述
?連續(xù)性變量資料:血糖、總膽固醇
?整數(shù)變量資料:骨折數(shù)、胎次、心率
若不要求太高的精度,可對(duì)連續(xù)性變量取整。
■統(tǒng)計(jì)描述的基本方法
?統(tǒng)計(jì)圖表法:頻數(shù)表、直方圖、莖葉圖
?定量描述法:
■集中趨勢(shì)描述:mean,median,mode
■離散趨勢(shì)描述:range,SD,CV,IQR
■統(tǒng)計(jì)描述的應(yīng)用:
?描述基本分布特征
?確定參考值范圍
?發(fā)現(xiàn)極端值。
(一)、圖表描述
頻數(shù)表/直方圖:最常見描述方法(apictureisworth1000words)
■便于發(fā)現(xiàn)一些極端值或異常值;
■描述頻數(shù)分布的特征與類型;
■為進(jìn)一步統(tǒng)計(jì)分析與處理做準(zhǔn)備。
1、頻數(shù)表
基本步驟
?計(jì)算極差(最大值與最小值之差,又稱全距):以膽固醇為例,最大5.71,最小2.35,極差為3.36。
?確定組距:通常6-14個(gè)組,為方便計(jì)算,以極差的1/10為組距。組距為0.3。
?列出組段,劃計(jì)歸組,計(jì)數(shù)頻數(shù)、計(jì)算累計(jì)頻數(shù)、累計(jì)頻率等。
實(shí)例頻數(shù)表
組段頻數(shù)頻率累計(jì)頻數(shù)累計(jì)頻率
2.2~2222
2.5?5577
2.8?10101717
3.1~19193636
i-i■
5.1~449999
5.4-5.811101100
2、頻數(shù)分布圖:直方圖
■直方圖:直觀反映數(shù)值變量各種數(shù)值出現(xiàn)的機(jī)會(huì)與分布規(guī)律。
?在頻數(shù)表的基礎(chǔ)上,以組段的組間值為橫軸,以相應(yīng)百分比或頻數(shù)為縱坐標(biāo),所繪制的連續(xù)性條形圖。
3、莖葉圖
莖葉圖(stem-and-leafplot)
?不需要頻數(shù)表,直接繪制.
■原理:測(cè)量值整數(shù)部分作為“莖“似小數(shù)點(diǎn)后部分作為“葉”.
例1:2.32.42.3—,莖,為2,,葉,
例2:3.13.23.2--‘莖'為3,,葉,?
血清總膽固醇(mmol/L)Slcm-and-LeafPlot(莖葉圖)
FreqStem&Leaf
1.002.3
.002
3.002.677
1.002.9
5.003.00011
7.003.2222233
10.003.4555555555
8.003.66667777
18.003.888888999999999999
10.004.0011111111
9.004.222222333
11.004.44555555555
4.004.6777
6.004.888899
3.005.001
4.005.2233
.005
1.005.7
Stemwidth:1.00
Eachleaf:1case(s)
(二人樣本資料的定量描述
■集中趨勢(shì)
■離散趨勢(shì)
1、集中趨勢(shì)定量描述
/集中位置的描述;即大多數(shù)數(shù)值所處的位置。
,描述集中趨勢(shì)的常用指標(biāo)
A算術(shù)均數(shù)(mean)
A幾何均數(shù)(geometricmean)
A中位數(shù)(median)
A眾數(shù)(mode)
?算術(shù)均數(shù)(均數(shù)mean)
?性質(zhì)相同的一組觀察值的數(shù)量平均水平。
?資料滿足正態(tài)分布或近似正態(tài)分布
?方法:
/直接法:基于原始數(shù)據(jù)(2.35,2.5,5.8…)
/間接法:基于頻數(shù)表的近似法(利用組中值與頻數(shù))
注意事項(xiàng)
?直接法與間接法計(jì)算的均數(shù)可能有差異,后者為近似估算。
■均數(shù)對(duì)極端值非常敏感。
■利用等級(jí)資料計(jì)算均數(shù)應(yīng)慎重。
?切勿利用均數(shù)計(jì)算均數(shù)。
在一項(xiàng)高血壓干預(yù)研究中,某研究者根據(jù)治療分組情況,分別計(jì)算相應(yīng)組別的收縮壓平均數(shù):
/治療A組:20例,=17(mmHg)
/治療B組:18例,=21(mmHg)
/對(duì)照組:62例,=5(mmHg)
■三組合并均數(shù):(17+21+5)/3=14.3?
?中位數(shù)(median)
?幾何均數(shù)
■如某地區(qū)居民發(fā)汞含量研究(67例)
■數(shù)據(jù)資料通過對(duì)數(shù)轉(zhuǎn)化,直方圖如下:
幾何均數(shù):6.62
■三種集中趨勢(shì)指標(biāo)比較:
?在資料服從正態(tài)分布時(shí),三種均數(shù)值接近,幾何均數(shù)小于算術(shù)均數(shù);
■平均數(shù)4.03
■中位數(shù)3.98
?幾何均數(shù)3.99
?在資料分布對(duì)稱時(shí),中位數(shù)與算術(shù)均數(shù)非常接近。越偏離正態(tài)分布,則兩者的位置相差越遠(yuǎn)。
2、離散趨勢(shì)的定量描述
離散趨勢(shì):描述一組數(shù)據(jù)參差不齊或變異程度
■描述數(shù)值變量資料離散趨勢(shì)的常用指標(biāo)
?極差或全距(range)
?方差與標(biāo)準(zhǔn)差
?變異系數(shù)
?四分位間距
?極差(Range):定義為最大值與最小值之差。
/極差大,變異程度大。
/由于只考慮兩個(gè)極端值,穩(wěn)健性差。
/臨床研究中常用來作疑似極端值/異常值
膽固醇研究中:
,最小測(cè)量值2.35:?
/最大測(cè)量值5.8:?
極差3.45
?方差與標(biāo)準(zhǔn)差(varianceandSD):全面反映了一組觀察值的變異程度.
/將總體中每個(gè)個(gè)體值與總體均數(shù)之差稱為離均差,方差是離均差平方的平均值
/方差與標(biāo)準(zhǔn)差的數(shù)值越大,則表明數(shù)值越離散;反之說明較集中在均數(shù)周圍,均數(shù)的代表性越好)。
,為與原始觀察值的度量衡單位一致,取方差的平方根后,為標(biāo)準(zhǔn)差。
以膽固醇研究為例
?方差:0.435(mmol/L)2
?標(biāo)準(zhǔn)差:0.66(mmol/L)
?標(biāo)準(zhǔn)差的用途:描述變異程度、計(jì)算標(biāo)準(zhǔn)誤、計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常參考值范圍
?標(biāo)準(zhǔn)差受極端值影響較大;不論何種分布,至少包括了75%的個(gè)體觀察值
?變異系數(shù)(coefficientofvariance)
標(biāo)準(zhǔn)差與均數(shù)之比的百分?jǐn)?shù)為變異系數(shù)。
變異系數(shù)
?CV=(S/X)xlOO%標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示?
,無度量衡單位,應(yīng)用于:
?單位不同的多組數(shù)據(jù)比較;
?均數(shù)相差懸殊的多組資料比較
?百分位數(shù)(percentile)
?百分位數(shù)是一種位置指標(biāo),用Px表示。即將原始觀察值從小到大順序排列,再將其分成100等份,各含
1%的觀察值。
?百分位數(shù)實(shí)際為百等份分割值,用于確定參考值。
?百分位數(shù)可以描述樣本資料的分布特征(P5,P25,P50.P75,P95)
?樣本量不能過少,且靠近兩端的百分位數(shù)不穩(wěn)定,否則無實(shí)際價(jià)值。
?四分位間距(interquartilerange,IQR)
將數(shù)值變量資料按照從小到大的順序排列,確定幾個(gè)特殊位點(diǎn):
■極大、極小值:P100位點(diǎn),P0位點(diǎn)
■中位數(shù):P50位點(diǎn)
■P25位點(diǎn)與P75位點(diǎn)(上下四分位點(diǎn))
定義為:P75-P25
考慮50%個(gè)體觀察值的變異程度。
■以膽固醇研究為例:
?25%位點(diǎn)為3.58,75%位點(diǎn)為4.51
?四分位間距:0.93
離散趨勢(shì)的描述指標(biāo)
3、集中與離散綜合描述
■服從正態(tài)分布數(shù)據(jù)資料:均數(shù)土標(biāo)準(zhǔn)差
■服從對(duì)數(shù)正態(tài)分布:用幾何均數(shù)土標(biāo)準(zhǔn)差
?不服從正態(tài)分布/對(duì)數(shù)正態(tài)分布:中位數(shù)及四分位間距值
膽固醇研究的統(tǒng)計(jì)描述:
/定量:均數(shù)土標(biāo)準(zhǔn)差4.03±0.66(mmol/L)
/圖表:直方圖
三、數(shù)值變量資料常見分布類型
■正態(tài)分布
■偏態(tài)分布
(一)、正態(tài)分布與頻數(shù)分布
正態(tài)分布:最常見的一種連續(xù)型分布,呈倒置鐘形,中間高,兩頭低,左右對(duì)稱。
■正態(tài)分布的位置參數(shù)(均數(shù))N:
■正態(tài)分布的形狀參數(shù)(標(biāo)準(zhǔn)差R:
(二)、偏態(tài)分布
兩側(cè)數(shù)據(jù)分布不對(duì)稱,偏重于一側(cè)
正偏態(tài)分布負(fù)偏態(tài)分布
正偏態(tài)分布實(shí)例
負(fù)偏態(tài)分布:某研究中病人的年齡分布
(三)、正態(tài)性檢驗(yàn)
■正態(tài)性檢驗(yàn)
?偏度系數(shù)(Skewness)
?峰度系數(shù)(Kurtosis)
■經(jīng)驗(yàn)方法:
?均數(shù)與標(biāo)準(zhǔn)差:1.645、±1S/±2S包括例數(shù)
?均數(shù)與中位數(shù)
?目測(cè)圖形分布,或借助專業(yè)知識(shí)
四、參考值范圍及其確定
定義:指絕大多數(shù)正常人的生理、生化指標(biāo)測(cè)量值的變化或波動(dòng)范圍(95%或99%參考值范圍)。常用于醫(yī)
學(xué)檢驗(yàn)與質(zhì)量控制。如果某個(gè)體的測(cè)定值超出這個(gè)范圍,該個(gè)體就作為可疑者,需密切關(guān)注。供診斷參考。
參考值范圍的確定方法
■正態(tài)或近似正態(tài)分布資料:均數(shù)±1.96SD
■偏態(tài)分布資料:百分位法
1、正態(tài)或近似正態(tài)分布資料
?95%參考值范圍:均數(shù)±1.96倍標(biāo)準(zhǔn)差。
該范圍僅僅告知有95%的個(gè)體測(cè)量值在此范圍之內(nèi),切不可將參考標(biāo)準(zhǔn)作診斷標(biāo)準(zhǔn)使用。
■有單側(cè)界值與雙側(cè)界值之分。
參考值范圍:在1988年Jung等對(duì)某醫(yī)院30名健康的男性醫(yī)生測(cè)定了丙氨酸氨基轉(zhuǎn)移酶,均數(shù)、標(biāo)準(zhǔn)差
分別為1.05和0.32個(gè)單位,則計(jì)算該項(xiàng)指標(biāo)的95%參考值范圍:1.05±1.96*0.32,即0.4211.68。
實(shí)例分析:
樣本量偏小,這份樣本不足以代表總體;
臨床實(shí)踐中,最小n>100以上。
2、偏態(tài)分布資料
?雙側(cè)95%參考值范圍:97.5%位點(diǎn)測(cè)量值-2.5%位點(diǎn)測(cè)量值,兩者間區(qū)間范圍。P25~P97.5
■單側(cè)95%參考值范圍:<95%位點(diǎn)的測(cè)量值或者>5%位點(diǎn)的測(cè)量值。P95或P5
以發(fā)汞研究為例,其95%參考界值點(diǎn)實(shí)際上是其95%位點(diǎn)測(cè)量值19.08,超過此值,個(gè)體測(cè)量值異常。
102名3歲以下兒童LgA含量
組段頻數(shù)累計(jì)頻數(shù)位次范圍
0-29291-29
15-326130-61
30-187962-79
45-149380-93
60-49794-97
75-09797
90-09797
105-29998-99
120-1100100
135-2102101-102
參考值范圍注意事項(xiàng)
■多指標(biāo)聯(lián)合使用,確定聯(lián)合參考值范圍:
以95%參考值范圍為例:?jiǎn)沃笜?biāo)的誤判率5%,12個(gè)指標(biāo)的誤判率達(dá)到46%。
■參考值工正常值:由于個(gè)體差異性與樣本代表性問題,個(gè)體值不在此范圍內(nèi),不?定是患者,在此范圍內(nèi)
的個(gè)體,不一定是健康人,僅作為臨床診斷的參考.
■參考值范圍不是一成不變的。
纖維蛋白原(Fg)參考值范圍/孕婦能否適用?
■制定參考界值:考慮分單側(cè)、雙側(cè)
■代表性以及有足夠的樣本例數(shù)(一般不低于100例)
?有無“金標(biāo)準(zhǔn)方法”考核:樣本同質(zhì)
統(tǒng)計(jì)推斷概述
了解總體特征的最好方法是對(duì)總體的每個(gè)體進(jìn)行觀察、試驗(yàn),但這在醫(yī)學(xué)研究實(shí)際中往往不可行。
?無限總體:欲分析全國(guó)成年人的血壓與血脂水平?直接測(cè)量?抽樣?
■對(duì)有限總體限于人力、財(cái)力、物力、時(shí)間或個(gè)體過多等原因,不可能也沒必要對(duì)所有個(gè)體逐一研究。
■臨床研究的特殊性決定了只能采用抽樣方法,通過從已知或未知的總體中隨機(jī)抽取樣本來推論總體特征。
一、統(tǒng)計(jì)推斷概述
,統(tǒng)計(jì)推斷以概率論為基礎(chǔ),根據(jù)試驗(yàn)或觀察得到的樣本數(shù)據(jù),來研究對(duì)象總體的客觀規(guī)律性,以作出合理地
估計(jì)和判斷.
1、統(tǒng)計(jì)推斷過程
實(shí)例演示抽樣過程,尋找抽樣規(guī)律
?2009級(jí)研究生的臨床科研設(shè)計(jì)成績(jī)?yōu)橐阎傮w(85±8分,400人)
■從成績(jī)單中反復(fù)做100次抽樣,每次抽取40人成績(jī)作為模擬訓(xùn)練樣本。
分別計(jì)算每次抽樣的均數(shù),以每個(gè)樣本均數(shù)做為觀察單位(共100個(gè)樣本均數(shù))。
100個(gè)樣本均數(shù)抽樣分布具有如下特點(diǎn):
■樣本均數(shù)集中于總體均數(shù)(85分)分布;
,各樣本均數(shù)未必等于總體均數(shù),均數(shù)間存在差異;
■樣本均數(shù)變異范圍較原變量變異范圍大大縮小,這100個(gè)樣本均數(shù)的均數(shù)為85.1分、標(biāo)準(zhǔn)差為1.79分
在非正態(tài)分布總體中可進(jìn)行類似抽樣。
2、抽樣分布規(guī)律
3、中心極限定理:在樣本量足夠大時(shí),不管原始分布如何,其抽樣分布仍為正態(tài)分布。
4、抽樣分布的描述
,抽樣分布呈現(xiàn)正態(tài)分布:
?集中趨勢(shì):“均數(shù)”?
?離散趨勢(shì):“標(biāo)準(zhǔn)差”?
,抽樣分布呈現(xiàn)正態(tài)分布:
?集中趨勢(shì):“均數(shù)”?=總體均數(shù)
?離散趨勢(shì):“標(biāo)準(zhǔn)差”?=標(biāo)準(zhǔn)誤
常見統(tǒng)計(jì)量與抽樣概率分布類型
■大樣本-均數(shù)(正態(tài)分布)
■小樣本一均數(shù)(t分布)
■OR(對(duì)數(shù)正態(tài)分布)
■方差比(F分布)
■率(卡方分布)
????
二、推斷與誤差控制
■在臨床研究中,總會(huì)出現(xiàn)推斷誤差:即樣本平均值與總體真值之間的差值。
?系統(tǒng)誤差(偏差):研究/臨床試驗(yàn)本身產(chǎn)生
?抽樣誤差:隨機(jī)誤差
■系統(tǒng)誤差:可以避免,固定(或規(guī)律變化)具有方向性,往往是由于混雜與偏倚造成,可以通過嚴(yán)格設(shè)
計(jì)加以控制。
■抽樣誤差:不可避免,隨機(jī)沒有方向性,可以測(cè)量與控制。
測(cè)量抽樣誤差的指標(biāo):標(biāo)準(zhǔn)誤
■與標(biāo)準(zhǔn)差有關(guān):個(gè)體變異程度大,標(biāo)準(zhǔn)誤大.
■與樣本含量有關(guān):樣本含量增大,標(biāo)準(zhǔn)誤減少。
臨床研究中控制抽樣誤差方法
?嚴(yán)格定義總體與確定抽樣單位
■抽樣過程
■樣本含量
■嚴(yán)格定義總體與抽樣單位
?根據(jù)研究目的,確定目標(biāo)人群與框架人群
?明確診斷標(biāo)準(zhǔn)
?納入標(biāo)準(zhǔn)與排除標(biāo)準(zhǔn)
■嚴(yán)格抽樣過程
?嚴(yán)格遵守隨機(jī)化原則(randomization)
?確立抽樣框架(Samplingframe)
?選擇恰當(dāng)隨機(jī)方法
■確保有足夠的樣本含量
?設(shè)計(jì)階段估計(jì)樣本含量
三、統(tǒng)計(jì)推斷方法
問題的提出
背景:根據(jù)前期大量調(diào)查與文獻(xiàn)綜述,脈搏數(shù)可能與海拔高度有關(guān),已知健康成年男性的脈搏均數(shù)為72次/
分,那么高原地區(qū)成年男性脈搏數(shù)與一般成年男性脈搏數(shù)有無差別?
實(shí)例分析
研究對(duì)象與目標(biāo)人群:以川西高原某山區(qū)的成年男子(18-60歲)作為目標(biāo)人群.
設(shè)計(jì)方案:橫斷面調(diào)查
調(diào)查結(jié)果:調(diào)查者在該山區(qū)隨機(jī)抽查了25名健康男性,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分.
本例資料特點(diǎn)分析
本該研究數(shù)據(jù)類型為數(shù)值變量資料
■已知一般人群的總體脈搏均數(shù)為72次/分
■從山區(qū)人群抽取了25人,樣本均數(shù)為74.2次/分。
研究目的:山區(qū)成年人群脈搏數(shù)(總體1)與一般人群脈搏數(shù)(總體2)是否相等
步驟1:建立假設(shè)、確定檢驗(yàn)水準(zhǔn)
Ho:〃=〃()(無效假設(shè))
H|:0(備擇假設(shè))
檢驗(yàn)水準(zhǔn)a=0.05
?無效假設(shè):檢驗(yàn)假設(shè)、零假設(shè)/原假設(shè),用Ho表示。樣本均數(shù)間差別是由抽樣誤差造成的。
?H0通常:某兩個(gè)(或多個(gè))總體參數(shù)相等,或某兩個(gè)總體參數(shù)之差等于0,或……無效,或某資料服從某一
特定分布等;
■備擇假設(shè):對(duì)立假設(shè),用Hi表示。
?凡是不屬于Ho情況者,統(tǒng)統(tǒng)納入備擇假設(shè)。
?有單側(cè)與雙側(cè)之分。
備擇假設(shè)(〃>〃o.〃<〃())
■〃斗/()或〃任一種
■檢驗(yàn)水準(zhǔn)a:為預(yù)先設(shè)定的概率值,所確定了小概率事件標(biāo)準(zhǔn).
?實(shí)際工作中一般取a=0.05
?可根據(jù)不同研究目的,給予不同的設(shè)置值.
注意事項(xiàng)
?假設(shè)的建立是針對(duì)總體而不是樣本。
?無效假設(shè)與備擇假設(shè)成對(duì)出現(xiàn),兩者相互聯(lián)系、相互對(duì)立,缺一不可。
?所有假設(shè)檢驗(yàn)均是以無效假設(shè)為出發(fā)點(diǎn)。
步驟2:選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量
?依靠資料類型、設(shè)計(jì)方案、檢驗(yàn)方法的應(yīng)用條件,抉擇檢驗(yàn)方法
■基于無效假設(shè)成立的條件,利用樣本資料計(jì)算統(tǒng)計(jì)量,并根據(jù)其抽樣分布規(guī)律,確定P值。
步驟3:確定P值,作出推斷結(jié)論
?P值指從無效假設(shè)規(guī)定的總體中隨機(jī)抽取得到等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量值的概率。
P值的意義:ThePvalueisdefinedastheprobability,undertheassumptionofnoeffectornodifference(the
nullhypothesis),ofobtainingaresultequaltoormoreextremethanwhatwasactuallyobserved
步驟3:確定P值,作出推斷結(jié)論
■將事后獲得的概率P,與事先規(guī)定的概率水準(zhǔn)一檢驗(yàn)水準(zhǔn)a進(jìn)行比較而得出結(jié)論。(反證法)
,推斷結(jié)論包含統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論兩部分。
步驟1:建立假設(shè),確定檢驗(yàn)水準(zhǔn)
步驟2:選定t檢驗(yàn),計(jì)算統(tǒng)計(jì)量
■統(tǒng)計(jì)量t=1.883
步驟3:確定P值,作出推斷結(jié)論
■0.05<P<0.10,按照a=0.05水準(zhǔn),不拒絕H。,還不能認(rèn)為該山區(qū)健康成年男子的脈搏總體均數(shù)與一般健
康成年男子的脈搏數(shù)不同。
■假設(shè)檢驗(yàn)的成功與否,建立在嚴(yán)格的設(shè)計(jì)的基礎(chǔ)上:避免系統(tǒng)誤差;嚴(yán)格隨機(jī),使樣本具有代表性。
如何評(píng)價(jià)上述實(shí)例分析?
■P值大小與均數(shù)差值的大小不同。假設(shè)檢驗(yàn)只能表明總體均數(shù)間的差別有無統(tǒng)計(jì)學(xué)意義,不能表明差異
是否顯著。
(74.2-72)=2.2次/分
四、統(tǒng)計(jì)推斷方法
一參數(shù)及可信區(qū)間估計(jì)
■參數(shù)估計(jì)是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),是假設(shè)檢驗(yàn)的重要補(bǔ)充。
?點(diǎn)估計(jì)?:用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值,簡(jiǎn)單但未考慮抽樣誤差的大小。
?區(qū)間估計(jì):即按預(yù)先設(shè)定的概率(1-a)確定的包含未知總體參數(shù)的可能范圍。
1、(1-a)可信區(qū)間
?定義:有l(wèi)-a的可能性,在所計(jì)算得到可信區(qū)間包含了總體參數(shù)(不是總體參數(shù)落在該范圍的可能性為
1-a)。(置信區(qū)間)
?可信區(qū)間由兩個(gè)可信上限和下限構(gòu)成
可信區(qū)間估計(jì)的優(yōu)劣取決兩個(gè)方面:
?一是準(zhǔn)確度l-a,即區(qū)間包含日的理論概率大小,愈接近1愈好。
,二是區(qū)間的寬度:精度,區(qū)間愈窄愈好。
■準(zhǔn)確度:可信區(qū)間的可信范圍,如95%,99%,90%
■精度:可信區(qū)間的寬度,可信上限與可信下限間的寬度
?與準(zhǔn)確度、樣本含量、標(biāo)準(zhǔn)差大小有關(guān)。
可信區(qū)間能提供更多的推斷信息:
?區(qū)間范圍是否包括總體參數(shù),若不包括,表明差別無統(tǒng)計(jì)學(xué)意義;
?同時(shí)能顯示差別的程度及臨床意義,
?但CI不能提供確切概率。因此,統(tǒng)計(jì)結(jié)果的表達(dá):P值與可信區(qū)間相結(jié)合,同時(shí)報(bào)告。
本例區(qū)間估計(jì)結(jié)果
■點(diǎn)估計(jì):74.2次/分
?區(qū)間估計(jì):71.7~76.7次/分(72)
若要提高可信區(qū)間估計(jì)的精度,有哪些途徑?
?樣本量從25例擴(kuò)大到50例
2、95%可信區(qū)間與95%參考值范圍
1)、意義:
■可信區(qū)間按照事先給定的概率,確定的未知參數(shù)的可能范圍。(均數(shù))
■參考值范圍為針對(duì)個(gè)體在解剖、生理、生化的觀測(cè)指標(biāo)的變化范圍。(個(gè)體觀察值)
2)、計(jì)算公式:
■可信區(qū)間用標(biāo)準(zhǔn)誤
■參考值范圍用標(biāo)準(zhǔn)差
3)、用途
■可信區(qū)間:用于估計(jì)總體參數(shù)。
■參考值范圍:判斷觀察對(duì)象的某項(xiàng)指標(biāo)正常與否。
五、統(tǒng)計(jì)推斷結(jié)果評(píng)價(jià)
診斷性試驗(yàn)的評(píng)價(jià)四格表
■統(tǒng)計(jì)結(jié)果的概率性:統(tǒng)計(jì)結(jié)果不是絕對(duì)肯定或否定,可能犯I、II型錯(cuò)誤
真實(shí)情況假設(shè)檢驗(yàn)
拒絕Ho不拒絕Ho
Ho成立a推斷正確
Ho不成立推斷正確p
?ll型錯(cuò)誤與檢驗(yàn)效能
■檢驗(yàn)效能又稱把握度、功效,用if表示(B為n型錯(cuò)誤概率):是指事實(shí)上當(dāng)兩總體確有差異,按檢驗(yàn)
水準(zhǔn)a所能發(fā)現(xiàn)該差異的能力。檢驗(yàn)效能為0.8,指做100次假設(shè)檢驗(yàn),有80次能檢驗(yàn)出有差別。
檢驗(yàn)效能的影響因素
■實(shí)際組間差異(效應(yīng)量)的大小;
■研究對(duì)象個(gè)體間的標(biāo)準(zhǔn)差大小:
"I型錯(cuò)誤率a大??;
■樣本含量大?。褐攸c(diǎn)考察
實(shí)例分析
■統(tǒng)計(jì)推斷結(jié)果:
?假設(shè)檢驗(yàn)表明P>a=0.05;
?95%可信區(qū)間:71.7~76.7次/分(72)
■討論:
?該山區(qū)成年男子的平均脈搏數(shù)與一般成年男子的均數(shù)的差別無統(tǒng)計(jì)學(xué)意義。
?可考察其檢驗(yàn)效能?
實(shí)例分析
?假設(shè)a=0.05,s=6次/分,A=3次/分
實(shí)例分析
[3=0.2946,1-0=0.7054
?檢驗(yàn)效能=0.71
(二)專業(yè)結(jié)論同樣不能絕對(duì)化
■因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故“肯定”、“-定”、"必定'’等詞不要使用。
?在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的值,盡量寫出具體的P值或P值的確切范圍,而不簡(jiǎn)單寫成P<
0.05,以便讀者與同類研究比較或進(jìn)行Meta分析。
(三)、應(yīng)圍繞研究本身全面考慮,下結(jié)論
從研究設(shè)計(jì)、抽樣等全面評(píng)估結(jié)果。如樣本代表性,有無可能出現(xiàn)系統(tǒng)偏差等。
t、u、等價(jià)檢驗(yàn)
80篇(中華醫(yī)學(xué)系列雜志)臨床研究論文使用統(tǒng)計(jì)方法匯總
統(tǒng)計(jì)方法篇數(shù)比例
t檢驗(yàn)290.36
秩和檢驗(yàn)100.1
卡方檢驗(yàn)230.29
其他26
未做統(tǒng)計(jì)分析13
一、數(shù)值變量資料組間差別比較
常用假設(shè)檢驗(yàn)方法抉擇
?t檢驗(yàn)
?u檢驗(yàn)
?■驗(yàn)
?秩和檢驗(yàn)
?方差分析
一)、與比較組別和設(shè)計(jì)類型有關(guān)
?數(shù)值資料兩組間的比較可以考慮使用t、U、方差分析、『檢驗(yàn)或者秩和檢驗(yàn)。結(jié)合不同的設(shè)計(jì)類型又分
為:樣本與總體比較、配對(duì)設(shè)計(jì)、兩組完全隨機(jī)設(shè)計(jì)的假設(shè)檢驗(yàn)。
?數(shù)值資料三組及三組以上間的比較則丕能使用t檢驗(yàn)和U檢驗(yàn)??煽紤]使用方差分析、秩和檢驗(yàn)等方法。
結(jié)合不同的設(shè)計(jì)類型又進(jìn)一步分為:多組成組設(shè)計(jì)、配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))、交叉設(shè)計(jì)等設(shè)計(jì)方案假
設(shè)檢驗(yàn)。
二)、與樣本含量有關(guān)
?當(dāng)樣本含量n較大時(shí),其抽樣分布服從正態(tài)分布(中心極限定理):*可考慮使用u檢驗(yàn)
?當(dāng)樣本含量n較小時(shí),其抽樣分布服從t分布;*可考慮使用t檢驗(yàn)
?當(dāng)樣本含量n較小時(shí),若樣本來源于偏態(tài)或未知分布,其抽樣分布未知。
*則不能使用t、u檢驗(yàn),選用秩和檢驗(yàn)
n=30/40/50/60/100
二、t檢驗(yàn)概述
?t檢驗(yàn)是以t分布為理論基礎(chǔ),以t值為統(tǒng)計(jì)量的假設(shè)檢驗(yàn)方法,適用于例數(shù)較少,來源于正態(tài)分布的資
料。
?應(yīng)用條件:當(dāng)樣本例數(shù)較少時(shí),要求樣本取自正態(tài)總體;作兩樣本均數(shù)比較,要求兩樣本總體方差齊性。
t分布的特征
?t分布是一簇與正態(tài)分布相似的單峰分布。
?t分布與標(biāo)準(zhǔn)正態(tài)分布相似,以0為中心,左右對(duì)稱。
?分布與自由度v有關(guān),自由度v越小,其峰值越小,兩側(cè)尾部面積越大,反之,其峰值越大,兩側(cè)尾部面
積越小。
?隨自由度V增大,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)自由度為無窮大(V=8)時(shí),t分布就等于標(biāo)準(zhǔn)正態(tài)
分布(U分布)。
假設(shè)檢驗(yàn)?zāi)康呐c應(yīng)用條件
?假設(shè)檢驗(yàn):推斷單個(gè)樣本所代表的未知總體均數(shù)〃與已知總體均數(shù)〃0(常為理論值或標(biāo)準(zhǔn)值)有無差別。
?應(yīng)用條件:已知樣本服從正態(tài)分布
?實(shí)例分析:36名一線抗SARS醫(yī)生的血紅蛋白含量是否不同于一般水平?150.83g/lw140g/l
2:選定t檢驗(yàn),計(jì)算統(tǒng)計(jì)量
?統(tǒng)計(jì)量t=4.11
3:確定P值,作出推斷結(jié)論
?P<0.001,按照a=0.05水準(zhǔn),拒絕H(j,臨床一線醫(yī)生的血紅蛋白含量高于一般水平。(自由度為36-1)
?95%可信區(qū)間:146.8~153.6,而一般水平為140g/l。
I、配對(duì)設(shè)計(jì)
比較特殊的設(shè)計(jì)方式,能很好地控制非實(shí)驗(yàn)因素對(duì)結(jié)果的影響,該設(shè)計(jì)有以下:
①對(duì)同對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理(異體配對(duì));
②對(duì)同一受試對(duì)象分別給予兩種處理(自身配對(duì)),目的都是推斷兩種處理的效果有無差別。(窩溝封閉?)
個(gè)體變異較大時(shí)使用
2、配對(duì)設(shè)計(jì)檢驗(yàn)過程
?配對(duì)設(shè)計(jì)的檢驗(yàn),先要求出各對(duì)差值的均數(shù)。若效果無差別,則理論上差值的總體均數(shù)內(nèi)應(yīng)為0。
因此配對(duì)設(shè)計(jì)檢驗(yàn),實(shí)際上是推斷差值的總體均數(shù)是否為“0”。等同于單樣本t檢驗(yàn).
3、配對(duì)t檢驗(yàn)的檢驗(yàn)?zāi)康?、資料特點(diǎn)與應(yīng)用條件
?假設(shè)檢驗(yàn)?zāi)康模和茢嗯鋵?duì)差值的總體均數(shù)是否等于“0”。
?應(yīng)用條件:配對(duì)差值服從正態(tài)分布。
?兩組比較的配對(duì)數(shù)值變量資料,檢驗(yàn)效能較高。
4、實(shí)例分析
一項(xiàng)飲食缺乏維生素E與肝中維生素A含量的關(guān)系研究中.將同種屬的大白鼠按性別相同,年齡、體
重相近者配成對(duì)子,共8對(duì),并將每對(duì)中的兩只動(dòng)物隨機(jī)分到正常飼料組和維生素E缺乏組,過一定時(shí)
期將大白鼠殺死,測(cè)得其肝中維生素A的含量,見下表,問不同飼料組的大白鼠肝中維生素A含量有無差
別?
不同飼料大白鼠肝中維生素A含量
大白鼠對(duì)號(hào)正常飼料組VE缺乏組差值
1355024501100
220002400-400
3300018001200
439503200750
538003250550
6375027001050
734502500950
8305017501300
合計(jì)6500
差值均數(shù)=6500/8=812.5s=546.3
步驟1:建立假設(shè)
Ho:從產(chǎn)0,即差值的總體均數(shù)為“0”,不同飼料的大白鼠肝中維生素A含量相同。
H1:口產(chǎn)0,即差值的總體均數(shù)不為“0”,不同飼料的大白鼠肝中維生素A含量不相同。
檢驗(yàn)水準(zhǔn)a=0.05(雙側(cè))
步驟2:計(jì)算統(tǒng)計(jì)量t值
步驟3:計(jì)算概率P值,作出結(jié)論
查t界值表,tog7=2.365,t>to,()5.7,得Pv0.05,按a=0.05水準(zhǔn),拒絕H。,接受H”可認(rèn)為兩種飼料所得肝
中維生素A含量有差別,即維生素E缺乏對(duì)大白鼠肝中維生素A含量有影響。
95%可信區(qū)間估計(jì)
本例:均數(shù)差值的95%可信區(qū)間:
355.8—1269.2
統(tǒng)計(jì)推斷結(jié)果:
?區(qū)間范圍不包括0,差別有統(tǒng)計(jì)學(xué)意義;
?差別程度最小值355.8,平均差812.5。
例2吸煙前后血小板最大聚集率
1.目的、資料特點(diǎn)與應(yīng)用條件
?目的:推斷兩個(gè)獨(dú)立樣本分別代表的總體均數(shù)是否相等。
?資料:成組設(shè)計(jì)兩組比較數(shù)值變量資料
?應(yīng)用條件:
(1)兩樣本均來自服從正態(tài)分布總體
(2)兩樣本的總體方差齊性(方差相等)
2、實(shí)例分析
某醫(yī)生利用病例對(duì)照設(shè)計(jì)方案研究了慢性支氣管炎患者與健康人的肺活量(L),資料如下,問兩組有
無差別?
?病例組:18例慢性支氣管炎病人、均數(shù)4.454、標(biāo)準(zhǔn)差1.324。
?對(duì)照組:16例健康人、均數(shù)5.299、標(biāo)準(zhǔn)差1.3820
步驟1:建立假設(shè)
Ho:〃尸〃2,兩總體均數(shù)相等,兩類人群的肺活量相等。
H1:m會(huì)〃2,兩總體均數(shù)不相等,兩類人群的肺活量不等。
檢驗(yàn)水準(zhǔn):a=0.05(雙側(cè))
步驟2:計(jì)算統(tǒng)計(jì)量t值
步驟3:計(jì)算概率,作出結(jié)論
?查t界值表1().05.32=2.037,t<to.05.32
?P>0.05,按a=0.05水準(zhǔn),不拒絕Ho,尚不能認(rèn)為兩類人群肺活量不相等。
效應(yīng)量(均數(shù)差值)的可信區(qū)間
效應(yīng)量95%可信區(qū)間
?to.05,32=2.037,SE(diff)=0.464
?效應(yīng)量95%可信區(qū)間:
一兩組的均數(shù)差值:0.845
-0.84512.037*0.464
下限:-0.10;上限:1.79
成組設(shè)計(jì)t檢驗(yàn)在臨床研究中的應(yīng)用
?正態(tài)性與方差齊性是t檢驗(yàn)的基本條件。
?對(duì)兩樣本要求:代表性、獨(dú)立性、均衡性。
一代表性(樣本來源、樣本量、隨機(jī)化)
一獨(dú)立性應(yīng)確保兩組樣本是相互獨(dú)立的,如應(yīng)有明確的診斷標(biāo)準(zhǔn)等。
一均衡性(除欲研究因素外,其它因素盡可能均衡)對(duì)于臨床資料,兩組應(yīng)在性別、年齡、病情輕重、診斷分
期分級(jí)、有無并發(fā)癥等方面具有均衡性。在設(shè)計(jì)階段應(yīng)控制混雜與偏倚。
一適用性
四)、用于方差不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人短期借款法律合同范本2025
- 萬畝良田聯(lián)產(chǎn)承包合同新政策
- 個(gè)人廠房租賃合同典范
- 產(chǎn)權(quán)清楚車位買賣合同細(xì)則
- 上海市房地產(chǎn)委托代理合同范本
- 食品調(diào)料采購(gòu)合同
- 個(gè)人貸款借款合同模板
- 勞動(dòng)合同管理制度7
- 個(gè)人借款合同書及還款細(xì)則
- 個(gè)人住宅購(gòu)房合同條款及樣本
- 2025年全國(guó)科技活動(dòng)周科普知識(shí)競(jìng)賽試題庫(kù)及答案
- 工廠生產(chǎn)區(qū)清潔流程及安全規(guī)范
- 2024年全國(guó)職業(yè)院校技能大賽中職(酒店服務(wù)賽項(xiàng))備賽試題庫(kù)(500題)
- 高速公路巡邏車司機(jī)勞動(dòng)合同
- 2025中國(guó)大唐集團(tuán)內(nèi)蒙古分公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 中國(guó)古代文學(xué)史 馬工程課件(上)01總緒論
- GB/T 22085.1-2008電子束及激光焊接接頭缺欠質(zhì)量分級(jí)指南第1部分:鋼
- 上海中心大廈-介紹 課件
- 非酒精性脂肪性肝病防治指南解讀課件
- 地理微格教學(xué)課件
- 合成氨操作規(guī)程
評(píng)論
0/150
提交評(píng)論