定量資料統(tǒng)計學(xué)方法小結(jié)_第1頁
定量資料統(tǒng)計學(xué)方法小結(jié)_第2頁
定量資料統(tǒng)計學(xué)方法小結(jié)_第3頁
定量資料統(tǒng)計學(xué)方法小結(jié)_第4頁
定量資料統(tǒng)計學(xué)方法小結(jié)_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計量資料分析常用的統(tǒng)計學(xué)方法小結(jié)第二章、定量資料的統(tǒng)計描述頻率分布表與頻率分布圖:描述平均水平的統(tǒng)計指標(biāo)〔描述集中趨勢〕:算數(shù)均數(shù)、幾何均數(shù)、中位數(shù)與百分位數(shù)、眾數(shù)描述變異程度的統(tǒng)計指標(biāo)〔描述離散趨勢〕:極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)描述分布形態(tài)的統(tǒng)計指標(biāo):偏度系數(shù)、峰度系數(shù)頻率分布表與頻率分布圖離散型定量變量和連續(xù)型定量變量的頻率分布離散型定量變量的取值是不連續(xù)的。直接清點各變量值出現(xiàn)的頻數(shù)計算相應(yīng)的頻率,即為頻率分布表。離散型定量變量的頻率分布圖可用直條圖表達,以各等寬矩形直條的高度表示各組頻率的大小。連續(xù)型定量變量的取值是連續(xù)的。將數(shù)據(jù)適當(dāng)分組,清點各組頻數(shù),并計算相應(yīng)頻率,即為頻率分布表。連續(xù)型定量變量的頻率分布圖可用直方圖表達,縱坐標(biāo)為頻率密度,即頻率/組距,直方圖面積之和等于1.離散型定量變量的頻率分布步驟:〔1〕直接清點各變量值出現(xiàn)的頻數(shù)〔2〕計算各組頻率,累計頻數(shù),累計頻率連續(xù)型定量變量的頻率分布步驟:求極差〔range〕:即最大值與最小值之差,又稱為全距。〔2〕決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個組。組距=極差/組數(shù),為方便計,組距為極差的十分之一,再略加調(diào)整?!?〕列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值。〔4〕劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。編制頻率表的考前須知:〔1〕分組不宜過粗,也不宜過細。通常分為10~15個組?!?〕為計算方便,組段下限一般取較整齊的數(shù)值。確定各組段上下限時,各組段要連續(xù)但不重疊。除去最后一個組段,其余組段應(yīng)包含下限值,不包含上限值?!?〕第一組段應(yīng)包含最小值,最后一組段應(yīng)包含最大值。頻數(shù)表和頻數(shù)分布圖用途描述頻數(shù)分布的類型對稱分布:假設(shè)各組段的頻數(shù)以中心位置左右兩側(cè)大體對稱,就認為該資料是對稱分布正偏態(tài)分布:右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。偏態(tài)分布:負偏態(tài)分布:左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。描述頻數(shù)分布的特征隨機變量的分布具有兩個特征——集中趨勢與離散趨勢。①數(shù)據(jù)集中〔平均〕:總體中的個體具有某些同性質(zhì),這些同性質(zhì)是的數(shù)據(jù)趨向同一數(shù)值,表現(xiàn)為變量值聚集在某個中心值的周圍,稱為集中趨勢。②數(shù)據(jù)變異〔離散〕:同一總體中的個體之間又普遍存在各種差異,使得變量值向平均水平左右離散,稱為離散趨勢。便于發(fā)現(xiàn)某些離群值或極端值。〔4〕便于進一步做統(tǒng)計分析和處理描述平均水平的統(tǒng)計指標(biāo)〔描述集中趨勢的指標(biāo)〕統(tǒng)計上使用平均數(shù)〔average〕這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有三種——算數(shù)均數(shù)、幾何均數(shù)、中位數(shù)。1、算術(shù)均數(shù):簡稱均數(shù)〔mean〕可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。常用μ表示總體均數(shù),用表示樣本均數(shù)。均數(shù)適用于對稱分布,特別是正態(tài)分布資料。直接計算法〔利用原始數(shù)據(jù)〕:加權(quán)法(利用頻數(shù)表〕:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。幾何均數(shù)〔geometricmeanG〕可用于反映一組原始觀察值不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。〔1〕直接法計算公式:例有8份血清的抗體效價分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價。例有8份血清的抗體效價分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價。根據(jù)G的倒數(shù)得到平均抗體效價為:1:57根據(jù)G的倒數(shù)得到平均抗體效價為:1:57〔2〕加權(quán)法公式〔頻率表法〕:∑f:各組頻數(shù)之和,即n中位數(shù)〔medianM〕與百分位數(shù)〔percentilePx〕是將每個變量值從小到大排列,位置居于中間的那個變量值。理論上有一半的觀察值高于中位數(shù),一半的觀察值低于中位數(shù)。中位數(shù)適用于各種分布的變量,特別是偏峰分布的變量。只與位次居中的觀察值有關(guān),不受分布兩端特大或特小值的影響。因此,在末端無確定值資料,不能計算均數(shù)和幾何均數(shù)的時候,可計算中位數(shù)。直接法計算公式:n為奇數(shù)時:n為偶數(shù)時:頻率表法:對于頻率表資料,可以通過百分位數(shù)法近似計算中位數(shù)。百分位數(shù):是指將n個觀察值從小到大依次排序后,對于x%位的數(shù)值;表示將原始觀察值分為兩個局部,理論上有x%的觀察值小于有〔1-x〕%的觀察值大于。所以百分位數(shù)P50就是中位數(shù)。∑fL:為小于L所在組段的累計頻數(shù)百分位數(shù)〔percentile〕直接算法:設(shè)有設(shè)有n個原始數(shù)據(jù)從小到大排列,第X百分位數(shù)的計算公式為:當(dāng)為帶有小數(shù)位時:Trunc〔nx%〕的意思是n和x%的結(jié)果取整數(shù)當(dāng)為整數(shù)時:例對某醫(yī)院細菌性痢疾治愈者的住院天數(shù)統(tǒng)計,120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)?;颊撸鹤≡禾鞌?shù):〔1〕n=120,120乘5%等于6,為整數(shù):n=120,120乘99%等于118.8,帶有小數(shù),故取整trunc〔118.8〕=118頻數(shù)表算法:當(dāng)時,公式〔2-9〕即為中位數(shù)的計算公式例:試分別求例2-1頻數(shù)表的第25、第75百分位數(shù)P25P754、眾數(shù)〔mode〕眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個觀察值;假設(shè)為分組資料,眾數(shù)那么是出現(xiàn)頻率最高的那個組段的組中值。適用于大樣本;較粗糙。正態(tài)分布時:均數(shù)=中位數(shù)=眾數(shù)

正偏態(tài)分布時:均數(shù)>中位數(shù)>眾數(shù)

負偏態(tài)分布時:均數(shù)<中位數(shù)<眾數(shù)描述變異程度的統(tǒng)計指標(biāo)〔描述離散程度的指標(biāo)〕同一總體中的不同個體之間存在差異稱為變異。不同的觀察指標(biāo),其變異程度不同;即使是同一觀察指標(biāo),在不同總體中,其變異程度也會有所不同。常用的描述變異程度的指標(biāo)包括極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。1、極差〔Range〕極差,也稱全距,用R表示:即一組變量值最大值與最小值之差。樣本接近的同類資料相比擬,極差越大意味著數(shù)據(jù)越離散,或者說數(shù)據(jù)之間的變異程度越大。極差計算簡單,但僅利用了兩端點值,穩(wěn)定性差。R=最大值-最小值極差的特點:極差只能粗略地說明變量的變動范圍。極差只用最大值和最小值計算,未考慮到中間的全部信息。偏態(tài)資料時更不穩(wěn)定。四分位數(shù)間距〔quartilerange〕四分位數(shù)間距,用Q表示P75和P25分別稱為上四分位數(shù)和下四分位數(shù)。四分位數(shù)間距定義為P75和P25之差。即Q=P75-P250%〔〕25%〔〕75%〔〕100%〔〕如上圖所示,理論上,有1/4個觀察值比P75大,有1/4個觀察值比P25小,P75和P25之間恰好包括總體中50%的個體觀察值。Q越大意味著數(shù)據(jù)間變異越大。四分位間距可用于各種分布的資料,特別對服從偏峰分布的變量。常把中位數(shù)和四分位間距結(jié)合起來描述變量的平均水平和變異程度。與極差相比,四分位間距更穩(wěn)定,但仍未考慮數(shù)據(jù)中的每個觀察值的離散程度。方差〔variance〕方差考慮了所有觀察值的變異程度??傮w方差用表示,定義為總離均差平方和,∑在總體所有個體中的平均;樣本方差用表示。方差越大意味著數(shù)據(jù)間變異越大。平均偏差為利用每一個觀察值的信息,計算各觀察值偏離平均值的平均差距〔即離均差,他們的和稱為離均差和〕。為免于正負抵消,可將每個觀察值與均數(shù)的差值的絕對值相加再取平均,稱為平均偏差〔meandifference)。∑n〔2〕離均差平方和(sumofsquare,SS)為克服平均偏差使用絕對值不便運算的缺點,可以將“離均差〞平方,即計算離均差平方和。其計算公式為:方差〔meanofsquare,MS)=1\*GB3①將離均差平方和取平均,即為方差〔variance〕。對于樣本資料,取平均值時分母用n-1代替nMS=MS=其中n-1稱為自由度(df),在n個離均差平方項中,只有n-1個是獨立的,稱為自由度〔degreeoffreedom,df)其意義是當(dāng)給定時,隨機變量X“自由〞取值的個數(shù)。總和不變,自由度就少了一個,所以用n-1任何統(tǒng)計量的自由度υ=n-限制條件的個數(shù)。=2\*GB3②總體方差與樣本方差總體方差:樣本方差:標(biāo)準(zhǔn)差(standarddeviation,SD)〔1〕方差的平方根為標(biāo)準(zhǔn)差,總體標(biāo)準(zhǔn)差用σ表示,樣本標(biāo)準(zhǔn)差用S表示,其度量單位與均數(shù)一致,所以最常用。標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計算標(biāo)準(zhǔn)差的公式為:標(biāo)準(zhǔn)差的意義和用途說明資料的離散趨勢(或變異程度),標(biāo)準(zhǔn)差的值越大,說明變異程度越大,均數(shù)的代表性越差...標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時用來描述資料的集中趨勢與離散趨勢。用于計算變異系數(shù)用于計算標(biāo)準(zhǔn)誤(見后)結(jié)合均值與正態(tài)分布的規(guī)律,估計參考值的范圍(見后)。變異系數(shù)(coefficientofvariation,CV)變異系數(shù)(coefficientofvariation,CV)常用于比擬度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。CV的意義是變異程度的大小,相對于平均水平的百分比。變異系數(shù)沒有單位。變異系數(shù)越大意味著相對于均數(shù)而言變異程度越大。其中S為樣本標(biāo)準(zhǔn)差,為樣本均數(shù)。分布形態(tài)對教學(xué)評價的指導(dǎo)意義正態(tài)分布:說明學(xué)生考試成績分布比擬正常。正偏態(tài)分布:說明低分段的學(xué)生人數(shù)比擬多,可能是試題難度偏高或者是此次考查內(nèi)容學(xué)生掌握情況不好。負偏態(tài)分布:說明高分段的學(xué)生較多,可能是學(xué)生知識掌握較好,也可能是試題難度較低。平坡型分布:說明學(xué)生成績差距較大,分布不集中,降低整體成績的是分布在低分段的學(xué)生,所以應(yīng)對這些學(xué)生進行個別輔導(dǎo)。陡峭型分布:說明學(xué)生成績分布比擬集中,要提高學(xué)生成績,需要進行集體輔導(dǎo)補課。統(tǒng)計表和統(tǒng)計圖統(tǒng)計表將統(tǒng)計分析的事物及其指標(biāo)用表的形式表示出來,就是統(tǒng)計表。結(jié)構(gòu)及要求▲標(biāo)題:概括表的主要內(nèi)容,包括研究的時間、地點和研究內(nèi)容,放在表的上方?!鴺?biāo)目:分別用橫標(biāo)目和縱標(biāo)目說明表格每行和每列數(shù)字的意義,注意標(biāo)明指標(biāo)的單位。▲線條:至少用三條線,表格的頂線和底線將表格與文章的其它局部分隔開來,縱標(biāo)目下橫線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)分隔開來。局部表格可再用橫線將合計分隔開,或用橫線將兩重縱標(biāo)目分割開。其它豎線和斜線一概省去。▲數(shù)字:用阿拉伯?dāng)?shù)字表示。無數(shù)字用“—〞表示,缺失數(shù)字用“〞表示,數(shù)值為0者記為“0〞,不要留空項。數(shù)字按小數(shù)位對齊?!鴤渥ⅲ罕碇袛?shù)字區(qū)不要插入文字,也不列備注項。必須說明者標(biāo)“*〞號,在表下方說明。例:統(tǒng)計表由以下幾個局部組成:①標(biāo)題、②標(biāo)目、③線條、④數(shù)字、⑤備注表1某省某工廠1994、1998年四項檢測指標(biāo)異常檢出率表1某省某工廠1994、1998年四項檢測指標(biāo)異常檢出率統(tǒng)計圖將統(tǒng)計分析的事物及其指標(biāo)用圖的形式表示出來,就是統(tǒng)計圖。統(tǒng)計圖是用點的位置、線段的升降、直條的長短、面積的大小等表達統(tǒng)計數(shù)據(jù)的一種形式。繪制統(tǒng)計圖要根據(jù)資料性質(zhì)和分析目的選擇最適宜的圖形。常用于定量的統(tǒng)計圖包括頻率直方圖、累積頻率分布圖、箱式圖、直條圖。〔1〕一般統(tǒng)計圖的制作要素與根本要求=1\*GB3①圖號與標(biāo)題圖號:用阿拉伯?dāng)?shù)字標(biāo)題:簡明扼要地概括整個圖的內(nèi)容=2\*GB3②標(biāo)目橫標(biāo)目〔主語、橫軸〕縱標(biāo)目〔謂語、縱軸〕=3\*GB3③尺度單位=4\*GB3④圖例=5\*GB3⑤圖域橫:縱=7:5〔2〕統(tǒng)計圖的制作▲須根據(jù)資料性質(zhì)、分析目的選用適當(dāng)統(tǒng)計圖,由于統(tǒng)計圖不能精確顯示數(shù)據(jù)大小,所以經(jīng)常需與統(tǒng)計表一同使用?!粋€圖一般只表達一個中心內(nèi)容,表達一個主題,即一個統(tǒng)計指標(biāo)?!L制圖形應(yīng)注意準(zhǔn)確、美觀,圖線粗細應(yīng)用適當(dāng),定點準(zhǔn)確,不同事物用不同線條〔實線、虛線、點線〕或顏色表示,給人以清晰的印象?!?〕統(tǒng)計圖制作考前須知標(biāo)題:簡明扼要說明資料內(nèi)容、時間和地點,一般位于圖下方中央位置并編號。圖域:即制圖空間,除圓圖外,一般用直角坐標(biāo)系第一象限表示圖域,或者用長方形框架表示。標(biāo)目:分縱標(biāo)目和橫標(biāo)目,表示縱軸和橫軸數(shù)字刻度的意義,一般有度量衡單位。圖例:對圖中不同顏色或圖案代表的指標(biāo)注釋。圖例通常放在橫標(biāo)目與標(biāo)題之間,如果圖域局部有較大空間,也可以放在圖域中。常用統(tǒng)計圖=1\*GB3①直方圖:主要用于描述連續(xù)變量的頻率分布。橫坐標(biāo):表示定量變量的組段,縱坐標(biāo)表示各組段變量值所占的頻率密度〔頻率/組距〕。這時頻率直方圖總面積為1。圖6140名正常男子紅細胞計數(shù)的直方圖=2\*GB3②累計頻率分布圖:用于描述連續(xù)變量的累計頻率分布,橫坐標(biāo)為變量組段,縱坐標(biāo)為各組段累計頻率。可以從累計頻率分布圖中看出不同總體間相同變量的頻率分布差異。其中縱坐標(biāo)為0.25/0.50/0.75、時所對應(yīng)的橫坐標(biāo)尺度為上四分位數(shù),中四分位數(shù),下四分位數(shù)。還可以看出變量在某指定值以上,或以下,或兩個指定值之間的觀察對象所占有觀測對象的比例。=3\*GB3③箱式圖:描述定量變量的平均水平和變異程度,還可以顯示數(shù)據(jù)中的離群值或極端值。箱式圖使用了5個指標(biāo):最小值、下四分位數(shù)、上四分位數(shù)、中位數(shù)、最大值。上四分位數(shù)〔P25〕和下四分位數(shù)〔P75〕構(gòu)成箱體局部,在箱體中標(biāo)出P50位置。P25和最小值之間、P75和最大值之間分別構(gòu)成箱子的上下兩條觸須。觸須外可以標(biāo)出離群值。最小值中位數(shù)最大值上四分位數(shù)P75下四分位數(shù)P25箱子越長表示數(shù)據(jù)離散程度越大。中間橫線假設(shè)在箱子中心位置,表示數(shù)據(jù)分布對稱,中間橫線偏離箱子正中心越遠,表示數(shù)據(jù)分布越偏離中位數(shù)。最小值中位數(shù)最大值上四分位數(shù)P75下四分位數(shù)P25最小值中位數(shù)最大值箱圖用于比擬兩組或多組資料的集中趨勢和離散趨勢。最小值中位數(shù)最大值=4\*GB3④直條圖:可描述離散型定量變量和定性變量的頻率分布。是用等寬直條的高度表示相互獨立的各項指標(biāo)數(shù)量的大小。包括單式條圖、復(fù)式條圖、分段條圖。單式條圖單式條圖圖1某地區(qū)四個季度收治病人數(shù)=5\*GB3⑤趨勢圖線圖半對數(shù)線圖:半對數(shù)線圖〔semi-logarithmiclinearchart)是線圖的一種特殊形式,適合于表示事物開展速度〔相比照〕。其縱軸為對數(shù)尺度,橫軸為算術(shù)尺度,使線圖上的數(shù)量關(guān)系變?yōu)閷?shù)關(guān)系。小結(jié):獨立資料用直條圖;連續(xù)資料用線圖或直方圖;構(gòu)成比資料用百分條圖或圓圖;雙變量資料用散點圖;地區(qū)性資料用統(tǒng)計地圖。常用概率分布正態(tài)分布正態(tài)分布的概念根本概念〔1〕正態(tài)分布:是自然界最常見的一種分布,其特點是中間頻數(shù)最多,兩邊頻數(shù)逐漸減少且對稱。直方圖的各長條面積代表各組頻率,其高度那么代表頻率密度〔頻率/組距〕,這張圖稱為頻率密度圖。如果觀察人數(shù)增多,組段不斷細分,其頂端接近于一條光滑曲線,稱為頻率密度曲線,線下面積恒等于1。〔2〕正態(tài)曲線:是一條頂峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的鐘形曲線。該曲線的函數(shù)表達式稱為正態(tài)分布密度函數(shù)。那么稱X服從正態(tài)分布,記作,μ為X的總體均數(shù),為總體方差。2、正態(tài)概率密度曲線的位置與形狀的特點曲線關(guān)于曲線下面積恒為1σ決定曲線的形狀,μ決定曲線在橫軸上的位置。μ一定時,σ越大,數(shù)據(jù)越分散,曲線越矮胖;σ越小,數(shù)據(jù)越集中,曲線越瘦高。μ增大,曲線沿橫軸向右移動,反之曲線向左移動。正態(tài)分布特征要點:曲線在均數(shù)處最高曲線以均數(shù)為中心,兩端對稱為永遠不與x軸相交的鐘型曲線曲線有兩個重要參數(shù):均數(shù)——位置參數(shù),標(biāo)準(zhǔn)差——形狀〔變異度〕參數(shù)。正態(tài)曲線下的面積分布有一定規(guī)律正態(tài)分布具有可加性二、正態(tài)曲線下面積的計算正態(tài)曲線下面積的意義:正態(tài)曲線下一定區(qū)間內(nèi)的面積代表變量值落在該區(qū)間的概率。整個曲線下的面積為1,代表總概率為1。曲線下面積的求法:定積分法和標(biāo)準(zhǔn)正態(tài)分布法一個共同的規(guī)律任何正態(tài)分布,概率密度曲線下面積具有相同規(guī)律:這是由正態(tài)分布性質(zhì)決定的,與均數(shù)和標(biāo)準(zhǔn)差數(shù)值無關(guān)。Z變換與標(biāo)準(zhǔn)正態(tài)分布對任意一個服從正態(tài)分布的隨機變量,可作如下標(biāo)準(zhǔn)變換,也稱Z變換:經(jīng)此變換得到的變量Z的密度函數(shù)為例:X取值在區(qū)間求X取值在相應(yīng)區(qū)間的概率,要先確定區(qū)間兩端點對應(yīng)的Z值由得:查附表,根據(jù)對稱性,〔1.96,〕的曲線下面積也為0.025,所以Z取值在〔-1.96,1.96〕的概率為1-20.025=0.95,即X取值在相同方法可計算出X取值在區(qū)間由于1.96和2.58這兩個數(shù)具有重要意義,要熟記!另外由標(biāo)準(zhǔn)正態(tài)分布概率密度圖形的對稱性易知:3、正態(tài)分布中幾個重要概念分位點的概念標(biāo)準(zhǔn)正態(tài)分布N(0,1)的“上分位點〞通常記成OO直接查常用標(biāo)準(zhǔn)正態(tài)分布的上分位點OO由的對稱性易知實際例題計算:例2-1130名健康成年男子脈搏資料的均數(shù)、標(biāo)準(zhǔn)差分別為:71.32與5.80〔次/分〕;問在正態(tài)分布假定下,脈搏在65~75〔次/分〕之間有多少人?正態(tài)分布的應(yīng)用1、醫(yī)學(xué)參考值范圍的制定〔1〕重要概念:醫(yī)學(xué)參考值〔referencevalue〕是指包括絕大多數(shù)正常人的人體形態(tài)、機能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由于存在個體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù)而是在一定范圍內(nèi)波動,故采用醫(yī)學(xué)參考值范圍作為判定正常和異常的參考標(biāo)準(zhǔn),但不是“金標(biāo)準(zhǔn)〞。正常值范圍〔或參考值范圍〕:醫(yī)學(xué)上常把絕大多數(shù)正常人的某指標(biāo)值的波動范圍稱為該指標(biāo)的正常值范圍〔或參考值范圍〕。注意:正常人并非指沒有任何疾病的人,而指同質(zhì)前提下排除了足以影響所測指標(biāo)的因素的人?!?〕正常值范圍確實定步驟1〕選定正常人群,并抽取一定的樣本含量〔一般大樣本〕。2〕根據(jù)專業(yè)知識確定用單側(cè)或雙側(cè)范圍。3〕根據(jù)需要確定可信度。4〕按資料特點選定不同方法計算正常值范圍上、下限。〔3〕確定醫(yī)學(xué)參考值范圍的方法有兩種:1〕正態(tài)分布法:適于正態(tài)分布資料。對數(shù)正態(tài)分布的資料取對數(shù)后可用正態(tài)分布法估計。2〕百分位數(shù)法:適于偏態(tài)分布資料或分布不明類型的資料。所需樣本含量較大。雙側(cè)95%醫(yī)學(xué)參考值范圍是〔〕,單側(cè)范圍是以下〔人體有害物質(zhì)如血鉛,發(fā)汞等〕,或以上〔如肺活量〕。雙側(cè)參考值范圍:單側(cè)參考值范圍:例:測得某年某地名正常人的尿汞值如下表,試制定正常人尿汞值的95%參考值范圍。表2-7282名正常人尿汞值〔〕測量結(jié)果尿汞值頻數(shù)f累計頻數(shù)累計頻率〔%〕0~4545~64109~96205~38243~20263~11274~5279~2281~1282鑒于正常人的尿汞值為偏態(tài)分布,且過高為異常,故用百分位數(shù)法計算上側(cè)界值即第95百分位數(shù)故該地正常人的尿汞值的95%醫(yī)學(xué)參考值范圍為<43.6(/L)。第六章第一節(jié)假設(shè)檢驗一.假設(shè)檢驗的原理與邏輯思維:1.背景:假設(shè)兩個樣本來自同一總體,那么它們的差異是由抽樣誤差引起的,那么P>0.05,無統(tǒng)計學(xué)意義。假設(shè)兩個樣本分別來自不同的總體,那么它們之間的差異那么是由本質(zhì)不同引起的,P<0.05,有統(tǒng)計學(xué)意義。在統(tǒng)計分析的過程中,我們往往在一開始不知道所選的樣本是不是來自不同的總體,不知道它們之間的差異是由抽樣誤差引起的還是本質(zhì)不同引起的。為了確定它們的來源,我們需要找到證據(jù)來確定它們是來自不同的總體,但是這就像要證明一個人沒有罵過人一樣,我們不可能從正面來證明他沒罵過人,所以從正面證明樣本來自不同的總體是非常難的,這時候我們就要從反面來考慮,要證明一個人罵過人是很容易的,只要有一次被抓住就可以了,同樣,只要證明兩樣本是不是來自同一整體就可以了,我們可以用假設(shè)檢驗來實現(xiàn)這一過程。在假設(shè)檢驗中,一般設(shè)立一個原假設(shè)與一個備擇假設(shè)。原假設(shè)一般與我們想得到的結(jié)果相反,我們需要利用所掌握的真實數(shù)據(jù)來找出假設(shè)與現(xiàn)實的矛盾,從而否認這個假設(shè),假設(shè)否認不了,說明證據(jù)缺乏,無法否認原假設(shè),但不能說明原假設(shè)正確。2.原理:原理為反證法與概率論。概率論主要是指小概率,即如果一件事情發(fā)生的概率很小〔一般小于0.05或小于0.01〕,事件是“不會發(fā)生的〞,這句話在大多數(shù)情況下是正確的,但它也有錯誤的時候,因為概率再小也是可能發(fā)生的。:先假設(shè)要比擬的事物是相同的,再在這種假設(shè)成立的情況下,進行邏輯推理。假設(shè)推理出發(fā)生的事是一個小概率事件,一般情況下,一次抽樣中是不可能發(fā)生的,那么反推到假設(shè)有誤,從而否認假設(shè),假設(shè)推理出的不是一個小概率事件,那么在一次抽樣中是可能發(fā)生的,那么證據(jù)缺乏,不能拒絕原假設(shè)。需要注意的是這種拒絕或不拒絕是有可能出錯的,其出錯可能性為或。二.假設(shè)檢驗的步驟:1.建立假設(shè),確定檢驗水準(zhǔn):根據(jù)研究設(shè)計的類型和資料特點等因素選擇適宜的檢驗方法,并將需要推斷的問題表述為關(guān)于總體特征的一對假設(shè):原假設(shè)〔零假設(shè)〕與備擇假設(shè)〔對立假設(shè)〕,它們是相互對立的一對假設(shè)。原假設(shè):記為,一般是假設(shè)我們所得到的兩個樣本數(shù)據(jù)的總體均數(shù)μ相等,即。備擇假設(shè):記為,一般是假設(shè)我們所得到的兩個樣本數(shù)據(jù)的總體均數(shù)不相等,即。如果包括與兩種情形,那么為雙側(cè)檢驗;如果憑借專業(yè)知識有充分把握可以排除某一側(cè),即包括或,那么為單側(cè)檢驗,例要檢驗缺鈣地區(qū)兒童前囟門閉合月齡是否大于一般兒童的前囟門閉合的月齡時,根據(jù)的知識,缺鈣地區(qū)兒童前囟門閉合月齡不可能比一般兒童的前囟門閉合的月齡少,此時為單側(cè)檢驗。2.計算檢驗統(tǒng)計量:根據(jù)樣本數(shù)據(jù)計算相應(yīng)的統(tǒng)計量。統(tǒng)計量是隨機樣本的函數(shù),其計算公式不應(yīng)包含任何未知參數(shù)。計算出統(tǒng)計量后,再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值屬不屬于小概率事件。,作出推斷:P值是指:在零假設(shè)成立的條件下,出現(xiàn)統(tǒng)計量目前值及更不利于零假設(shè)數(shù)值的概率。根據(jù)所得到的統(tǒng)計量,在相應(yīng)表格里查找到統(tǒng)計量對應(yīng)的P值,按設(shè)計實驗時決定的αα=0.01的水準(zhǔn)決定拒絕或不拒絕。當(dāng)P≤α,拒絕,接受,兩總體均數(shù)有差異,即在成立的條件下,得到現(xiàn)在檢驗結(jié)果的概率小于α,因為小概率事件不可能在一次試驗中發(fā)生,所以拒絕,否那么不拒絕。三:假設(shè)檢驗的兩個錯誤:從上面內(nèi)容可知,無論我們拒絕還是不拒絕,都可能犯錯誤,其中,假陽性錯誤稱為I型錯誤,意義是“實際無差異,但下了有差異的結(jié)論〞,犯這種錯誤的概率是α〔其值等于檢驗水準(zhǔn)〕;假陰性錯誤稱為II型錯誤,意義是“實際有差異,但下了不拒絕的結(jié)論〞,犯這種錯誤的概率是β〔其值未知〕。用表格來表示為:檢驗水準(zhǔn)α又稱顯著性水準(zhǔn),是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。一般常取0.05或0.01。〔方差齊性檢驗與正態(tài)性檢驗時常取0.10或0.20〕1—β為檢驗效能,意義為當(dāng)兩總體確有差異,按檢驗水準(zhǔn)α所能發(fā)現(xiàn)這種差異的能力。四:假設(shè)檢驗的考前須知:檢驗假設(shè)是針對總體,而非樣本。和是互相對立,不是可有可無,而是缺一不可。無效假設(shè),通常是某兩個或多個總體參數(shù)相相同,或總體參數(shù)之差為0,或某資料服從某一分布等等。假設(shè)檢驗主要是圍繞。備擇假設(shè)應(yīng)該按照實際世界所代表的方向來確定,即它通常是被認為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實。的內(nèi)容反映出是單側(cè)檢驗還是雙側(cè)檢驗。為了時結(jié)果具有真實性和可靠性,在建立假設(shè)前,先要根據(jù)分析目的和專業(yè)知識明確單側(cè)檢驗還是雙側(cè)檢驗,以及檢驗水準(zhǔn)α,不能在假設(shè)檢驗結(jié)果得出后再加以選擇。減少I型錯誤的主要方法:假設(shè)檢驗時設(shè)定α值;減少II型錯誤的主要方法:提高檢驗效能;提高檢驗效能的最有效方法:增加樣本量;可以通過實驗設(shè)計來選擇適宜的樣本量。減少〔增加〕I型錯誤,將會增加〔減少〕II型錯誤。假設(shè)檢驗的結(jié)論是根據(jù)P值大小作出的,不是百分之百的正確。拒絕,可能產(chǎn)生I型錯誤;不拒絕,可能產(chǎn)生II型錯誤。另外,是否拒絕不僅決定于被研究事物有無本質(zhì)差異,還決定于抽樣誤差大小、檢驗水準(zhǔn)的上下以及單側(cè)、雙側(cè)檢驗。因此,當(dāng)P與α接近時,下結(jié)論要慎重,不能絕對化。第二節(jié)t檢驗t檢驗的應(yīng)用條件:以t分布為根底的檢驗稱為t檢驗,分為單樣本資料的t檢驗、配對設(shè)計資料的t檢驗和兩獨立樣本資料的t檢驗。其應(yīng)用條件是:隨機樣本,兩組劑量資料小樣本比擬。各觀察值間相互獨立,不互相影響。來自正態(tài)分布總體。均數(shù)比擬時,要求兩總體方差相等〔方差齊性〕。單樣本資料的t檢驗:方法:將樣本均數(shù)與總體均數(shù)比擬,其分析目的是推斷樣本所代表的未知總體均數(shù)μ與總體均數(shù)有無差異。過程:原假設(shè)為:μ=,備擇假設(shè)為:μ≠。統(tǒng)計量為:t=,是樣本均數(shù),是樣本均數(shù)的標(biāo)準(zhǔn)誤。在成立時,統(tǒng)計量t服從自由度為v=n-1的t分布。考前須知:①其適用樣本均數(shù)與總體均數(shù)的比擬,其比擬目的是檢驗樣本均數(shù)所代表的總體均數(shù)是否與總體均數(shù)有差異。②總體均數(shù)一般為標(biāo)準(zhǔn)值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標(biāo)值。③應(yīng)用條件是總體標(biāo)準(zhǔn)差未知的小樣本資料,且服從正態(tài)分布。4.實例:據(jù)大量調(diào)查知,健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機調(diào)查了25名健康成年男子,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分,能否認為該山區(qū)成年男子的脈搏高于一般人群?〔1〕建立檢驗假設(shè)及確定檢驗水準(zhǔn)::μ=,山區(qū)成年男子平均脈搏數(shù)與一般人群相等。:μ>,山區(qū)成年男子平均脈搏數(shù)高于一般人群屬于單側(cè)檢驗,α=0.05。〔2〕計算統(tǒng)計量:n=25,μ。將其代入公式,得到t=1.692,v=n-1=25-1=24.〔3〕確定P值,作出推斷:由t界值表=1.711,=1.318,得0.10>P>0.05。按α=0.05水準(zhǔn)不拒絕,尚不能認為該山區(qū)健康成年男子的脈搏均數(shù)高于一般健康成年男子的脈搏均數(shù)。配對設(shè)計資料的t檢驗配對設(shè)計是將受試對象按某些重要特征相近的原那么配成對子,每對中的兩個個體隨機地給予兩種處理。它能夠很好地控制非實驗因素對結(jié)果的影響。在醫(yī)學(xué)科學(xué)研究中的配對設(shè)計主要適用于以下情況:異體配對設(shè)計〔包括同源配對設(shè)計和條件相近者配對設(shè)計〕和自身配對設(shè)計。配對設(shè)計的三種方式:兩個同質(zhì)受試對象分別接受兩種處理,如把同一窩出生的、同性別和體重相近的動物配成一對,或把同性別、年齡相近及病情相同的病人配成一對。同一受試對象或同一標(biāo)本的兩局部,隨機分配接受兩種不同處理。將同一受試對象處理〔實驗或治療〕前后的結(jié)果進行比擬。原理:假設(shè)兩種處理因素的作用相同,那么兩因素結(jié)果差值的總體均數(shù)為0,那么用兩樣本差值的均數(shù)與0進行比擬。用假設(shè)檢驗的原理進行判斷。方法:即差數(shù)的總體均數(shù)為0即差數(shù)的總體均數(shù)不為0當(dāng)成立時,統(tǒng)計量為:t=,v=n-1為差值的均數(shù),為差值的樣本標(biāo)準(zhǔn)差,n是對子數(shù)。同樣,給定一個小概率α作為檢驗水準(zhǔn),如果與t值相應(yīng)的P值小于給定的α,拒絕,否那么,不拒絕。實例:為研究飲食中缺乏維生素E對肝中維生素A含量的影響,將同種屬的大白鼠按性別,年齡、體重相近配成8對,并將每對中的兩只大白鼠隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如下表1。問不同飼料組的大白鼠肝中維生素A含量有無差異?建立檢驗假設(shè),確定檢驗水準(zhǔn):=0,不同飼料組的大白鼠肝中含量無差異。:≠0,不同飼料組的大白鼠肝中含量有差異。.05。選定檢驗方法,計算檢驗統(tǒng)計量n=8,=6.81,=8.0867,=6.81/8=0.851〔μmol/g〕=0.572〔μmol/g〕確定P值,作出推斷結(jié)論v=n-1=7,查界值表,得=4.029,=4.785,得0.005>P>0.002,按α=0.05水準(zhǔn),拒絕,接受,差異有統(tǒng)計學(xué)意義??烧J為不同飼料的大白鼠肝中含量有差異,正常飼料的較高。兩獨立樣本資料的t檢驗兩獨立樣本資料的t檢驗是將受試對象隨機分配成兩個處理組,每一組接受一種處理,從而獲得兩組資料,它們代表兩個總體的兩個獨立樣本,據(jù)此推斷它們的總體均數(shù)是否相等。兩樣本含量可以相等也可以不相等,但在總例數(shù)不變的條件下,當(dāng)兩樣本含量相等時,統(tǒng)計檢驗的效率最高。應(yīng)用條件:兩總體分布為正態(tài)分布,且方差齊。假設(shè)方差不齊,那么用檢驗。兩樣本所屬總體方差相等(方差齊):①方法:將兩個正態(tài)分布總體分別記為N〔〕和N〔〕,假設(shè)檢驗為::=,即兩樣本所屬的兩個總體均數(shù)相等:≠,即兩樣本所屬的兩個總體均數(shù)不相等:t==,v=其中,是利用兩樣本聯(lián)合估計的方差:假設(shè)與t值相應(yīng)的P值小于給定的α,拒絕,否那么,不拒絕。②實例:測得14名慢性支氣管炎患者與11名健康人的尿中17酮類固醇〔mol/24h〕排出量如下,試比擬兩組人的尿中17酮類固醇的排出量有無差異。患者:健康人:建立檢驗假設(shè),確定檢驗水準(zhǔn):=,即患者與健康人尿中17酮類固醇的排出量相同:≠,即患者與健康人的尿中17酮類固醇的排出量不同.05計算統(tǒng)計量=14,=,==11,=,===15.17〔μmol/24h〕==19.15〔μmol/24h〕=29.9993,=2.2068,t=1.8035,v=23確定P值,作出推斷結(jié)論查t界值表,推斷出0.10>P>0.05,按α=0.05水準(zhǔn),不拒絕,差異無統(tǒng)計學(xué)意義。尚不能認為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同。兩樣本所屬總體方差不等〔Satterthwaite近似法〕方法:對自由度進行校正:檢驗的公式:=,v=兩正態(tài)總體分別記為N〔〕和N〔〕,,檢驗假設(shè)如前。作為統(tǒng)計量。給定一個小概率α作為檢驗水準(zhǔn),如果與t值相應(yīng)的P值小于給定的α,拒絕,否那么,不拒絕。實例:為了探討血清SIL-2R含量對白血病的診斷意義,隨機抽取正常對照11人和白血病患者13人,測得血清SIL-2R含量如下。比擬兩組人群血清SIL-2R含量是否不同。白血病組:630.21602.13589.27638.17592.30690.11869.23對照組::=,即兩組人群血清SIL-2R含量相同:≠,即兩組人群血清SIL-2R含量不同。.05=13,=,==11,=179.72,=9.28查t界值表,得出P<0.001,按α=0.05水準(zhǔn),拒絕,接受,差異有統(tǒng)計學(xué)意義,認為兩組血清SIL-2R含量不同,白血病組高于對照組。兩獨立樣本資料的方差齊性檢驗1.常用F檢驗,其計算公式為F=,=-1,=-1F值是兩個樣本方差之比,如僅是抽樣誤差的影響,它一般不會離1太遠,F(xiàn)分布就是反映此概率的分布。求得F值后,查表F界值表〔方差齊性檢驗用〕,得P值,按所取檢驗水準(zhǔn)作出推斷結(jié)論。2.方法:設(shè)有兩個隨機樣本分別獨立地取自兩個正態(tài)整體,判斷其總體方差和是否相等,可以做如下齊性檢驗::=,即兩獨立樣本資料的總體方差相等:≠,即兩獨立樣本資料的總體方差不相等F=,=-1,=-1給定一個小概率α作為檢驗水準(zhǔn),如果與F值相應(yīng)的P值小于給定的α,拒絕,否那么,不拒絕。3.實例:兩組小白鼠分別飼以高蛋白和低蛋白飼料,4周后記錄小白鼠體重增加量(g)如表5-3所示,問兩組動物體重增加量的均數(shù)是否相等?先進行方差齊性檢驗:=,即兩種飼料喂養(yǎng)后小白鼠體重增加量的總體方差相同:≠,即兩種飼料喂養(yǎng)后小白鼠體重增加量的總體方差不同.05=,F(xiàn)=5.402,=11,=12,查表得≈3.34,推出P<0.05,差異有統(tǒng)計學(xué)意義,按α=0.05水準(zhǔn),拒絕,接受,認為兩組體重增加量的總體方差不等,不不可直接用兩獨立樣本均數(shù)t檢驗。應(yīng)采用近似t檢驗〔〕,或采用數(shù)據(jù)變換,或采用非參數(shù)檢驗。六.補充:u檢驗根據(jù)數(shù)理統(tǒng)計的中心極限定理,不管變量X的分布是否服從正態(tài)分布,當(dāng)隨機抽樣的樣本例數(shù)足夠大,樣本均數(shù)服從正態(tài)分布N〔μ,〕,=為均數(shù)標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)正態(tài)變量為u==,:U=〔n較大時〕U=〔〕與=1.96,=2.58進行比擬第七章方差分析根底目錄:一、方差分析的根本內(nèi)容P2二、完全隨機設(shè)計的方差分析總變異與自由度的分解P3三、完全隨機設(shè)計資料方差分析P4四、隨機區(qū)組設(shè)計的方差分析總變異與自由度的分解P6五、隨機區(qū)組設(shè)計的方差分析P7六、析因設(shè)計離均差平方和與自由度的分解P9七、析因設(shè)計P10八、多個樣本均數(shù)的兩兩比擬P11方差齊性檢驗P13數(shù)據(jù)變換P14十一、小結(jié)P15第七章方差分析根底一、方差分析的根本內(nèi)容1.根本思想:1.1根據(jù)資料的設(shè)計類型,即變異的不同來源,將全部觀察值總的離均差平方和及自由度分解為兩個或多個局部,包括:隨機誤差造成的變異其他因素造成的變異〔一個因素一種變異〕1.2通過比擬不同來源變異的均方〔MS〕,借助F分布做出統(tǒng)計推斷,從而了解該因素對觀察指標(biāo)有無影響。“=〞或“≠〞隨機誤差造成的變異1.4推斷多個總體均數(shù)是否有差異〔也可用于兩個〕方差分析前提條件:2.2均來自正態(tài)分布總體:正態(tài)性檢驗D、W或χ2檢驗2.3各樣本總體方差相等,即方差齊性:Bartlettχ2,Levene檢驗3.選擇方差分析時需考慮的6個方面的問題:3.1看反響變量是單變量、雙變量還是多變量:單變量3.2看資料屬于3種資料類型〔計量、計數(shù)及等級資料〕中的哪一種:計量資料3.3看單樣本、兩樣本或多樣本:三組及以上樣本選擇方差分析,兩樣本也可用3.4看影響因素是單因素還是多因素:完全隨機設(shè)計資料是單因素,隨機區(qū)組設(shè)計資料是雙因素3.5看是否是配對或配伍設(shè)計:是,隨機區(qū)組設(shè)計3.6看是否滿足檢驗方法所需的前提條件,必要時可進行變量變換:對數(shù)變換、平方根變換、平方根反正弦變換、倒數(shù)變換統(tǒng)計分析的步驟:正態(tài)性檢驗〔第四章,假設(shè)滿足,繼續(xù)以下操作;不滿足,進行數(shù)據(jù)變換〕→方差齊性檢驗〔本章Bartlettχ2,Levene檢驗,假設(shè)滿足,繼續(xù)以下操作;不滿足,進行軼和檢驗或...〕→分析數(shù)據(jù)類型,選擇方差分析類型〔單因素:完全隨機設(shè)計;雙因素:隨機區(qū)組設(shè)計;析因分析:2個或2個以上因素,分析之間有無相互作用〕→多個樣本均數(shù)的兩兩比擬完全隨機設(shè)計的方差分析總變異與自由度的分解總變異:為全部測量值大小不同,既包含了處理的效應(yīng),又包含了隨機誤差??梢杂秒x均差平方和〔SS,即各測量值Xij與總均數(shù)差值的平方和,記為SS總〕和總均方MS總表示。組間變異:為由于各處理組接受處理的水平不同,各組的樣本均數(shù)也大小不等,其大小可用各組均數(shù)與總均數(shù)的離均差平方和表示,記為SS組間。組內(nèi)變異:在同一處理組中,雖然每個受試對象接受的處理相同,但測量值仍各不相同,這種變異稱為組內(nèi)變異〔誤差〕。組內(nèi)變異可用組內(nèi)各測量值Xij與其所在組的均數(shù)的差值的平方和表示,記為SS組內(nèi),表示隨機誤差的影響?!白儺惃曋g的關(guān)系:SS總=SS組間+SS組內(nèi),且V總=V組間+V組內(nèi)值:如果,那么都為隨機誤差σ2的估計,F(xiàn)值應(yīng)接近1。如果不全相等,F(xiàn)值將明顯大于1。用F界值〔單側(cè)界值〕確定P值。6.完全隨機設(shè)計方差分析表:變異來源自由度SSMSF總變異N-1組間g-1組內(nèi)N-g完全隨機設(shè)計資料方差分析前提:單因素〔單向〕方差分析:同質(zhì)的觀察對象,不加任何條件限制,隨機的分配到各處理組中去,每組接受一種處理方法只有一個處理因素,多個水平。分析步驟:2.1建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:多個總體均數(shù)全相等H1:各總體均數(shù)不等或不全相等2.2計算檢驗統(tǒng)計量:離均差平方和SS:總變異離均差平方和SS總、組間離均差平方和SS組間和組內(nèi)離均差平方和SS組內(nèi);自由度ν:總自由度ν總、組間自由度ν組間和組內(nèi)自由度ν組內(nèi);均方MS:組間均方MS組間和組內(nèi)均方MS組內(nèi);檢驗統(tǒng)計量為F值。2.3確定P值,進行推斷:計算出統(tǒng)計量F,求出對應(yīng)的P值,與α進行比擬,確定是否為小概率事件。如是小概率事件,那么MS組間=MS組內(nèi)的可能性不大,那么說明組間因素有統(tǒng)計學(xué)意義。2.4.注意:方差分析的結(jié)果拒絕H0,接受H1,不能說明各組總體均數(shù)間兩兩都有差異。假設(shè)要分析哪些兩組間有差異,可進行多個均數(shù)間的多重比擬。當(dāng)g=2時,完全隨機設(shè)計方差分析與成組設(shè)計資料的t檢驗等價,有t=√F。3.應(yīng)用實例:某醫(yī)生為了研究一種降血脂新藥的臨床療效,按統(tǒng)一納入標(biāo)準(zhǔn)選擇120名高血脂患者,采用完全隨機設(shè)計方法將患者等分為4組,進行雙盲試驗。6周后測得低密度脂蛋白作為試驗結(jié)果。問4個處理組患者的低密度脂蛋白含量總體均數(shù)有無差異?分組測量值統(tǒng)計量n撫慰劑組03004.00降血脂新藥30g組004.8g組3007.2g組3003.1建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:4個處理組患者的低密度脂蛋白含量總體平均水平相同H1:4個處理組患者的低密度脂蛋白含量總體平均水平不全相同3.2計算檢驗統(tǒng)計量:,=120-1=1193.2.2完全隨機設(shè)計方差分析表:變異來源自由度SSMSFP總變異119組間3組內(nèi)1160.433.3確定P值,進行推斷:按α水準(zhǔn),拒絕H0,接受H1,認為4個試驗組LDL-c總體均數(shù)不相等,即不同劑量藥物對血脂中l(wèi)dl-c降低影響有差異。四、隨機區(qū)組設(shè)計的方差分析總變異與自由度的分解1.總變異:所有觀察值之間的變異SS總=SS處理+SS區(qū)組+SS誤差Ν總=ν處理+ν區(qū)組+ν誤差2.處理間變異:處理因素+隨機效應(yīng)3.區(qū)組間變異:區(qū)組因素+隨機效應(yīng)4.誤差變異:隨機效應(yīng)隨機區(qū)組設(shè)計的方差分析前提:又稱為配伍組設(shè)計,是配對設(shè)計的擴展,也可看成是1:m匹配設(shè)計。具體做法是:先按影響試驗結(jié)果的非處理因素〔如性別、體重、年齡、職業(yè)、病情、病程、動物窩別等〕將受試對象配成區(qū)組(block),再分別將各區(qū)組內(nèi)的受試對象隨機分配到各處理或?qū)φ战M。是雙因素設(shè)計的方差分析。分析步驟:2.1建立檢驗假設(shè),確定檢驗標(biāo)準(zhǔn)處理組間:H0:k個處理組總體均數(shù)相等H1:k個處理組總體均數(shù)不全相等α區(qū)組間:H0:b個區(qū)組總體均數(shù)相等H1:b個區(qū)組總體均數(shù)不全相等α2.2計算檢驗統(tǒng)計量計算出離均差平方和、自由度ν、均方和F值。2.3用F值進行統(tǒng)計推斷,得到P值2.4注意:當(dāng)組數(shù)為2時,隨機區(qū)組設(shè)計資料的方差分析與配對設(shè)計資料的t檢驗等價,有t=√F。應(yīng)用實例:某廠10名氟作業(yè)工人24小時內(nèi)不同時間尿氟排出如下表。試分析氟作業(yè)工人在工前、工中(上班第4小時)和工后(下班后第4小時)的尿氟排出量(ml/L)的差異有無統(tǒng)計學(xué)意義?工人編號工前工中工后123456789103.1建立檢驗假設(shè),確定檢驗水準(zhǔn)αH0:不同時間的尿氟排出量的均數(shù)相同。H1:不同時間的尿氟排出量的均數(shù)不全相同。3.2計算檢驗統(tǒng)計量:-130.54SS處理=-130.54SS處理=-130.54SS區(qū)組=-130.54SS區(qū)組==6.19=6.19SS誤差=SS總-SS處理-SS區(qū)組=17.75-4.01-6.19=7.55F1F2變異來源SSdfMSFP總變異29處理組間變異2區(qū)組間變異9誤差183.3用F值進行統(tǒng)計推斷,得到P值處理組按α=0.05水準(zhǔn),拒絕H0,可以認為處理組間的變異有統(tǒng)計學(xué)意義,那么3個總體均數(shù)中至少有兩個不同。至于3個總體均數(shù)中哪些不同,需要用多個均數(shù)間的兩兩比擬方法。區(qū)組不拒絕H0,既不能認為10個區(qū)組的總體均數(shù)不同。析因設(shè)計離均差平方和與自由度的分解1.表示符號:兩個處理因素:A、BA、B因素各有a、b個水平,共有a×b種組合每一組合下有n個受試對象全部實驗受試對象總數(shù)為a×b×ni(i=1,2…,α)表示因素A的水平號,j(j=1,2,…,b)表示因素B的水平號,k(k=1,2,…,n)表示在每一組合下的受試對象號2.總變異:4.處理因素B的變異6.誤差變異析因設(shè)計前提:是將兩個或多個實驗因素的各水平進行全面組合,對各種組合都進行實驗,從而探討各實驗因素的單獨效應(yīng)(simpleeffect)、主效應(yīng)(maineffect)以及各因素間的交互效應(yīng)(interactioneffect)。2.特點:2.1有2個或以上〔處理〕因素〔factor〕(分類變量)2.2每個因素有2個或以上水平〔level〕2.3每一組合涉及全部因素,每一因素只有一個水平參與2.4幾個因素的組合中至少有2個或以上的觀察值2.5觀測值為定量數(shù)據(jù)〔需滿足隨機、獨立、正態(tài)、等ANOVA條件〕分析步驟:3.1建立檢驗假設(shè),確定檢驗水準(zhǔn)α處理因素A的假設(shè):處理因素B的假設(shè):處理因素間交互作用的假設(shè):3.2計算檢驗統(tǒng)計量F:離均差平方和與自由度3.3確定P值并作出推斷應(yīng)用實例:4.1建立檢驗假設(shè),確定檢驗水準(zhǔn)對于因素A:H0:不同保存時間對人血清皮質(zhì)醇的測定值無影響H1:不同保存時間對人血清皮質(zhì)醇的測定值有影響對于因素B:H0:不同溫度對人血清皮質(zhì)醇的測定值無影響H1:不同溫度對人血清皮質(zhì)醇的測定值有影響對于交互作用AB:H0:因素A和因素B無交互效應(yīng)H1:因素A和因素B有交互效應(yīng)4.3確定P值,作出統(tǒng)計推斷本例A因素主效應(yīng)的P<0.01,拒絕H0,有統(tǒng)計學(xué)意義,可以認為不同保存時間對人血清皮質(zhì)醇的測定結(jié)果有影響;B因素主效應(yīng)的P<0.01,拒絕H0,有統(tǒng)計學(xué)意義,可以認為不同溫度對測定結(jié)果有影響。AB交互效應(yīng)的P>0.05,按α=0.05水準(zhǔn),不拒絕H0,即不能認為兩個因素間存在交互效應(yīng)。多個樣本均數(shù)的兩兩比擬探索性:在研究設(shè)計階段未預(yù)料到,經(jīng)假設(shè)檢驗得出多個總體均數(shù)不全等的提示后才決定的多個均數(shù)的兩兩事后比擬。往往涉及到每兩個均數(shù)的比擬。可采用SNK〔Students-Newman-Keuls)法、bonfferonit檢驗驗證性:在設(shè)計階段就根據(jù)研究目的或?qū)I(yè)知識而方案好的某些均數(shù)間的兩兩比較。常用于事先有明確假設(shè)的證實性研究,如多個處理組與對照組的比較??刹捎肈unnett-t檢驗、LSD-t檢驗,也可用bonfferonit檢驗。SNK-q檢驗:1.1計算公式:ν=ν誤差式中,和,為兩比照組的樣本均數(shù)和樣本例數(shù)1.2應(yīng)用實例:某研究者采用隨機區(qū)組設(shè)計進行實驗,比擬三種抗癌藥物對小白鼠肉瘤抑瘤效果,先將15只染有肉瘤小白鼠按體重大小配成5個區(qū)組,每個區(qū)組內(nèi)3只小白鼠隨機接受三種抗癌藥物,以肉瘤的重量為指標(biāo),試驗結(jié)果見表。問三種不同的藥物的抑瘤效果有無差異?表不同藥物作用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論