版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第一章緒論一、什么是統(tǒng)計(jì)學(xué)二、統(tǒng)計(jì)工作的步驟
三、幾個基本概念
2一、什么是統(tǒng)計(jì)學(xué)
研究對象:數(shù)據(jù)統(tǒng)計(jì)學(xué)就是研究數(shù)據(jù)及其存在規(guī)律的科學(xué)。包括數(shù)據(jù)的收集、整理、分析以及對結(jié)果的解釋。3常見的統(tǒng)計(jì)學(xué)問題食用醋能預(yù)防感冒嗎?放血療法有效嗎?天氣預(yù)報準(zhǔn)確嗎?體育彩票能否中獎?小明的身高能超過他爸爸嗎?膽結(jié)石急性發(fā)作的可能性有多大?4從臨床實(shí)踐中如何尋找規(guī)律?與臨床工作的關(guān)系5二、統(tǒng)計(jì)工作的步驟第一步研究設(shè)計(jì)(design)第二步收集資料(collectionofdata)第三步整理資料(sortingdata)第四步分析資料(analysisofdata)這四個步驟包括了一個研究的全部過程。6第一步研究設(shè)計(jì)(開題報告)意義、目的、方法、內(nèi)容、對象、主要指標(biāo)、進(jìn)度、預(yù)期結(jié)果等(文獻(xiàn)綜述基礎(chǔ)上進(jìn)行)其中有可能涉及到的統(tǒng)計(jì)內(nèi)容是什么?7第二步收集資料(現(xiàn)場調(diào)查):病例記錄、工作記錄、專門調(diào)查等計(jì)劃的實(shí)施和執(zhí)行過程,常常是一個漫長的時間,關(guān)鍵是保證前后的一致性和資料的完整性8第三步整理資料(sortingdata):建立數(shù)據(jù)庫、過錄、輸入、邏輯檢錯等。(分析資料的基礎(chǔ)和數(shù)據(jù)質(zhì)量)第四步分析資料(analysisofdata):各種描述、統(tǒng)計(jì)檢驗(yàn)方法、多元回歸等(選擇正確的分析方法)(這些是這次課程的主要內(nèi)容)
9三、幾個基本的統(tǒng)計(jì)學(xué)概念總體與樣本(populationandsample)變量(Variable)變異(variation)誤差(error)概率(probability)
總體:
根據(jù)研究目的確定的研究對象的全體(群體)。研究一般希望獲得研究群體的特征。樣本:總體中有代表性的一部分。從總體中得到樣本的方法:有代表性。
(抽樣方法與樣本量)從樣本推回到總體的方法:統(tǒng)計(jì)推斷(假設(shè)檢驗(yàn)等)1.總體與樣本(populationandsample)
2.變量(Variable)在確定了研究總體之后,研究者要對每個觀察單位的某項(xiàng)特征進(jìn)行測量和觀測,這種特征稱為變量。變量的測得值或觀察值也叫做資料。資料分類:(資料性質(zhì)不同,分析方法不同)
計(jì)量資料、計(jì)數(shù)資料、等級資料
(1)計(jì)量資料定義:通過度量衡的方法,測量每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。特點(diǎn):有度量衡單位多為連續(xù)性資料(2)計(jì)數(shù)資料定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn):沒有度量衡單位多為間斷性資料(3)等級資料定義:介于計(jì)量資料和計(jì)數(shù)資料之間的一種資料,通過半定量方法測量得到。特點(diǎn):☆每一個觀察單位沒有確切值☆各組之間有性質(zhì)上的差別或程度上的不同。163.變異(variation)
概念:許多個體之所以能匯集成一個總體,必定存在共同的特征,共同的特征是他們的同質(zhì)性,但個體之間又不是完全相同的,這種個體之間的差異就是變異。變異產(chǎn)生的原因:如何處理變異?透過偶然,發(fā)現(xiàn)必然!4.誤差(Error)
統(tǒng)計(jì)上所說的誤差泛指測量值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。主要有以下三種:系統(tǒng)誤差、隨機(jī)測量誤差、抽樣誤差。
問題:哪類誤差用統(tǒng)計(jì)學(xué)方法可以控制?為什么?18(1)系統(tǒng)誤差
概念:指數(shù)據(jù)搜集和測量過程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等原因,造次觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。特點(diǎn):具有累加性。19(2)隨機(jī)測量誤差
概念:由于非人為的偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機(jī)測量誤差。特點(diǎn):沒有傾向性,多次測量計(jì)算平均值可以減小甚至消除隨機(jī)測量誤差。20(3)抽樣誤差
概念:樣本指標(biāo)與總體指標(biāo)之間的差別。特點(diǎn):有抽樣,抽樣誤差就不可避免。統(tǒng)計(jì)上可以計(jì)算并在一定范圍內(nèi)控制抽樣誤差。減少抽樣誤差的方法:(1)改進(jìn)抽樣方法(增加樣本的代表性),誤差從大到小:整群抽樣單純隨機(jī)抽樣系統(tǒng)抽樣分層抽樣(2)增加樣本量;(3)選擇變異程度較小的研究指標(biāo)。22
5、概率
(probability)
概念:描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,常用P來表示。大?。篜的大小在0和1之間。通常一個事件的發(fā)生小于5%,就叫小概率事件。在實(shí)際工作中,當(dāng)觀察單位的例數(shù)足夠多時,可以用頻率來代替概率。頻率與概率(樣本與總體、事實(shí)與預(yù)測)
23主要內(nèi)容第一節(jié)計(jì)量資料的頻數(shù)分布第二節(jié)集中趨勢第三節(jié)離散趨勢第四節(jié)正態(tài)分布第五節(jié)醫(yī)學(xué)正常值范圍的估計(jì)24第一節(jié)頻數(shù)分布什么是頻數(shù)頻數(shù)分布的特點(diǎn)頻數(shù)分布的類型頻數(shù)分布的用途26SPSS建立數(shù)據(jù)庫進(jìn)入SPSS操作窗口進(jìn)入數(shù)據(jù)編輯窗口(dataeditor)VariableView變量名類型整數(shù)位小數(shù)位輸入數(shù)據(jù):DataView27檢查輸入的數(shù)據(jù)(打開數(shù)據(jù)庫)找出最大值、最小值(數(shù)據(jù)排序)dataeditor-data-sortcases身高主要集中在什么階段?Analyze----DescriptiveStatistics----Frequencies身高-displayfrequencytable(這個程序能否看得出來大多數(shù)人身高在何處?應(yīng)該怎么辦?)29變量變換:將身高轉(zhuǎn)化成一個新變量(組段)Transform-recode-intodifferentvariables(身高-組段)--change-oldandnew-oldvalue(range)-newvalue(value)-old-new—add—continue(可以試用不同的分組方法,例如“5”“2”)產(chǎn)生新變量(組段)30Analyze----DescriptiveStatistics----Frequencies-組段-displayfrequencytable頻數(shù)表33頻數(shù):當(dāng)匯總大量的原始數(shù)據(jù)時,把數(shù)據(jù)按類型分組,其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。頻數(shù)表(頻數(shù)分布):表示各組及它們對應(yīng)的組頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。(見前兩張幻燈)34
頻數(shù)分布的兩個特征:集中趨勢與離散趨勢(共性與個性)
頻數(shù)分布的類型:對稱分布與偏態(tài)分布(集中位置偏向小的一側(cè)叫正偏態(tài),反之叫負(fù)偏態(tài))
頻數(shù)表的主要用途:1.揭示分布類型2.發(fā)現(xiàn)特大值和特小值3.計(jì)算集中趨勢指標(biāo)與離散趨勢指標(biāo)總結(jié)前面35楊振寧教授:“怎樣評價中國的高等教育”中國注重訓(xùn)導(dǎo),美國注重啟發(fā)(教育哲學(xué)不同)。對于九十分以下的學(xué)生,中國的教育哲學(xué)比較好,能夠訓(xùn)導(dǎo)其少走彎路,增加自信心和安全感。而這些畢業(yè)生正是今天中國社會所急需的人才(通用型人才)。至于九十分以上的學(xué)生,美國的教育哲學(xué)一般比較好,能夠讓他們有更多空間發(fā)展他們的才能(尖端人才)。中美學(xué)生成績分布特別很不同,中國的只有一個‘峰’;而美國學(xué)生呈兩個“峰”,好壞突出。
362006.3.15日,英國諾丁漢大學(xué)校長、中國科學(xué)院院士楊福家教授做客同濟(jì)大學(xué)進(jìn)行演講時,針對楊振寧教授“中國暫不需諾貝爾獎”觀點(diǎn)提出了不同意見?!拔覀儾粌H僅需要比爾·蓋茨和任天堂,也需要一部分人從事和經(jīng)濟(jì)沒有關(guān)系的基礎(chǔ)研究,他們是將來中國經(jīng)濟(jì)發(fā)展的動力和源泉所在?!?7第二節(jié)集中趨勢
集中位置的描述,即大多數(shù)數(shù)值落在什么位置上。(針對一個變量的若干個數(shù)值)描述集中趨勢的幾種指標(biāo)(用不同的方法將不同類型數(shù)值的集中位置表示出來)1.算術(shù)均數(shù)(均數(shù))2.幾何均數(shù)3.中位數(shù)381.算術(shù)均數(shù)(均數(shù))意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示
(總體)X(樣本)(spss中用“mean”)計(jì)算:直接法、間接法、計(jì)算機(jī)計(jì)算(spss)特征:∑(X-X)=0估計(jì)誤差之和為0。應(yīng)用:正態(tài)分布或近似正態(tài)分布注意:合理分組,才能求均數(shù),否則沒有意義。39
用SPSS計(jì)算算術(shù)均數(shù)File---Open---Data---身高---Analyze----DescriptiveStatistics----Frequencies----Statistics----Mean---Continue----OK402.幾何均數(shù)意義:N個數(shù)值的乘積開N次方即為這N個數(shù)的幾何均數(shù)。表示:G
計(jì)算:應(yīng)用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。數(shù)值范圍跨越多個數(shù)量級。例如抗體滴度。41首先看這組數(shù)據(jù)的頻數(shù)分布,大概集中在什么位置。用“mean”求,看結(jié)果如何。42SPSS計(jì)算幾何均數(shù)File---Open---Data---抗體滴度---Analyze----Reports----CaseSummaries----抗體滴度-Statistics----GeometricMean----Continue---OKCaseSummariesa1.001.001.001.002.002.002.002.002.004.004.004.004.004.004.004.008.008.008.0016.0016.0032.0032.00234.001234567891011121314151617181920212223NGroupedMedianTotal抗體滴度Limitedtofirst100cases.a.443.中位數(shù)、百份位數(shù)意義:將一組觀察值從小到大排序后,居于中間位置的那個值或兩個中間值的平均值。(身高排隊(duì))dataeditor-data-sortcases表示:M、PX計(jì)算:百分位數(shù):將N個觀察值從小到大依次排列,再分成100等份,對應(yīng)于X%位的數(shù)值即為第X百分位數(shù)。中位數(shù)是百分位的特殊形式。應(yīng)用:偏態(tài)資料,開口資料45偏態(tài)資料用算術(shù)均數(shù)處理會產(chǎn)生什么樣的結(jié)果?大家試舉一個偏態(tài)資料的例子。(醫(yī)療衛(wèi)生服務(wù)的公平性)46SPSS計(jì)算中位數(shù)、百分位數(shù)File---Open---Data---收入(抗體滴度)----Analyze----DescriptiveStatistics----Frequencies----Statistics----Median(mean)---Continue----OK47三個指標(biāo)的區(qū)別與聯(lián)系1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù)48第三節(jié)離散趨勢
描述一組數(shù)據(jù)參差不齊的程度49全距四分位數(shù)間距方差標(biāo)準(zhǔn)差變異系數(shù)
常用指標(biāo):50標(biāo)準(zhǔn)差相關(guān)概念:離均差、離均差之和、離均差平方和、方差(2S2)
標(biāo)準(zhǔn)差的符號:S(Std.deviation)
意義:全面反映了一組觀察值的變異程度.(越大說明圍繞均數(shù)越離散,反之說明較集中在均數(shù)周圍,均數(shù)的代表性越好)計(jì)算:spss程序計(jì)算應(yīng)用:描述變異程度、計(jì)算標(biāo)準(zhǔn)誤、計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常值范圍51SPSS計(jì)算標(biāo)準(zhǔn)差File---Open---Data---身高---Analyze----DescriptiveStatistics----Frequencies----Statistics----Dispersion---Std.deviati---Continue----OK52變異系數(shù)意義:標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示。符號:CV計(jì)算:CV=(S/X)100%無單位應(yīng)用:單位不同的多組數(shù)據(jù)比較均數(shù)相差懸殊的多組資料53第四節(jié)正態(tài)分布(Normaldistribution)主要內(nèi)容:1、圖形形狀2、圖形特征3、正態(tài)曲線下面積分布規(guī)律54德國大數(shù)學(xué)家高斯(C.F.Gauss,1777~1855)。調(diào)查、觀察或測量中的誤差,不僅是不可避免的,而且一般是無法把握的。高斯以他豐富的天文觀察和在1821~1825年間土地測量的經(jīng)驗(yàn),發(fā)現(xiàn)觀察值x與真正值μ的誤差變異,大量服從現(xiàn)代人們最熟悉的正態(tài)分布。稱高斯分布曲線,也就是正態(tài)分布曲線。
正態(tài)曲線(Normalcure):是一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘形曲線。57正態(tài)分布的特征均數(shù)處最高(說明什么?);均數(shù)為中心左右對稱;2個參數(shù)N(u,
)決定了圖形的位置和形狀;標(biāo)準(zhǔn)正態(tài)分布:N(0,1);標(biāo)準(zhǔn)正態(tài)變換(變換公式);
曲線下的面積有一定規(guī)律(見下面)。59標(biāo)準(zhǔn)正態(tài)變換后61正態(tài)曲線下的面積分布規(guī)律附表1(不同位置上數(shù)的意義,圖示)橫軸上、曲線下的面積為1;曲線下,橫軸上對稱于0的面積相等,X1-X2曲線下的面積為多少?
(x)
與所對應(yīng)的面積P成反比。63SPSS繪制正態(tài)曲線File---Open---Data---身高:兩個路徑---Analyze----DescriptiveStatistics----Frequencies----ChartType----WithnormalCure----Continue----OK----Graphs----Histograms---DisplayNormalCurve---Continue----OK65第五節(jié)醫(yī)學(xué)正常值范圍的估計(jì)
概念:又稱參考值范圍,是指特定健康人群的解剖、生理、生化等各種數(shù)據(jù)的波動范圍。習(xí)慣上是確定包括95%的人的界值。
單雙側(cè):根據(jù)指標(biāo)的實(shí)際用途,有的指標(biāo)有上下界值(雙側(cè))。某些指標(biāo)只需確定上限(單);某些指標(biāo)只需確定下限(單)。
估計(jì)的方法:
1、正態(tài)分布法
2、百分位數(shù)法66
應(yīng)用條件:正態(tài)分布或近似正態(tài)分布資料計(jì)算(雙側(cè)):
95%正常值(醫(yī)學(xué)參考值)范圍公式:
(x
1.96·S,x
1.96·S)
即(x±1.96·S)
1、正態(tài)分布法672、百分位數(shù)法應(yīng)用條件:任何分布資料計(jì)算公式:
雙側(cè)界值:P2.5~P97.5
單側(cè)上界:P95
單側(cè)下界:P5
68SPSS求正常值范圍(百份位數(shù)法)File---Open---Data---收入----Analyze----DescriptiveStatistics----Frequencies----Statistics----PercentileValues---Continue----OK69基本內(nèi)容
統(tǒng)計(jì)描述統(tǒng)計(jì)推斷(1)統(tǒng)計(jì)推斷(2)計(jì)量資料頻數(shù)分布集中趨勢離散趨勢統(tǒng)計(jì)圖表抽樣誤差標(biāo)準(zhǔn)誤
tuF檢驗(yàn)秩和檢驗(yàn)直線相關(guān)與回歸偏相關(guān)多元線性回歸計(jì)數(shù)資料相對數(shù)統(tǒng)計(jì)圖表u、
2檢驗(yàn)秩和檢驗(yàn)Logistic回歸70統(tǒng)計(jì)推斷(Statisticalinference):用樣本信息推論總體特征的過程。包括:參數(shù)估計(jì):
運(yùn)用統(tǒng)計(jì)學(xué)原理,用從樣本計(jì)算出來的統(tǒng)計(jì)指標(biāo)量,對總體指標(biāo)量進(jìn)行估計(jì)。假設(shè)檢驗(yàn):又稱顯著性檢驗(yàn),是指由樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。71補(bǔ)充:參數(shù)統(tǒng)計(jì)和非參數(shù)統(tǒng)計(jì)
參數(shù):總體的統(tǒng)計(jì)指標(biāo)稱為參數(shù)(、、)統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo)叫統(tǒng)計(jì)量(X、s、p)參數(shù)統(tǒng)計(jì):我們介紹的統(tǒng)計(jì)推斷方法,通常要求樣本來自正態(tài)總體,或方差齊等,在這些假設(shè)的基礎(chǔ)上,對總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)。非參數(shù)統(tǒng)計(jì):有許多資料不符合參數(shù)統(tǒng)計(jì)的要求,不能用參數(shù)統(tǒng)計(jì)的方法進(jìn)行檢驗(yàn),而需要一種不依賴于總體分布類型,也不對總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn),稱為非參數(shù)檢驗(yàn)。主要內(nèi)容第一節(jié)標(biāo)準(zhǔn)誤第二節(jié)
t
分布第三節(jié)總體均數(shù)的估計(jì)第四節(jié)假設(shè)檢驗(yàn)第五節(jié)未知總體與已知總體均數(shù)的比較第六節(jié)完全隨機(jī)設(shè)計(jì)兩總體均數(shù)的比較第七節(jié)配對設(shè)計(jì)資料均數(shù)的比較第八節(jié)均數(shù)假設(shè)檢驗(yàn)的注意事項(xiàng)73第一節(jié)標(biāo)準(zhǔn)誤(Standarderror)一、概念抽樣誤差:由于抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異。標(biāo)準(zhǔn)誤:(
xSx)
表示抽樣誤差大小的指標(biāo);樣本均數(shù)的標(biāo)準(zhǔn)差。SPSS結(jié)果中用std.errorofmean表示
X1S1X2S2
XISiXnSnxσμσ標(biāo)準(zhǔn)誤示意圖X服從什么分布?75X76X77三、(均數(shù))標(biāo)準(zhǔn)誤意義:反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。與樣本量的關(guān)系:S一定,n↑,標(biāo)準(zhǔn)誤↓二、(均數(shù))標(biāo)準(zhǔn)誤的計(jì)算78SPSS計(jì)算標(biāo)準(zhǔn)誤Analyze----DescriptiveStatistics----Frequencies----Statistics----Dispersion---S.E.mean---Continue----OK79第二節(jié)
t
分布哥塞特(W.S.Gosset,1876~1937)1908年,哥塞特首次以“學(xué)生”(Student)為筆名,在《生物計(jì)量學(xué)》雜志上發(fā)表了“平均數(shù)的概率誤差”。由于這篇文章提供了“學(xué)生t檢驗(yàn)”的基礎(chǔ),為此,許多統(tǒng)計(jì)學(xué)家把1908年看作是統(tǒng)計(jì)推斷理論發(fā)展史上的里程碑。
80戈塞特:t分布與小樣本由于“有些實(shí)驗(yàn)不能多次地進(jìn)行”,從而“必須根據(jù)少數(shù)的事例(小樣本)來判斷實(shí)驗(yàn)結(jié)果的正確性”小樣本思想81一、t
分布的概念:小樣本的概率分布
與正態(tài)分布比較,反應(yīng)抽樣誤差分布的規(guī)律。(規(guī)律來源的公式解釋):二、t
分布圖形:三、t
分布面積特征(t界值表):82t
分布的圖形(u分布是t
分布的特殊形式)83t
值表(附表2)左側(cè)列:自由度,υ
上兩行:概率,p,即曲線下陰影部分的面積;
表中的數(shù)字:相應(yīng)的|t|界值。t
值表規(guī)律:(1)自由度(υ)一定時,p與t
成反比;(2)概率(p)一定時,υ與t
成反比;85t分布類似于標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)曲線的方差為1,而在小樣本時可以證明t是大于1的,而當(dāng)n無限大時,t趨向于1。對于小的n值,t分布比標(biāo)準(zhǔn)正態(tài)分布要分散些,t依賴于兩個隨機(jī)變量:當(dāng)n無限增大時t的變異減少,事實(shí)上存在著整個一族的t分布。每一個樣本容量n對應(yīng)該分布族的一個成員。當(dāng)n增大時,t分布就接近于正態(tài)分布,當(dāng)n增至30以上時,t分布和正態(tài)分布幾乎沒有什么區(qū)別。86第三節(jié)總體均數(shù)的估計(jì)統(tǒng)計(jì)推斷的任務(wù)就是用樣本信息推論總體特征。參數(shù)估計(jì),用樣本均數(shù)估計(jì)總體均數(shù)。
1、點(diǎn)(值)估計(jì)(近似值)2、區(qū)間估計(jì)(近似范圍)871、點(diǎn)(值)估計(jì)(pointestimation):用樣本均數(shù)直接作為總體均數(shù)的估計(jì)值,未考慮抽樣誤差。882、區(qū)間估計(jì)(intervalestimation)▲概念:根據(jù)樣本均數(shù),按一定的可信度計(jì)算出總體均數(shù)很可能在的一個數(shù)值范圍,這個范圍稱為總體均數(shù)的可信區(qū)間(confidenceinterval,CI)。誰的區(qū)間?▲方法(但是在SPSS下程序相同)(1)u分布法(2)t分布法89(1)u分布法公式應(yīng)用條件:例題意義:與正常值范圍進(jìn)行比較(x
u
·sx,x
u
·sx)即(x±u
·sx)樣本量較大,已知或可計(jì)算出x及Sx90SPSS求可信區(qū)間Analyze----DescriptiveStatistics----Explore----身高-Statistics----Descriptives---Continue----OK91可信區(qū)間92正常值范圍
換句話說,做出校全體女大學(xué)生身高均數(shù)為163.0--164.5cm的結(jié)論,說對的概率是95%,說錯的概率是5%;做出校全體女大學(xué)生身高均數(shù)為162.7–164.7cm的結(jié)論,說對的概率是99%,說錯的概率是1%。(可信區(qū)間)意義: 雖然不能知道某校全體女大學(xué)生身高均數(shù)的確切數(shù)值,全體女大學(xué)生身高均數(shù)在163.0--164.5cm之間的可能性是95%,在162.7–164.7cm之間的可能性是99%。94(2)t分布法公式(x
t
·sx,x
t
·sx)即(x±t
·sx)95區(qū)間估計(jì)的準(zhǔn)確度:說對的可能性大小,用(1-)來衡量。99%的可信區(qū)間好于95%的可信區(qū)間(n,S一定時)。
區(qū)間估計(jì)的精確度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。99%的可信區(qū)間差于95%的可信區(qū)間(n,S一定時)
。
準(zhǔn)確度與精確度的關(guān)系:(例如預(yù)測孩子的身高)96正常值范圍概念:絕大多數(shù)正常人的某指標(biāo)范圍。(95%,99%,指絕大多數(shù)正常人)計(jì)算公式:SPSS程序:百分位數(shù)法用途:判斷觀察對象的某項(xiàng)指標(biāo)是否正常.可信區(qū)間概念:總體均數(shù)所在的數(shù)值范圍(95%,99%指可信度)計(jì)算公式:SPSS程序:用途:估計(jì)總體均數(shù)正常值范圍估計(jì)與可信區(qū)間估計(jì)97第四節(jié)假設(shè)檢驗(yàn)▲也叫顯著性檢驗(yàn);▲科研數(shù)據(jù)處理的重要工具;▲某事發(fā)生了:是由于碰巧?還是由于必然的原因?統(tǒng)計(jì)學(xué)家運(yùn)用顯著性檢驗(yàn)來處理這類問題。假設(shè)檢驗(yàn):1、原因2、目的3、原理4、過程(步驟)5、結(jié)果991、假設(shè)檢驗(yàn)的原因
從兩個總體中進(jìn)行隨機(jī)抽樣,得到兩個樣本均數(shù)X1、X2。
X1、X2不同。不同的原因是什么?
X1、X2不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性。(2)分別所代表的總體均數(shù)不同。差別有顯著性。以兩種改善骨質(zhì)疏松的藥為例2、假設(shè)檢驗(yàn)的目的判斷是由于何種原因造成的不同,以做出決策。反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實(shí)A,這時否定另一種可能B,則間接的肯定了A。概率論(小概率):如果一件事情發(fā)生的概率很小,那么在進(jìn)行一次試驗(yàn)時,我們說這個事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時候,因?yàn)楦怕试傩∫彩怯锌赡馨l(fā)生的。3、假設(shè)檢驗(yàn)的原理/思想1024、假設(shè)檢驗(yàn)的一般步驟▲建立假設(shè):▲確定顯著性水平(
):▲計(jì)算統(tǒng)計(jì)量:u,t,
2▲確定概率值:▲做出推論103為了比較國產(chǎn)藥和進(jìn)口藥對治療更年期婦女骨質(zhì)疏松效果是否相同,采取隨機(jī)雙盲的臨床試驗(yàn)方法。國產(chǎn)藥組20例,進(jìn)口藥組19例,評價指標(biāo)為第2-4腰椎骨密度的改變值(骨密度.sav)。1 -5.001 64.001 63.001 77.001 74.001 25.001 38.001 68.001 45.001 29.001 9.001 77.001 -2.001 89.001 77.001 63.001 70.001 36.001 82.001 -14.002 -17.002 48.002 47.002 60.002 58.002 11.002 23.002 52.002 30.002 15.002 -4.00如何建立數(shù)據(jù)庫?(1).建立假設(shè)檢驗(yàn)假設(shè)或者稱無效假設(shè)(nullhypothesis),用H0表示,(反證法)
H0是假設(shè)兩總體均數(shù)相等:
1
2
。備擇假設(shè)(alternativehypothesis),用H1表示。H1是與H0相反的假設(shè),假設(shè)兩總體均數(shù)不相等:
1
2
。(2)確定顯著性水平(概率論思想)(significancelevelα)顯著性水平(
)就是我們用來區(qū)分大概率事件和小概率事件的標(biāo)準(zhǔn),是人為規(guī)定的。當(dāng)某事件發(fā)生的概率小于
時,則認(rèn)為該事件為小概率事件,是不太可能發(fā)生的事件。通常
取0.05或0.01。游戲規(guī)則(3)計(jì)算統(tǒng)計(jì)量根據(jù)資料類型與分析目的選擇適當(dāng)?shù)墓接?jì)算出統(tǒng)計(jì)量,比如計(jì)算出u值或t值。(出現(xiàn)大t或小t的解釋
)注意:在檢驗(yàn)假設(shè)(H0
)成立的情況下,才會出現(xiàn)的分布類型或公式。107▲計(jì)算公式及意義:
t統(tǒng)計(jì)量:t=自由度=n1+n2–2=H0成立時,該公式成立!成立則意味著:
1
2
108Analyze----CompareMeans----IndependentSamplesTtest----testVariable----Grouping---DefineGroups-1,2----Continue----OK109110t統(tǒng)計(jì)量:
t=1.238;自由度:20+19–2=37表中:t0.05(37)=2.026(4)確定概率值(P,在spss程序上用Sig.表示)
將計(jì)算得到的t值與查表得到t
,ν,比較,得到P值的大小。根據(jù)t分布我們知道,如果|t|>u
,則P<
;如果|t|<u
,則P>
。本例中:t<t0.05(37),p>0.05;(5)作出結(jié)論
p>
,H0:
1
2時,得到大于現(xiàn)有統(tǒng)計(jì)量t值的可能性p大于
,不屬于小概率事件,則不拒絕H0,差別無統(tǒng)計(jì)學(xué)意義,結(jié)論:認(rèn)為兩組藥療效相同。可以用國產(chǎn)藥代替進(jìn)口藥。
如果p<
,說明在H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計(jì)量的可能性p小于
,可判斷為小概率事件,則拒絕H0,接受H1,差別有統(tǒng)計(jì)意義,結(jié)論是兩總體均數(shù)不相等。5、假設(shè)檢驗(yàn)的結(jié)果拒絕檢驗(yàn)假設(shè)(H0
):一類錯誤接受檢驗(yàn)假設(shè)(H0
):二類錯誤正確理解結(jié)論的概率性(都隱含著犯錯誤的可能性)。試取不同的結(jié)果,兩類錯誤114臨床上常見的設(shè)計(jì)類型完全隨機(jī)設(shè)計(jì)(Completelyrandomdesign)配對設(shè)計(jì)(Paireddesign):一個因素,兩組配伍組設(shè)計(jì)(Randomizedblockdesign):一個因素,三組及以上拉丁方設(shè)計(jì)(Latinsquaredesign):三個因素,三組及以上正交設(shè)計(jì)(Orthogonaldesign):三個或以上因素,交互作用115第五節(jié)未知總體與已知
總體均數(shù)的比較一、大樣本一般女性平均身高160.1cm。某大學(xué)隨機(jī)抽取100名女大學(xué)生,測量其身高,身高的均數(shù)是163.74cm,標(biāo)準(zhǔn)差是3.80cm。請問某大學(xué)18歲女大學(xué)生身高是否與一般女性不同。116▲目的:比較樣本均數(shù)所代表的未知總體均數(shù)與已知的總體均數(shù)有無差別▲計(jì)算公式:u統(tǒng)計(jì)量
117▲適用條件(對指公式而言):(1)已知一個總體均數(shù);(2)可得到一個樣本均數(shù);(3)可得到該樣本標(biāo)準(zhǔn)誤;(4)樣本量不小于100。例題:(1)一個總體均數(shù):160.1cm;(2)一個樣本均數(shù):163.74cm;(3)可計(jì)算出樣本標(biāo)準(zhǔn)誤:3.8/100=0.38(4)n=100;119假設(shè)檢驗(yàn):▲建立假設(shè):檢驗(yàn)假設(shè):某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)相同;H0:μ=μ0;
備擇假設(shè)
:某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同;H1:μ≠μ0▲確定顯著性水平(
):0.05120▲做出推論:U=9.58>
1.96,p
<0.05
=
,小概率事件發(fā)生了,原假設(shè)不成立;拒絕H0,接受H1,可認(rèn)為:某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)不同;某校女大學(xué)生身高均數(shù)與一般女子身高均數(shù)差別有顯著性?!?jì)算統(tǒng)計(jì)量:u統(tǒng)計(jì)量:
u=▲確定概率值:
|u|=9.58u
=1.96u<u
p<
=0.05;121Analyze----CompareMeans----OneSampleTtest----testVariable----Option---ConfidenceInterval----Continue----OK(u與t檢驗(yàn)程序相同)122均數(shù)之差及標(biāo)準(zhǔn)誤(公式中的分子和分母)二、小樣本已知中學(xué)一般男生的心率平均為74次/分鐘。為了研究常參加體育鍛煉的中學(xué)生心臟功能是否與一般的中學(xué)生相同,在某地區(qū)中學(xué)生中隨機(jī)抽取常年參加體育鍛煉的男生16名,測量他們的心率,結(jié)果見數(shù)據(jù)“男生心率.SAV”。124
55.0072.0058.0057.0070.0075.0072.0069.0061.0067.0069.0073.0059.0071.0053.0069.00如何建立數(shù)據(jù)庫?125▲目的:比較一個小樣本均數(shù)所代表的未知總體均數(shù)與已知的總體均數(shù)有無差別?!?jì)算公式:
t統(tǒng)計(jì)量:t=
自由度:
=n-1126假設(shè)檢驗(yàn):▲建立假設(shè):檢驗(yàn)假設(shè):常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生相等;H0:μ=μ0;
備擇假設(shè)
:常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生不同;H1:μ≠μ0
▲確定顯著性水平(
):0.05127▲計(jì)算統(tǒng)計(jì)量:
t=:
t=4.65▲確定概率值:n=16,自由度=n–1=15,t0.05(15)=2.131t>t0.05(25),p<0.05▲做出推論:
p
<0.05
<
,小概率事件發(fā)生了,原假設(shè)不成立;拒絕H0,接受H1,可認(rèn)為:常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生不同;常參加體育鍛煉的中學(xué)男生的心率比一般中學(xué)生心率慢;常參加體育鍛煉的中學(xué)男生的心率與一般中學(xué)生差別有顯著性。128SPSS進(jìn)行單一樣本的假設(shè)檢驗(yàn)Analyze----CompareMeans----OneSampleTtest----testVariable----Option---ConfidenceInterval----Continue----OK(u與t檢驗(yàn)程序相同)129130第六節(jié)完全隨機(jī)設(shè)計(jì)
兩總體均數(shù)的比較例題:為了比較國產(chǎn)藥和進(jìn)口藥對治療更年期婦女骨質(zhì)疏松效果是否相同,采取隨機(jī)雙盲的臨床試驗(yàn)方法。國產(chǎn)藥組20例,進(jìn)口藥組19例,評價指標(biāo)為第2-4腰椎骨密度的改變值(骨密度.sav)。1311 -5.001 64.001 63.001 77.001 74.001 25.001 38.001 68.001 45.001 29.001 9.001 77.001 -2.001 89.001 77.001 63.001 70.001 36.001 82.001 -14.002 -17.002 48.002 47.002 60.002 58.002 11.002 23.002 52.002 30.002 15.002 -4.00132▲目的:由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。
▲計(jì)算公式及意義:
t統(tǒng)計(jì)量:t=自由度=n1+n2–2133例題:已知:一個樣本:均數(shù)48.25,標(biāo)準(zhǔn)差32.0;
另一個樣本:均數(shù)36.37,標(biāo)準(zhǔn)差27.65;(2)n1=20;n2=19134假設(shè)檢驗(yàn):▲建立假設(shè):檢驗(yàn)假設(shè):兩組藥療效相同;備擇假設(shè)
:兩組藥療效不同;▲確定顯著性水平(
):0.05135▲計(jì)算統(tǒng)計(jì)量:t統(tǒng)計(jì)量:
t=1.238;自由度:20+19–2=37表中:t0.05(37)=2.026▲確定概率值:t<t0.05(37),p>0.05;▲做出推論:因?yàn)?/p>
p>0.05
>
,不能拒絕H0:認(rèn)為兩組藥療效相同。可以用國產(chǎn)藥代替進(jìn)口藥。136SPSS進(jìn)行兩個樣本的假設(shè)檢驗(yàn)Analyze----CompareMeans----IndependentSamplesTtest----testVariable----Grouping---DefineGroups-1,2----Continue----OK137第七節(jié)配對設(shè)計(jì)資料均數(shù)的比較
(paireddesign)什么是配對設(shè)計(jì)資料?
將可能影響指標(biāo)的一些特征相同或近似的兩個個體配成一對,然后按照隨機(jī)化方法將每個對子內(nèi)的兩個個體用不同的兩種方法進(jìn)行處理。對處理的結(jié)果進(jìn)行分析。有哪幾種形式?138
1.比較目的:通過對兩組配對資料的比較,判斷不同的處理效果是否有差別,或某種治療方法是否起作用。
2.公式:t==
自由度:ν=對子數(shù)-1
3.適用條件:
①.將人或動物進(jìn)行配對,配好的每對個體分別隨機(jī)地分到
兩個不同的處理組中去,接受不同處理。
②.觀察同一批病人在治療前后的變化,治療前的數(shù)值和治
療后的數(shù)值也是配對資料。
③.同一批病人或動物用不同的方法處理。
139例題:為考察一種新型透析療法的效果,隨機(jī)抽取了10名病人測量透析前后的血中尿素氮含量如下表,請根據(jù)本實(shí)驗(yàn)資料對此療法進(jìn)行評價。(數(shù)據(jù)見touxi.sav)
病人序號透析前透析后131.618.2220.77.3336.426.5433.123.7529.522.6620.710.7750.325.1831.220.9936.623.71028.116.5140①.H0:μd=0H1:μd≠0②.確定顯著性水平
=0.05③.計(jì)算統(tǒng)計(jì)量:t=7.826④.確定概率:ν=10-1=9。查表t0.05(9)=2.262t=7.826>t0.05(9)
p<0.05⑤.判斷結(jié)果:因?yàn)閜<0.05,故拒絕檢驗(yàn)假設(shè)H0,10名病人透析前后血中尿素氮含量差異有顯著性,即透析可以降低血中尿素氮含量。141SPSS進(jìn)行配對樣本的假設(shè)檢驗(yàn)
Analyze----CompareMeans----PairedSamplesTtest----PairedVariable----OK142143第八節(jié)均數(shù)假設(shè)檢驗(yàn)的注意事項(xiàng)1441、正確理解假設(shè)檢驗(yàn)的結(jié)論(概率性)假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率推斷的,所以不是絕對正確的:當(dāng)p<,拒絕H0,接受H1,按接受H1下結(jié)論,可能犯錯誤,可能拒絕了實(shí)際上成立的H0,稱為?
類錯誤(“棄真”的錯誤),其概率大小用α
表示。(棄真是指兩總體均數(shù)相等的真情)145(2)當(dāng)p>,不能拒絕H0,不能接受H1,按不能接受H1下結(jié)論,也可能犯錯誤,沒有拒絕實(shí)際上不成立的H0,這類稱為II類錯誤(“存?zhèn)巍钡腻e誤),其概率大小用β
表示,β值一般不能確切的知道(存?zhèn)危侵竷煽傮w均數(shù)不相等)。146
II類錯誤的概率β
值的兩個規(guī)律:1.當(dāng)樣本量一定時,α
愈小,則
β
愈大,反之…;2.當(dāng)α
一定時,樣本量增加,β
減少.(什么時候犯I類錯誤,什么時候犯II類錯誤?)常用的設(shè)計(jì)類型及分析方法一組樣本與總體的比較兩組樣本的比較(成組設(shè)計(jì))兩組樣本的比較(配對設(shè)計(jì))單因素多組樣本的比較(成組設(shè)計(jì))雙因素多組樣本的比較(配伍組設(shè)計(jì))三因素三組及以上設(shè)計(jì)(拉丁方設(shè)計(jì))三個或以上因素并交互作用(正交設(shè)計(jì))20名要求持續(xù)鎮(zhèn)痛的病人被隨機(jī)分到四組,接受同劑量的嗎啡,6小時后測量血中游離嗎啡水平,問四組之間有無差別?靜脈點(diǎn)滴肌肉注射皮下注射口服12129121016787156881011109167914均數(shù)1013.889.4屬于上述哪個類型?方差分析149分析四種給藥方式之間的嗎啡水平是否有顯著差異,也就是要判斷“給藥方式”對“嗎啡水平”是否有顯著影響。作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個給藥方式的嗎啡水平的均值是否相等。若它們的均值相等,則意味著給藥方式對嗎啡水平?jīng)]有影響的,即它們之間的鎮(zhèn)痛效果沒有顯著差異;若均值不全相等,則意味著給藥方式對鎮(zhèn)痛效果是有影響的,它們之間有顯著差異。本章主要內(nèi)容第一節(jié)方差分析的基本概念第二節(jié)成組設(shè)計(jì)的多個樣本均數(shù)比較第三節(jié)配伍組設(shè)計(jì)的多個樣本均數(shù)的比較第四節(jié)多個樣本均數(shù)間的兩兩比較方差分析151一、有關(guān)方差分析的幾個符號什么是方差?離均差離均差平方和SS方差(2S2
),也叫均方(MS)標(biāo)準(zhǔn)差:S自由度:
關(guān)系:MS=SS/
二、方差分析的基本思想根據(jù)資料的設(shè)計(jì)類型,即變異的不同來源,將全部觀察值總的離均差平方和及自由度分解為兩個或多個部分,除隨機(jī)誤差外,其余每個部分的變異可由某個因素的作用加以解釋。通過比較不同來源變異的均方(MS),借助F分布做出統(tǒng)計(jì)推斷,從而了解該因素對觀察指標(biāo)有無影響。方差分析153三、統(tǒng)計(jì)量F
F=MS組間/MS組內(nèi)自由度:
組間=組數(shù)-1
組內(nèi)=N-組數(shù)
通過這個公式計(jì)算出統(tǒng)計(jì)量F,查表求出對應(yīng)的P值,與進(jìn)行比較,以確定是否為小概率事件。(與t檢驗(yàn)公式進(jìn)行對比,F(xiàn)
值不同,結(jié)果有何不同)
第二節(jié)成組設(shè)計(jì)的多個樣本均數(shù)比較
(單因素方差分析)21名要求持續(xù)鎮(zhèn)痛的病人被隨機(jī)分到四組,接受同劑量的嗎啡,6小時后測量血中游離嗎啡水平,問四組之間有無差別?靜脈點(diǎn)滴肌肉注射皮下注射口服12129121016787156881011109167914均數(shù)1013.889.4屬于以上哪個類型?如何建立數(shù)據(jù)庫列舉存在的變異及意義1、全部的21個數(shù)據(jù)之間大小不等,與總體均數(shù)也不同,這種變異稱為總變異。2、四個組均數(shù)不等,與總體均數(shù)也不相同,存在變異:反映不同給藥方式的效果和隨機(jī)誤差。3、四個組內(nèi)個體間數(shù)據(jù)不同,與所在組的均數(shù)也不相同:反映了觀察值的隨機(jī)誤差。各種變異的表示方法各種變異的表示方法SS總
總MS總SS組內(nèi)
組內(nèi)MS組內(nèi)SS組間
組間MS組間三者之間的關(guān)系:SS總=SS組內(nèi)+SS組間
總=
組內(nèi)+組間
統(tǒng)計(jì)量F的計(jì)算及其意義
F=MS組間/MS組內(nèi)自由度:
組間=組數(shù)-1
組內(nèi)=N-組數(shù)
通過這個公式計(jì)算出統(tǒng)計(jì)量F,查表求出對應(yīng)的P值,與進(jìn)行比較,以確定是否為小概率事件。SPSS計(jì)算ANALYZE-CompareMeans-One-wayANOVA-Dependentlist(??)-Factor(??)-OKSPSS計(jì)算結(jié)果
完整書寫方差檢驗(yàn)的過程
建立假設(shè):
H0
:4種給藥方式的嗎啡水平的總體均數(shù)相等
1=2=
3=
4H1
:4種給藥方式的嗎啡水平的總體均數(shù)不全相等
H1與H0相反,如果H0被否決,則H1成立。
確定顯著性水平,用表示。區(qū)分大小概率事件的標(biāo)準(zhǔn),常取0.05。
計(jì)算統(tǒng)計(jì)量F:根據(jù)資料的性質(zhì)選擇不同的統(tǒng)計(jì)方法。注意都是在H0成立的條件下進(jìn)行計(jì)算。
計(jì)算概率值P:P的含義。
做出推論:統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論。方差分析164應(yīng)用條件(理論上講)
各樣本是相互獨(dú)立的隨機(jī)樣本
各樣本來自正態(tài)分布
各樣本方差相等,即方差齊。例題某社區(qū)隨機(jī)抽取糖尿病患者、IGT異常和正常人共30人進(jìn)行載蛋白測定,結(jié)果如下,問3種人的載蛋白有無差別?(單因素-??,觀察值-??)問題:1、分析問題,選擇合適的統(tǒng)計(jì)方法
2、如何整理資料、輸入計(jì)算機(jī)方差分析1661 85.71 105.21 109.51 96.01 115.21 95.31 110.01 100.01 125.61 111.01 106.52 96.02 124.52 105.12 76.42 95.32 110.02 95.22 99.02 120.03 144.03 117.03 110.03 109.03 103.03 123.03 127.03 121.03 159.03 115.0如何建立數(shù)據(jù)庫?方差分析167SPSS計(jì)算ANALYZE-CompareMeans-One-wayANOVA-Dependentlist(??)-Factor(??)-OK方差分析168第三節(jié)配伍組設(shè)計(jì)的多個樣本均數(shù)的比較
(雙因素方差分析)
應(yīng)用分層的思想,事先將全部受試對象按某種或某些特性分為若干個區(qū)組,使每個區(qū)組內(nèi)的觀察對象與研究對象的水平盡可能相近,減少/分析個體間差異對研究結(jié)果的影響,比成組設(shè)計(jì)更容易檢驗(yàn)出處理因素間的差別,提高了研究效率。是配對(兩個組)資料的擴(kuò)充(兩個以上組)。方差分析170例題對小白鼠喂以A、B、C三種不同的營養(yǎng)素了解不同營養(yǎng)素的增重效果。24只小白鼠分為3組,每組8只,3周后測量體重。問3種不同營養(yǎng)素喂養(yǎng)后所增體重有無差別?方差分析171對小白鼠喂以A、B、C三種不同的營養(yǎng)素了解不同營養(yǎng)素的增重效果。有同系同體重的24只小白鼠,來自8個區(qū)組(窩),每窩3只。以窩別作為區(qū)組特征(消除遺傳因素對體重增長的影響)分為3組,每組8只。3周后測量體重。問3種不同營養(yǎng)素喂養(yǎng)后所增體重有無差別?
1.00 1.00 50.101.00 2.00 58.201.00 3.00 64.502.00 1.00 47.802.00 2.00 48.502.00 3.00 62.403.00 1.00 53.103.00 2.00 53.803.00 3.00 58.604.00 1.00 63.504.00 2.00 64.204.00 3.00 72.505.00 1.00 71.205.00 2.00 68.405.00 3.00 79.306.00 1.00 41.406.00 2.00 45.706.00 3.00 38.407.00 1.00 61.607.00 2.00 53.007.00 3.00 51.208.00 1.00 42.208.00 2.00 39.808.00 3.00 46.20有幾個因素?觀察值是什么?按單因素方差分析如何處理?方差分析173方差分析174分析變異總變異:組間變異(因素一的變異):誤差(組內(nèi))變異(隨機(jī)誤差):配伍間變異(因素二的變異):SS總
總SS組內(nèi)
組內(nèi)MS組內(nèi)SS組間
組間MS組間變異之間的關(guān)系:SS總=SS組內(nèi)+SS組間+SS配伍間
總=
組內(nèi)+組間+
配伍間變異間的關(guān)系SS配伍間
配伍間MS配伍間方差分析176統(tǒng)計(jì)量F的計(jì)算
F1=MS組間/MS組內(nèi)
F2=MS區(qū)間/MS組內(nèi)自由度:
組間=組數(shù)-1=3-1=2
區(qū)間=區(qū)數(shù)-1=8-1=7
組內(nèi)=(組數(shù)-1)(區(qū)數(shù)-1)=14都是和隨機(jī)誤差進(jìn)行比較。
SPSS計(jì)算過程ANALYZE-----GeneralLinerModel---Univariate體重進(jìn)入Dependent(因變量)窩別和營養(yǎng)素進(jìn)入FixedFactors(自變量)Model---Custom—BuildingTerms—Maineffect—Factors&Covariates(將窩別和營養(yǎng)素選入)
完整書寫方差分析的過程
建立假設(shè):
H0
:3種營養(yǎng)素喂養(yǎng)的小白鼠體重增量相等
1=2=
3H1
:3種營養(yǎng)素喂養(yǎng)的小白鼠體重增量不全相等
確定顯著性水平,用表示。區(qū)分大小概率事件的標(biāo)準(zhǔn),常取0.05。
計(jì)算統(tǒng)計(jì)量F:
F=MS組間/MS組內(nèi)
計(jì)算概率值P:P的含義。
做出推論:統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論。完整書寫方差分析的過程
建立假設(shè):
H0
:8窩小白鼠體重增量相等
1=2=
3….H1
:8窩小白鼠體重增量不全相等
確定顯著性水平,用表示。區(qū)分大小概率事件的標(biāo)準(zhǔn),常取0.05。
計(jì)算統(tǒng)計(jì)量F:
F2=MS區(qū)間/MS組內(nèi)
計(jì)算概率值P:P的含義。
做出推論:統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論。存在問題方差分析結(jié)果提供了各組均數(shù)間差別的總的信息,但尚未提供各組間差別的具體信息,即尚未指出哪幾個組均數(shù)間的差別具有或不具有統(tǒng)計(jì)學(xué)意義。為了得到這方面的信息,可進(jìn)行多個樣本間的兩兩比較。方差分析1833組不同的人載蛋白不同,到底是3組間都不同,還是只有2組間不同?第四節(jié)多個樣本均數(shù)間的兩兩比較能否用t檢驗(yàn)或μ檢驗(yàn)?每次不犯第一類錯誤的概率0.95,10次都不犯的概率不是0.95,而是:??
每次不犯一類錯誤的概率遠(yuǎn)大于0.05,不是小概率事件,會把本來無差別的兩個總體均數(shù)判斷為有差別。方差分析185兩種常用的檢驗(yàn)方法
最小有意義t(LSD-t)檢驗(yàn):檢驗(yàn)K組中某一對或幾對在專業(yè)上有特殊意義的均數(shù)(DAB=XA-XB)的總體水平是否為0。
Q檢驗(yàn):
也叫Student-Newman-Keuls(SNK-Q)檢驗(yàn)。SPSS計(jì)算過程ANALYZE-----CompareMeans---One-wayANOVA(載脂蛋白)各組均數(shù)間多重比較:PostHocMultipleComparisons—S-N-KorLSD方差分析187方差分析188方差分析189均數(shù)假設(shè)檢驗(yàn)的注意事項(xiàng)方差分析1901、正確理解假設(shè)檢驗(yàn)的結(jié)論(概率性)假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率推斷的,所以不是絕對正確的:當(dāng)p<,拒絕H0,接受H1,按接受H1下結(jié)論,可能犯錯誤,可能拒絕了實(shí)際上成立的H0
,稱為?
類錯誤(“棄真”的錯誤),其概率大小用α
表示。(棄真是指兩總體均數(shù)相等的真情)方差分析191(2)當(dāng)p>,不能拒絕H0,不能接受H1,按不能接受H1下結(jié)論,也可能犯錯誤,沒有拒絕實(shí)際上不成立的H0,這類稱為II類錯誤(“存?zhèn)巍钡腻e誤),其概率大小用β
表示,β值一般不能確切的知道(存?zhèn)危侵竷煽傮w均數(shù)不相等)。方差分析192
II類錯誤的概率β
值的兩個規(guī)律:1.當(dāng)樣本量一定時,α
愈小,則
β
愈大,反之…;2.當(dāng)α
一定時,樣本量增加,β
減少.(什么時候犯I類錯誤,什么時候犯II類錯誤?)
醫(yī)學(xué)上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。關(guān)系:可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;但是,有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說有因果關(guān)系。相關(guān)與偏相關(guān)194
相關(guān)就是用于研究和解釋兩個變量之間相互關(guān)系的。相關(guān)與偏相關(guān)195主要內(nèi)容第一節(jié)直線相關(guān)一、相關(guān)的類型二、相關(guān)系數(shù)三、相關(guān)系數(shù)的假設(shè)檢驗(yàn)四、直線相關(guān)的應(yīng)用第二節(jié)偏相關(guān)一、概念二、偏相關(guān)系數(shù)三、SPSS計(jì)算程序第一節(jié)直線相關(guān)LinearCorrelation為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標(biāo)上,如圖。它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個橢圓。一、相關(guān)的類型★正相關(guān)★負(fù)相關(guān)★完全正相關(guān)★完全負(fù)相關(guān)★零相關(guān)
二、相關(guān)系數(shù)
◆樣本的相關(guān)系數(shù)用r(correlationcoefficient)
◆相關(guān)系數(shù)r的值在-1和1之間。正相關(guān)時,r值在0和1之間,這時一個變量增加,另一個變量也增加;負(fù)相關(guān)時,r值在-1和0之間,此時一個變量增加,另一個變量將減少。
◆r的絕對值越接近1,兩變量的關(guān)聯(lián)程度越強(qiáng),r的絕對值越接近0,兩變量的關(guān)聯(lián)程度越弱。一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測產(chǎn)兒體重,以便對低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時的尿,測量其中的雌三醇含量,同時記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間相關(guān)系數(shù)是多少?是正相關(guān)還是負(fù)相關(guān)?分析問題:目的、變量、關(guān)系
編號
(1)尿雌三醇mg/24h(2產(chǎn)兒體重kg(3)編號
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系
相關(guān)與偏相關(guān)202計(jì)算結(jié)果從計(jì)算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61。問題:我們能否得出結(jié)論:待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間成正相關(guān),相關(guān)系數(shù)是0.61?為什么?相關(guān)與偏相關(guān)204三、相關(guān)系數(shù)的假設(shè)檢驗(yàn)
上例中的相關(guān)系數(shù)r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。因?yàn)?,總體相關(guān)系數(shù)(
)為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。這就要對r進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實(shí)存在相關(guān)關(guān)系。
相關(guān)與偏相關(guān)205對相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用t檢驗(yàn),選用統(tǒng)計(jì)量t的計(jì)算公式如下:
=n-2
H0:
=0
H1:
≠0
=0.05r=0.61,n=31,代入公式
t=
=n-2=31-2=29
t=4.14查t值表,t0.05(29)=2.045,查t值表,t0.05(29)=2.045,上述計(jì)算t=4.14>2.045,由t所推斷的P值小于0.05,按
=0.05水準(zhǔn)拒絕,接受,認(rèn)為臨產(chǎn)婦24小時內(nèi)尿中雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。
相關(guān)與偏相關(guān)207選擇不同的方法計(jì)算相關(guān)系數(shù)
Pearson:雙變量正態(tài)分布資料,連續(xù)變量Kendall:資料不服從雙變量正態(tài)分布或
總體分布未知,等級資料。
Spearman:等級資料(非參檢驗(yàn))。SPSS計(jì)算1.做散點(diǎn)圖:標(biāo)題、標(biāo)目、散點(diǎn)GRAPHS-SCATTERT-SIMPLE-DEFIND雙擊TITLE加標(biāo)題、標(biāo)目2.相關(guān)分析:ANALYZE--CORRELATION–BIVARIATE-VARIABLES相關(guān)與偏相關(guān)209相關(guān)與偏相關(guān)210相關(guān)與偏相關(guān)211四、直線相關(guān)的應(yīng)用相關(guān)是研究兩個變量間的相互關(guān)系,這種相互關(guān)系用相關(guān)系數(shù)反應(yīng)。如果r的絕對值越大,說明兩個變量之間的關(guān)聯(lián)程度越強(qiáng)。那么,已知一個變量對預(yù)測另一個變量越有幫助;如果r絕對值越小,則說明兩個變量之間的關(guān)系越弱,一個變量的信息對猜測另一個變量的值無多大幫助。一般說來,當(dāng)樣本量較大(n>100),并對r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時,r的絕對值大于0.7,則表示兩個變量高度相關(guān);r的絕對值大于0.4,小于等于0.7時,則表示兩個變量之間中度相關(guān);r的絕對值大于0.2,小于等于0.4時,則兩個變量低度相關(guān)。
例題:已知某地29名13歲男童身高X1(cm)、體重X2(kg)和肺活量Y(ml),請計(jì)算身高與肺活量,體重與肺活量的相關(guān)關(guān)系。相關(guān)與偏相關(guān)213身高與肺活量的簡單相關(guān)系數(shù)1、身高與肺活量的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)2142、體重與肺活量的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)2153、身高與體重的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)216另外的例子:識字?jǐn)?shù),鞋大小游泳票與冰激凌銷售量排除其它變量的干擾第二節(jié)偏相關(guān)一、概念
當(dāng)有多個變量存在時,為了研究任何兩個變量之間的關(guān)系,而使與這兩個變量有聯(lián)系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計(jì)算兩個變量的相關(guān)性。二、偏相關(guān)系數(shù)
偏相關(guān)系數(shù)是用來衡量任何兩個變量之間的關(guān)系的大小。相關(guān)與偏相關(guān)219
Analyze-----Correlation-----Partial把分析變量選入Variable框把控制變量選入Controllingfor框點(diǎn)擊Options點(diǎn)擊Statistics:選擇
MeanandstandarddeviationZero-ordercorrelationContinueOK三、SPSS操作步驟相關(guān)與偏相關(guān)220VariableMeanStandardDevCasesX1(身高)152.57598.362229Y(肺活量)2206.89664
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消費(fèi)電子鋁型材及加工項(xiàng)目可行性研究報告
- 二零二五年度建筑勞務(wù)分包及項(xiàng)目管理服務(wù)協(xié)議3篇
- 運(yùn)動地板項(xiàng)目可行性研究報告申請備案
- 工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)園項(xiàng)目初步設(shè)計(jì)
- 中國公務(wù)機(jī)產(chǎn)業(yè)發(fā)展環(huán)境透析、市場全景評估及發(fā)展趨勢預(yù)測報告(智研咨詢)
- 智研咨詢發(fā)布:中國航運(yùn)行業(yè)市場現(xiàn)狀、發(fā)展概況、未來前景分析報告
- 鈦合金泵閥建設(shè)項(xiàng)目可行性研究報告申請立項(xiàng)備案
- 深圳某電子商務(wù)平臺項(xiàng)目可行性研究報告
- 智能控制設(shè)備生產(chǎn)基地項(xiàng)目申請可行性研究報告
- 安置房項(xiàng)目二次結(jié)構(gòu)磚砌體工程專項(xiàng)施工方案培訓(xùn)資料
- SB/T 10756-2012泡菜
- GB/T 20492-2006鋅-5%鋁-混合稀土合金鍍層鋼絲、鋼絞線
- 公司變更評審表
- 醫(yī)院輸血質(zhì)量管理考核標(biāo)準(zhǔn)
- 七年級語文上冊:15、《古代詩歌四首》教案
- 自由戰(zhàn)爭-簡體素材表
- 氣道評估與處理課件
- 腦血管病的介入診療課件
- 新概念第三冊課文60全(打印版)
- 四年級硬筆書法教案教學(xué)設(shè)計(jì)共16課
評論
0/150
提交評論