生物醫(yī)學研究的統(tǒng)計學方法-課后習題答案-2014-主編-方積乾_第1頁
生物醫(yī)學研究的統(tǒng)計學方法-課后習題答案-2014-主編-方積乾_第2頁
生物醫(yī)學研究的統(tǒng)計學方法-課后習題答案-2014-主編-方積乾_第3頁
生物醫(yī)學研究的統(tǒng)計學方法-課后習題答案-2014-主編-方積乾_第4頁
生物醫(yī)學研究的統(tǒng)計學方法-課后習題答案-2014-主編-方積乾_第5頁
已閱讀5頁,還剩100頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

./思考與練習參考答案第1章緒論一、選擇題1.研究中的基本單位是指<D>.A.樣本B.全部對象C.影響因素D.個體E.總體2.從總體中抽取樣本的目的是〔B.A.研究樣本統(tǒng)計量B.由樣本統(tǒng)計量推斷總體參數(shù)C.研究典型案例D.研究總體統(tǒng)計量E.計算統(tǒng)計指標3.參數(shù)是指〔B.A.參與個體數(shù)B.描述總體特征的統(tǒng)計指標C.描述樣本特征的統(tǒng)計指標D.樣本的總和E.參與變量數(shù)4.下列資料屬名義變量的是〔E.A.白細胞計數(shù)B.住院天數(shù)C.門急診就診人數(shù)D.患者的病情分級E.ABO血型5.關于隨機誤差下列不正確的是〔C.A.受測量精密度限制B.無方向性C.也稱為偏倚D.不可避免E.增加樣本含量可降低其大小二、名稱解釋〔答案略1.變量與隨機變量2.同質(zhì)與變異3.總體與樣本4.參數(shù)與統(tǒng)計量5.誤差6.隨機事件7.頻率與概率三、思考題1.生物統(tǒng)計學與其他統(tǒng)計學有什么區(qū)別和聯(lián)系?答:統(tǒng)計學可細分為數(shù)理統(tǒng)計學、經(jīng)濟統(tǒng)計學、生物統(tǒng)計學、衛(wèi)生統(tǒng)計學、醫(yī)學統(tǒng)計學等,都是關于數(shù)據(jù)的學問,是從數(shù)據(jù)中提取信息、知識的一門科學與藝術.而生物統(tǒng)計學是統(tǒng)計學原理與方法應用于生物學、醫(yī)學的一門科學,與醫(yī)學統(tǒng)計學和衛(wèi)生統(tǒng)計學很相似,其不同之處在于醫(yī)學統(tǒng)計學側重于介紹醫(yī)學研究中的統(tǒng)計學原理與方法,而衛(wèi)生統(tǒng)計學更側重于介紹社會、人群健康研究中的統(tǒng)計學原理與方法.2.某年級甲班、乙班各有男生50人.從兩個班各抽取10人測量身高,并求其平均身高.如果甲班的平均身高大于乙班,能否推論甲班所有同學的平均身高大于乙班?為什么?答:不能.因為,從甲、乙兩班分別抽取的10人,測量其身高,得到的分別是甲、乙兩班的一個樣本.樣本的平均身高只是甲、乙兩班所有同學平均身高的一個點估計值.即使是按隨機化原則進行抽樣,由于存在抽樣誤差,樣本均數(shù)與總體均數(shù)一般很難恰好相等.因此,不能僅憑兩個樣本均數(shù)高低就作出兩總體均數(shù)熟高熟低的判斷,而應通過統(tǒng)計分析,進行統(tǒng)計推斷,才能作出判斷.3.某地區(qū)有10萬個7歲發(fā)育正常的男孩,為了研究這些7歲發(fā)育正常男孩的身高和體重,在該人群中隨機抽取200個7歲發(fā)育正常的男孩,測量他們的身高和體重,請回答下列問題.<1> 該研究中的總體是什么?答:某地區(qū)10萬個7歲發(fā)育正常的男孩.<2> 該研究中的身高總體均數(shù)的意義是什么?答:身高總體均數(shù)的意義是:10萬個7歲發(fā)育正常的男孩的平均身高.<3> 該研究中的體重總體均數(shù)的意義是什么?答:體重總體均數(shù)的意義是:10萬個7歲發(fā)育正常的男孩的平均體重<4>該研究中的總體均數(shù)與總體是什么關系?答:總體均數(shù)是反映總體的統(tǒng)計學特征的指標.〔5該研究中的樣本是什么?答:該研究中的樣本是:隨機抽取的200個7歲發(fā)育正常的男孩.〔宇傳華方積乾第2章統(tǒng)計描述思考與練習參考答案一、最佳選擇題1.編制頻數(shù)表時錯誤的作法是〔E.A.用最大值減去最小值求全距B.組距常取等組距,一般分為10~15組C.第一個組段須包括最小值D.最后一個組段須包括最大值E.寫組段,如"1.5~3,3~5,5~6.5,…"2.描述一組負偏峰分布資料的平均水平時,適宜的統(tǒng)計量是〔A.A.中位數(shù)B.幾何均數(shù)C.調(diào)和均數(shù)D.算術均數(shù)E.眾數(shù)3.比較5年級小學生瞳距和他們坐高的變異程度,宜采用〔A.A.變異系數(shù)B.全距C.標準差D.四分位數(shù)間距E.百分位數(shù)P2.5與P97.5的間距4.均數(shù)和標準差S的關系是〔A.A.S越小,對樣本中其他個體的代表性越好B.S越大,對樣本中其他個體的代表性越好C.越小,S越大D.越大,S越小E.必小于5.計算乙肝疫苗接種后血清抗-HBs的陽轉(zhuǎn)率,分母為〔B.A.陽轉(zhuǎn)人數(shù)B.疫苗接種人數(shù)C.乙肝患者數(shù)D.乙肝病毒攜帶者數(shù)E.易感人數(shù)6.某醫(yī)院的院內(nèi)感染率為5.2人/千人日,則這個相對數(shù)指標屬于〔C.A.頻率B.頻率分布C.強度D.相對比E.算術均數(shù)7.縱坐標可以不從0開始的圖形為〔D.A.直方圖B.單式條圖C.復式條圖D.箱式圖E.以上均不可二、簡答題1.對定量資料進行統(tǒng)計描述時,如何選擇適宜的指標?答:詳見教材表2-18.教材表2-18定量資料統(tǒng)計描述常用的統(tǒng)計指標及其適用場合描述內(nèi)容指標意義適用場合平均水平均數(shù)個體的平均值對稱分布幾何均數(shù)平均倍數(shù)取對數(shù)后對稱分布中位數(shù)位次居中的觀察值①非對稱分布;②半定量資料;③末端開口資料;④分布不明眾數(shù)頻數(shù)最多的觀察值不拘分布形式,概略分析調(diào)和均數(shù)基于倒數(shù)變換的平均值正偏峰分布資料變異度全距觀察值取值范圍不拘分布形式,概略分析標準差〔方差觀察值平均離開均數(shù)的程度對稱分布,特別是正態(tài)分布資料四分位數(shù)間距居中半數(shù)觀察值的全距①非對稱分布;②半定量資料;③末端開口資料;④分布不明變異系數(shù)標準差與均數(shù)的相對比①不同量綱的變量間比較;②量綱相同但數(shù)量級相差懸殊的變量間比較2.舉例說明頻率和頻率分布的區(qū)別和聯(lián)系.答:2005年某醫(yī)院為了調(diào)查肺癌患者接受姑息手術治療1年后的情況,被調(diào)查者150人,分別有30人病情穩(wěn)定,66人處于進展狀態(tài),54人死亡.當研究興趣只是了解死亡發(fā)生的情況,則只需計算死亡率54/150=36%,屬于頻率指標.當研究者關心患者所有可能的結局時,則可以算出反映3種結局的頻率分別為20%、44%、36%,它們共同構成所有可能結局的頻率分布,是若干陽性率的組合.兩者均為"陽性率",都是基于樣本信息對總體特征進行估計的指標.不同的是:頻率只是一種結局發(fā)生的頻率,計算公式的分子是某一具體結局的發(fā)生數(shù);頻率分布則由諸結局發(fā)生的頻率組合而成,計算公式的分子分別是各種可能結局的發(fā)生數(shù),而分母則與頻率的計算公式中分母相同,是樣本中被觀察的單位數(shù)之和.3.應用相對數(shù)時應注意哪些問題?答:〔1防止概念混淆相對數(shù)的計算是兩部分觀察結果的比值,根據(jù)這兩部分觀察結果的特點,就可以判斷所計算的相對數(shù)屬于前述何種指標.〔2計算相對數(shù)時分母不宜過小樣本量較小時以直接報告絕對數(shù)為宜.〔3觀察單位數(shù)不等的幾個相對數(shù),不能直接相加求其平均水平.〔4相對數(shù)間的比較須注意可比性,有時需分組討論或計算標準化率.4.常用統(tǒng)計圖有哪些?分別適用于什么分析目的?答:詳見教材表2-20.教材表2-20常用統(tǒng)計圖的適用資料及實施方法圖形適用資料實施方法條圖組間數(shù)量對比用直條高度表示數(shù)量大小直方圖定量資料的分布用直條的面積表示各組段的頻數(shù)或頻率百分條圖構成比用直條分段的長度表示全體中各部分的構成比餅圖構成比用圓餅的扇形面積表示全體中各部分的構成比線圖定量資料數(shù)值變動線條位于橫、縱坐標均為算術尺度的坐標系半對數(shù)線圖定量資料發(fā)展速度線條位于算術尺度為橫坐標和對數(shù)尺度為縱坐標的坐標系散點圖雙變量間的關聯(lián)點的密集程度和形成的趨勢,表示兩現(xiàn)象間的相關關系箱式圖定量資料取值范圍用箱體、線條標志四分位數(shù)間距及中位數(shù)、全距的位置莖葉圖定量資料的分布用莖表示組段的設置情形,葉片為個體值,葉長為頻數(shù)三、計算題1.某內(nèi)科醫(yī)生調(diào)查得到100名40~50歲健康男子總膽固醇〔mg/dl,結果如下227190224259225238180193214195213193209172244199155208203199253181196224210220255257216249235220190203197149175236202209174184174185167235167210171248201266189222199197214199198230246209202186217206200203197161247138186156195163273178190207259186194246172234232189172235207208231234226174199278277181〔1編制頻數(shù)表,繪制直方圖,討論其分布特征.答:頻數(shù)表見練習表2-1.根據(jù)直方圖〔練習圖2-1,可認為資料為基本對稱分布,其包絡線見練習圖2-2.練習表2-1某地100名40~50歲健康男子總膽因醇/〔mg·dl-1FrequencyPercentValidPercentCumulativePercentValid130~145~160~175~190~205~220~235~250~265~280Total13111225151311541001.03.011.012.025.015.013.011.05.04.0100.01.03.011.012.025.015.013.011.05.04.0100.01.04.015.027.052.067.080.091.096.0100.0練習圖2-1直方圖練習圖2-2包絡線圖〔2根據(jù)〔1的討論結果,計算恰當?shù)慕y(tǒng)計指標描述資料的平均水平和變異度.答:利用原始數(shù)據(jù),求出算術均數(shù)mg/dl和標準差mg/dl.〔3計算P25,P75和P95.答:利用原始數(shù)據(jù),求出P25=186.8mg/dl,P75=229.3mg/dl,P95=259.0mg/dl.2.某地對120名微絲蚴血癥患者治療3個療程后,用IFA間接熒光抗體試驗測得抗體滴度如下,求抗體滴度的平均水平.抗體滴度1:51:101:201:401:801:1601:320例數(shù)516273422133利用上述頻數(shù)表,得平均滴度為1:36.3.3.某地1975-1980年出血熱發(fā)病和死亡資料如教材表2-21,設該地人口數(shù)在此6年間基本保持不變.教材表2-21某地6年間出血熱的發(fā)病與死亡情況年份發(fā)病數(shù)病死數(shù)1975324197656519771621219782411319793301019802745試分析:〔1粗略判斷發(fā)病率的變化情況怎樣.答:該地人口數(shù)在此6年間基本保持不變,發(fā)病人數(shù)在1979年前逐年上升,1980年略有下降.可以認為發(fā)病率大致呈上升趨勢,1980年略有下降.〔2病死率的變化情況怎樣?答:病死率由各年度病死數(shù)除以發(fā)病數(shù)獲得,病死率依次為12.5%、8.9%、7.4%、5.4%、3.0%和1.8%,呈逐年下降趨勢.〔3上述分析內(nèi)容可用什么統(tǒng)計圖繪制出來?答:由于沒有給出該地人口數(shù),故不能計算發(fā)病率,可用普通線圖表示發(fā)病數(shù)變化情況.病死率的下降情況可以用普通線圖表示,下降速度則可以用半對數(shù)線圖表示.〔4評述該地區(qū)出血熱防治工作的效果.答:隨著時間的推移,預防工作做得不好,治療水平則逐年提高〔體現(xiàn)在病死率下降.〔張晉昕第3章概率分布思考與練習參考答案一、最佳選擇題1.某資料的觀察值呈正態(tài)分布,理論上有〔C的觀察值落在范圍內(nèi).A.68.27%B.90%C.95%D.99%E.45%2.正態(tài)曲線下,從均數(shù)到的面積為〔A.A.45%B.90%C.95%D.47.5%E.99%3.若正常人的血鉛含量X近似服從對數(shù)正態(tài)分布,則制定X的95%參考值范圍,最好采用〔其中,為Y的標準差〔C.A.B.C.D.E.4.在樣本例數(shù)不變的情況下,若〔D,則二項分布越接近對稱分布.A.總體率越大B.樣本率p越大C.總體率越小D.總體率越接近0.5E.總體率接近0.1或0.55.鉛作業(yè)工人周圍血象點彩紅細胞在血片上的出現(xiàn)數(shù)近似服從〔D.A.二項分布B.正態(tài)分布C.偏態(tài)分布D.Poisson分布E.對稱分布6.Poisson分布的均數(shù)與標準差的關系是〔E.A.B.C.D.E.二、思考題1.服從二項分布及Poisson分布的條件分別是什么?簡答:二項分布成立的條件:①每次試驗只能是互斥的兩個結果之一;②每次試驗的條件不變;③各次試驗獨立.Poisson分布成立的條件:除二項分布成立的三個條件外,還要求試驗次數(shù)很大,而所關心的事件發(fā)生的概率很小.2.二項分布、Poisson分布分別在何種條件下近似正態(tài)分布?簡答:二項分布的正態(tài)近似:當n較大,π不接近0也不接近1時,二項分布B〔,π近似正態(tài)分布N〔,.Poisson分布的正態(tài)近似:Poisson分布,當相當大時〔≥20,其分布近似于正態(tài)分布.三、計算題1.已知某種非傳染性疾病常規(guī)療法的有效率為80%,現(xiàn)對10名該疾病患者用常規(guī)療法治療,問至少有9人治愈的概率是多少?解:對10名該疾病患者用常規(guī)療法治療,各人間對藥物的反應具有獨立性,且每人服藥后治愈的概率均可視為0.80,這相當于作10次獨立重復試驗,即=0.80,n=10的貝努利試驗,因而治愈的人數(shù)X服從二項分布.至少有9人治愈的概率為:至少有9人治愈的概率是37.58%.或者2.據(jù)以往的統(tǒng)計資料,某地新生兒染色體異常率為1%,問100名新生兒中染色體異常不少于2名的概率是多少?解:=3.調(diào)查某市2000年110名20歲男性青年的身高〔cm資料如下:173.1166.8172.9175.9172.8170.5174.1174.2175.7173.5168.2173.7184.4174.8172.5174.9174.9174.2173.8176.2170.9165.0176.3174.2179.8174.5180.5171.5178.9171.5166.7170.8168.8177.5174.5183.5182.0170.9173.5177.5181.2177.1172.3176.5174.0174.3174.6172.6171.3173.1176.9170.5174.2177.5176.6182.3172.1169.9179.5175.8178.6180.6175.6173.3168.7174.5178.5171.3172.0173.2168.8176.0182.6169.5177.5180.6181.5175.1165.2168.0175.4169.2170.0171.9176.6178.8177.2173.4168.5177.6175.8164.8175.6180.0176.6176.5177.7174.1180.8170.6173.8180.7176.3177.5178.3176.0174.8180.8176.5179.2〔1試估計當年該市20歲男性青年中,身高在175.0~178.0〔cm內(nèi)的占多大比例?〔2估計當年該市95%以及99%的20歲男青年身高范圍.〔3若當年由該市隨機抽查1名20歲男青年,試估計其身高超過180cm的概率.解:用SPSS計算本題.數(shù)據(jù)文件:data3-n.sav.數(shù)據(jù)格式:數(shù)據(jù)庫2列110行,變量n為男性青年序號,x表示身高.操作步驟:操作說明AnalyzeDescriptiveStatisticsDescriptivesOptions√Mean√Std.DeviationContinueVariable[s]:xOK調(diào)用Descriptives過程計算得均數(shù)=174.766,標準差=4.1509TransformCompute調(diào)用"變量計算<ComputeVariable>"對話框TargetVariableP定義目標變量"P"NumericExpression:CDF.NORMAL<178.0,174.766,4.1509>-CDF.NORMAL<175.0,174.766,4.1509>OK當年該市20歲男性青年中,身高在175.0~178.0cm內(nèi)的比例TargetVariablex1該市95%以及99%的20歲男青年身高范圍間的比例NumericExpression:174.766-1.96*4.1509OKTargetVariablex2NumericExpression:174.766+1.96*4.1509OKTargetVariablex3NumericExpression:174.766-2.58*4.1509OKTargetVariablex4NumericExpression:174.766+2.58*4.1509OKTargetVariablep1NumericExpression:1-CDF.NORMAL<180.0,174.766,4.1509>OK由該市隨機抽查1名20歲男青年,其身高超過180cm的概率計算結果〔練習圖3-1:DescriptiveStatisticsNMeanStd.Deviationx110174.7664.1509ValidN<listwise>110練習圖3-1SPSS輸出結果以上是SPSS輸出結果,得到均數(shù)〔Mean為174.766cm,標準差〔Std.Deviation為4.1509cm.估計當年該市20歲男性青年中,身高在175.0~178.0cm內(nèi)的比例為25.956%,身高在175.0~178.0cm內(nèi)的約有29人.估計當年該市95%的20歲男青年身高范圍為166.63~182.90cm,99%的20歲男青年身高范圍為164.06~185.48cm.由該市隨機抽查1名20歲男青年,估計其身高超過180cm的概率約為10%.〔祁愛琴高永石德文第4章參數(shù)估計思考與練習參考答案一、最佳選擇題1.關于以0為中心的t分布,錯誤的是〔EA.t分布的概率密度圖是一簇曲線 B.t分布的概率密度圖是單峰分布C.當∞時,t分布Z分布D.t分布的概率密度圖以0為中心,左右對稱E.相同時,值越大,P值越大2.某指標的均數(shù)為,標準差為S,由公式計算出來的區(qū)間常稱為〔B.A.99%參考值范圍B.95%參考值范圍C.99%置信區(qū)間D.95%置信區(qū)間E.90%置信區(qū)間3.樣本頻率與總體概率均已知時,計算樣本頻率p的抽樣誤差的公式為〔C.A.B.C.D.E.4.在已知均數(shù)為,標準差為的正態(tài)總體中隨機抽樣,〔B的概率為5%.A.B.C.D.E.5.〔C小,表示用樣本均數(shù)估計總體均數(shù)的精確度高.A.CVB.SC.D.RE.四分位數(shù)間距6.95%置信區(qū)間的含義為〔C:A.此區(qū)間包含總體參數(shù)的概率是95%B.此區(qū)間包含總體參數(shù)的可能性是95%C."此區(qū)間包含總體參數(shù)"這句話可信的程度是95%D.此區(qū)間包含樣本統(tǒng)計量的概率是95%E.此區(qū)間包含樣本統(tǒng)計量的可能性是95%二、思考題1.簡述標準誤與標準差的區(qū)別.答:區(qū)別在于:〔1標準差反映個體值散布的程度,即反映個體值彼此之間的差異;標準誤反映精確知道總體參數(shù)〔如總體均數(shù)的程度.〔2標準誤小于標準差.〔3樣本含量越大,標準誤越小,其樣本均數(shù)更有可能接近于總體均數(shù),但標準差不隨樣本含量的改變而有明顯方向性改變,隨著樣本含量的增大,標準差有可能增大,也有可能減小.2.什么叫抽樣分布的中心極限定理?答:樣本含量n越大,樣本均數(shù)所對應的標準差越小,其分布也逐漸逼近正態(tài)分布,這種現(xiàn)象統(tǒng)計學上稱為中心極限定理〔centrallimittheorem.當有足夠的樣本含量〔如時,從任何總體中抽取隨機樣本的樣本均數(shù)近似地服從正態(tài)分布.樣本含量越大,抽樣分布越接近于正態(tài)分布.正態(tài)分布的近似程度與總體自身的概率分布和樣本含量有關.如果總體原本就是正態(tài)分布,那么對于所有值,抽樣分布均為正態(tài)分布.如果總體為非正態(tài)分布,僅在n值較大情況下近似服從正態(tài)分布.一般說,時的抽樣分布近似為正態(tài)分布;但是,如果總體分布極度非正態(tài)〔如雙峰分布、極度偏峰分布,即使有足夠大的值,抽樣分布也將為非正態(tài).3.簡述置信區(qū)間與醫(yī)學參考值范圍的區(qū)別.答:置信區(qū)問與醫(yī)學參考值范圍的區(qū)別見練習表4-1.練習表4-1置信區(qū)間與醫(yī)學參考值范圍的區(qū)別區(qū)別置信區(qū)間參考值范圍含義用途計算公式總體參數(shù)的波動范圍,即按事先給定的概率100<1>%所確定的包含未知總體參數(shù)的一個波動范圍估計未知總體均數(shù)所在范圍未知:已知或未知但n≥30,有或個體值的波動范圍,即按事先給定的范圍100<1>%所確定的"正常人"的解剖、生理、生化指標的波動范圍供判斷觀察個體某項指標是否"正常"時參考〔輔助診斷正態(tài)分布:偏峰分布:PX~P100X4.何謂置信區(qū)間準確度與精確度?如何協(xié)調(diào)兩者間的關系.答:置信區(qū)間有準確度〔accuracy與精密度〔precision兩個要素.準確度由置信度<1->的大小確定,即由置信區(qū)間包含總體參數(shù)的可能性大小來反映.從準確度的角度看,置信度愈接近于1愈好,如置信度99%比95%好.精密度是置信區(qū)間寬度的一半〔即、,意指置信區(qū)間的兩端點值離樣本統(tǒng)計量〔如、p的距離.從精密度的角度看,置信區(qū)間寬度愈窄愈好.在抽樣誤差確定的情況下,兩者是相互矛盾的.為了同時兼顧置信區(qū)間的準確度與精密度,可適當增加樣本含量.三、計算題1.隨機抽取了100名一年級大學生,測得空腹血糖均數(shù)為4.5mmol/L,標準差為0.61mmol/L.試估計一年級大學生空腹血糖總體均數(shù)及方差的95%置信區(qū)間.答:總體均數(shù)95%置信區(qū)間為〔4.379,4.621,方差的95%置信區(qū)間為2.調(diào)查某地蟯蟲感染情況,隨機抽樣調(diào)查了260人,感染人數(shù)為100.試估計該地蟯蟲感染率的95%置信區(qū)間.答:該地蟯蟲感染率的95%置信區(qū)間為〔32.55%,44.38%.〔宇傳華第5章假設檢驗思考與練習參考答案一、最佳選擇題1.樣本均數(shù)比較作t檢驗時,分別取以下檢驗水準,以〔E所?、蝾愬e誤最小.A.B.C.D.E.2.在單組樣本均數(shù)與一個已知的總體均數(shù)比較的假設檢驗中,結果t=3.24,t0.05,v=2.086,t0.01,v=2.845.正確的結論是〔E.A.此樣本均數(shù)與該已知總體均數(shù)不同B.此樣本均數(shù)與該已知總體均數(shù)差異很大C.此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)差異很大D.此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)相同E.此樣本均數(shù)所對應的總體均數(shù)與該已知總體均數(shù)不同3.假設檢驗的步驟是〔A.A.建立假設,選擇和計算統(tǒng)計量,確定P值和判斷結果B.建立無效假設,建立備擇假設,確定檢驗水準C.確定單側檢驗或雙側檢驗,選擇t檢驗或Z檢驗,估計Ⅰ類錯誤和Ⅱ類錯誤D.計算統(tǒng)計量,確定P值,作出推斷結論E.以上都不對4.作單組樣本均數(shù)與一個已知的總體均數(shù)比較的t檢驗時,正確的理解是〔C.A.統(tǒng)計量t越大,說明兩總體均數(shù)差別越大B.統(tǒng)計量t越大,說明兩總體均數(shù)差別越小C.統(tǒng)計量t越大,越有理由認為兩總體均數(shù)不相等D.P值就是E.P值不是,且總是比小5.下列〔E不是檢驗功效的影響因素的是:A.總體標準差B.容許誤差C.樣本含量nD.Ⅰ類錯誤E.Ⅱ類錯誤二、思考題1.試述假設檢驗中α與P的聯(lián)系與區(qū)別.答:值是決策者事先確定的一個小的概率值.P值是在成立的條件下,出現(xiàn)當前檢驗統(tǒng)計量以及更極端狀況的概率.P≤時,拒絕假設.2.試述假設檢驗與置信區(qū)間的聯(lián)系與區(qū)別.答:區(qū)間估計與假設檢驗是由樣本數(shù)據(jù)對總體參數(shù)作出統(tǒng)計學推斷的兩種主要方法.置信區(qū)間用于說明量的大小,即推斷總體參數(shù)的置信范圍;而假設檢驗用于推斷質(zhì)的不同,即判斷兩總體參數(shù)是否不等.3.怎樣正確運用單側檢驗和雙側檢驗?答:選用雙側檢驗還是單側檢驗需要根據(jù)數(shù)據(jù)的特征及專業(yè)知識進行確定.若比較甲、乙兩種方法有無差異,研究者只要求區(qū)分兩方法有無不同,無需區(qū)分何者為優(yōu),則應選用雙側檢驗.若甲法是從乙法基礎上改進而得,已知如此改進可能有效,也可能無效,但不可能改進后反不如以前,則應選用單側檢驗.在沒有特殊專業(yè)知識說明的情況下,一般采用雙側檢驗即可.4.試述兩類錯誤的意義及其關系.答:Ⅰ類錯誤〔typeⅠerror:如果檢驗假設實際是正確的,由樣本數(shù)據(jù)計算獲得的檢驗統(tǒng)計量得出拒絕的結論,此時就犯了錯誤,統(tǒng)計學上將這種拒絕了正確的零假設〔棄真的錯誤稱為Ⅰ類錯誤.Ⅱ類錯誤<typeⅡerror>:假設檢驗的另一類錯誤稱為Ⅱ類錯誤<typeⅡerror>,即檢驗假設原本不正確〔正確,由樣本數(shù)據(jù)計算獲得的檢驗統(tǒng)計量得出不拒絕〔納偽的結論,此時就犯了Ⅱ類錯誤.Ⅱ類錯誤的概率用表示.在假設檢驗時,應兼顧犯Ⅰ類錯誤的概率〔和犯Ⅱ類錯誤的概率〔.犯Ⅰ類錯誤的概率〔和犯Ⅱ類錯誤的概率〔成反比.如果把Ⅰ類錯誤的概率定得很小,勢必增加犯Ⅱ類錯誤的概率,從而降低檢驗效能;反之,如果把Ⅱ類錯誤的概率定得很小,勢必增加犯Ⅰ類錯誤的概率,從而降低了置信度.為了同時減小和,只有通過增加樣本含量,減少抽樣誤差大小來實現(xiàn).5.試述檢驗功效的概念和主要影響因素.答:拒絕不正確的的概率,在統(tǒng)計學中稱為檢驗功效<poweroftest>,記為.檢驗功效的意義是:當兩個總體參數(shù)間存在差異時<如備擇假設:成立時>,所使用的統(tǒng)計檢驗能夠發(fā)現(xiàn)這種差異<拒絕零假設:>的概率,一般情況下要求檢驗功效應在0.8以上.影響檢驗功效的四要素為總體參數(shù)的差異、總體標準差、檢驗水準及犯Ⅱ類錯誤的概率.6.簡述假設檢驗的基本思想.答:假設檢驗是在H0成立的前提下,從樣本數(shù)據(jù)中尋找證據(jù)來拒絕、接受的一種"反證"方法.如果從樣本數(shù)據(jù)中得到的證據(jù)不足,則只能不拒絕,暫且認為成立〔因為拒絕的證據(jù)不足,即樣本與總體間的差異僅僅是由于抽樣誤差所引起.拒絕是根據(jù)某個界值,即根據(jù)小概率事件確定的.所謂小概率事件是指如果比檢驗統(tǒng)計量更極端〔即絕對值更大的概率較小,比如小于等于0.05〔各種科研雜志習慣上采用這一概率值,則認為零假設的事件在某一次抽樣研究中不會發(fā)生,此時有充分理由拒絕,即有足夠證據(jù)推斷差異具有統(tǒng)計學意義.三、計算題1.一般正常成年男子血紅蛋白的平均值為140g/L,某研究者隨機抽取25名高原地區(qū)成年男子進行檢查,得到血紅蛋白均數(shù)為155g/L,標準差25g/L.問:高原地區(qū)成年男子的血紅蛋白是否比一般正常成年男子的高?解:::〔單側=3.00t=3,,可認為高原地區(qū)居民的血紅蛋白比一般正常成年男子的高.2.一般而言,對某疾病采用常規(guī)治療,其治愈率約為45%.現(xiàn)改用新的治療方法,并隨機抽取180名該疾病患者進行了新療法的治療,治愈117人.問新治療方法與常規(guī)療法的效果是否有差別?解::,:,=5.41Z=5.41,,可認為新治療方法與常規(guī)療法的效果不同,新療法優(yōu)于常規(guī)療法.〔林愛華宇傳華第6章兩樣本定量資料的比較思考與練習參考答案一、最佳選擇題1.正態(tài)性檢驗,按α=0.10檢驗水準,認為其總體服從正態(tài)分布,此時若推斷有錯,其錯誤的概率為〔D.A.大于0.10B.等于0.10C.小于0.10D.等于β,而β未知E.等于1-β,而β未知2.甲、乙兩人分別從同一隨機數(shù)字表抽取30個〔各取兩位數(shù)字隨機數(shù)字作為兩個樣本,求得、,則理論上〔C.A.B.C.由甲、乙兩樣本均數(shù)之差求出的總體均數(shù)95%可信區(qū)間,很可能包括0D.作兩樣本均數(shù)比較的t檢驗,必然得出無統(tǒng)計學意義的結論E.作兩樣本方差比較的F檢驗,必然方差齊3.兩樣本均數(shù)比較時,能用來說明兩組總體均數(shù)間差別大小的是〔D.A.t值B.P值C.F值.兩總體均數(shù)之差的95%置信區(qū)間E.上述答案均不正確4.兩小樣本均數(shù)比較,方差不齊時,下列說法不正確的是〔C.A.采用秩和檢驗B.采用t′檢驗C.仍用t檢驗.變量變換后再作決定E.要結合正態(tài)性檢驗結果方能作出決定5.兩樣本秩和檢驗的是〔B.A.兩樣本秩和相等B.兩總體分布相同C.兩樣本分布相同D.兩總體秩和相等E.兩總體均數(shù)相等6.在統(tǒng)計檢驗中是否選用非參數(shù)統(tǒng)計方法〔A.A.要根據(jù)研究目的和數(shù)據(jù)特征作決定B.可在算出幾個統(tǒng)計量和得出初步結論后進行選擇C.要看哪個統(tǒng)計結論符合專業(yè)理論D.要看哪個值更小E.既然非參數(shù)統(tǒng)計對資料沒有嚴格的要求,在任何情況下均能直接使用7.配對樣本差值的Wilcoxon符號秩和檢驗,確定P值的方法是〔D.A.T越大,P值越小B.T越大,P值越大C.T值在界值范圍內(nèi),P值小于相應的αD.T值>界值,P值大于相應的α值E.T值在界值范圍上,P值大于相應的α8.成組設計兩樣本比較的秩和檢驗,其檢驗統(tǒng)計量T是〔C.A.為了查T界值表方便,一般以秩和較小者為TB.為了查T界值表方便,一般以秩和較大者為TC.為了查T界值表方便,一般以例數(shù)較小者秩和為TD.為了查T界值表方便,一般以例數(shù)較大者秩和為TE.當兩樣本例數(shù)不等時,任取一樣本的秩和為T都可以查T界值表二、思考題1.假設檢驗中,P值和α的含義是什么?兩者有什么關系?答:P是指H0成立時出現(xiàn)目前樣本情形的概率最多是多大,α是事先確定的檢驗水準.但P值的大小和α沒有必然關系.2.既然假設檢驗的結論有可能有錯,為什么還要進行假設檢驗?答:假設檢驗中,無論拒絕不拒絕H0,都可能會犯錯誤,表現(xiàn)為拒絕H0時,會犯Ⅰ類錯誤,不拒絕H0時,會犯Ⅱ類錯誤,但這并不能否認假設檢驗的作用.只要涉及到抽樣,就會有抽樣誤差的存在,因此就需要進行假設檢驗.只是要注意,假設檢驗的結論只是個概率性的結論,它的理論基礎是"小概率事件不可能原理".3.配對設計資料能否用完全隨機設計資料的統(tǒng)計檢驗方法?為什么?答:不能.采用完全隨機設計資料的t檢驗會使檢驗效能降低,從而可能會使應有的差別檢驗不出來.4.對于完全隨機設計兩樣本定量資料的比較,如何選擇統(tǒng)計方法?答:完全隨機設計兩樣本定量資料比較統(tǒng)計方法的選擇最關鍵的是看是否滿足正態(tài)性〔樣本量較大時不必進行正態(tài)性檢驗和方差齊性.如果資料來自正態(tài)總體且總體方差齊,采用t檢驗;如果滿足正態(tài)性但總體方差不齊,采用t′檢驗;當兩者都不滿足時,才考慮選用秩和檢驗.當然,我們也可采用變量變換的方法使其滿足t或t′檢驗的條件.5.為什么在秩和檢驗編秩次時不同組間出現(xiàn)相同數(shù)據(jù)要給予"平均秩次",而同一組的相同數(shù)據(jù)不必計算"平均秩次"?答:秩和檢驗編秩次時不同組間出現(xiàn)相同數(shù)據(jù)要給予"平均秩次",而同一組的相同數(shù)據(jù)不必計算"平均秩次",是因為取不取"平均秩次"對該組的總的秩和沒有影響.三、計算題1.某單位研究飼料中維生素E缺乏對肝中維生素A含量的影響,將同種屬、同年齡、同性別、同體重的大白鼠配成8對,并將每對動物隨機分配到正常飼料組和缺乏維生素E的飼料組,定期將大白鼠殺死,測定其肝中維生素A的含量〔教材表6-12,問飼料中維生素E缺乏對肝中維生素A的平均含量有無影響?教材表6-12正常飼料組與維生素E缺乏組大白鼠肝中維生素A含量/〔U·mg-1>大白鼠對別12345678正常飼料組3.552.603.003.953.803.753.453.05維生素E缺乏組2.452.401.8002.401.75解:此題是個配對設計的資料,差值的正態(tài)性檢驗結果表明:差值來自正態(tài)總體〔檢驗:P=0.268,所以采用配對t檢驗.結果為:t=6.837,=7,P<0.001,拒絕H0,可以認為維生素E缺乏對肝中維生素A含量有影響.2.某實驗室觀察局部溫熱治療小鼠移植性腫瘤的療效,以生存日數(shù)作為觀察指標.實驗結果如下,請比較兩組的平均生存日數(shù)有無差別.實驗組10121415151718202680對照組2367891012121330解:此題是個完全隨機設計的資料.兩組資料的正態(tài)性檢驗結果表明,差值來自正態(tài)總體<檢驗:P1<0.001,P2=0.011>,所以采用兩樣本比較的秩和檢驗.結果為:T1=150.5,T2=80.5,本例中n1=10,n2-n1=1,對應雙側0.05的界值為81~139,故在α=0.05的水平上拒絕H0,認為兩組小鼠生存日數(shù)不同.〔施學忠楊永利趙耐青第7章多組定量資料的比較思考與練習參考答案一、最佳選擇題1.完全隨機設計資料的方差分析中,必然有〔C.A.>B.C.=+D.E.2.定量資料兩樣本均數(shù)的比較,可采用〔D.A.檢驗B.檢驗C.Bonferroni檢驗D.檢驗與檢驗均可E.LSD檢驗3.當組數(shù)等于2時,對于同一資料,方差分析結果與檢驗結果相比,〔C.A.檢驗結果更為準確B.方差分析結果更為準確C.完全等價且D.完全等價且E.兩者結果可能出現(xiàn)矛盾4.若單因素方差分析結果為,則統(tǒng)計推斷是〔D.A.各樣本均數(shù)都不相等B.各樣本均數(shù)不全相等C.各總體均數(shù)都不相等D.各總體均數(shù)不全相等E.各總體均數(shù)全相等5.完全隨機設計資料的方差分析中,組間均方表示〔C.A.抽樣誤差的大小B.處理效應的大小C.處理效應和抽樣誤差綜合結果D.個數(shù)據(jù)的離散程度E.隨機因素的效應大小6.多樣本定量資料比較,當分布類型不清時應選擇〔D.A.方差分析B.檢驗C.Z檢驗D.Kruskal-Wallis檢驗E.Wilcoxon檢驗7.多組樣本比較的Kruskal-Wallis檢驗中,當相同秩次較多時,如果用值而不用校正后的值,則會〔C.提高檢驗的靈敏度B.把一些無差別的總體推斷成有差別C.把一些有差別的總體推斷成無差別D.Ⅰ、Ⅱ類錯誤概率不變E.以上說法均不對二、思考題1.方差分析的基本思想和應用條件是什么?答:方差分析的基本思想是,對于不同設計的方差分析,其思想都一樣,即均將處理間平均變異與誤差平均變異比較.不同之處在于變異分解的項目因設計不同而異.具體來講,根據(jù)試驗設計的類型和研究目的,將全部觀測值總的離均差平方和及其自由度分解為兩個或多個部分,除隨機誤差作用外,每個部分的變異可由某個因素的作用加以解釋,通過比較不同變異來源的均方,借助F分布作出統(tǒng)計推斷,從而推論各種研究因素對試驗結果有無影響.其應用條件是,①各樣本是相互獨立的隨機樣本,均服從正態(tài)分布;②各樣本的總體方差相等,即方差齊性.2.多組定量資料比較時,統(tǒng)計處理的基本流程是什么?答:多組定量資料比較時首先應考慮用方差分析,對其應用條件進行檢驗,即方差齊性及各樣本的正態(tài)性檢驗.若方差齊性,且各樣本均服從正態(tài)分布,選單因素方差分析.若方差不齊,或某樣本不服從正態(tài)分布,選Kruskal-Wallis秩和檢驗,或通過某種形式的數(shù)據(jù)變換使其滿足方差分析的條件.若方差分析或秩和檢驗結果有統(tǒng)計學意義,則需選擇合適的方法〔如Bonferonni、LSD法等進行兩兩比較.三、計算題:1.根據(jù)教材表7-11資料,大白鼠感染脊髓灰質(zhì)炎病毒后,再作傷寒或百日咳接種是否影響生存日數(shù)?若結論為"有影響",請作多重比較〔與對照組比.教材表7-11各組大鼠接種后生存日數(shù)/天傷寒百日咳對照5687698710981098101091110912111012111014121116解:本題資料可考慮用完全隨機設計的單因素方差分析進行統(tǒng)計處理.〔1建立檢驗假設,確定檢驗水準.:大白鼠感染脊髓灰質(zhì)炎病毒后,再接種傷寒或百日咳菌苗生存日數(shù)相等.:大白鼠感染脊髓灰質(zhì)炎病毒后,再接種傷寒或百日咳菌苗生存日數(shù)不等或不全相等,=0.05.〔2方差分析應用前提條件的檢驗首先進行正態(tài)性及方差齊性檢驗,三組均服從正態(tài)分布〔P1=0.684,P2=0.591,P3=0.507,三個總體的方差齊〔P=0.715,符合單因素方差分析的條件,可行方差分析.〔3各組可分別采用均數(shù)和標準差描述其集中趨勢和離散趨勢,各組的統(tǒng)計描述及總體均數(shù)的置信區(qū)間如下:表1三組大鼠接種后生存日數(shù)的描述性統(tǒng)計量/天N均數(shù)標準差95%置信區(qū)間下限上限傷寒010.70百日咳108.401.717.179.63對照1011.22.399.4912.91合計309.602.348.7310.47〔4資料的方差分析見方差分析表方差分析結果,,即大白鼠感染脊髓灰質(zhì)炎病毒后,再接種傷寒或百日咳菌苗生存日數(shù)不等或不全相等.表2三組大鼠接種后生存日數(shù)差別有無統(tǒng)計學意義的方差分析表變異來源SSdfMSFP組間41.6220.8004.7760.017組內(nèi)117.6274.356合計159.229進一步行多重比較<LSD檢驗>,結果兩實驗組均與對照組有統(tǒng)計學差異.認為大白鼠感染脊髓灰質(zhì)炎病毒后,再接種傷寒或百日咳菌苗對生存日數(shù)有影響,生存日數(shù)減少.表3三組大鼠接種后生存日數(shù)兩兩比較的結果對比組P均數(shù)差值的95%置信區(qū)間下限上限傷寒組與對照組2.00.93330.041-3.92-0.09百日咳組與對照組2.80.93330.006-4.72-0.892.將18名乙腦患者隨機分為三組,分別用單克隆抗體、胸腺肽和利巴韋林三種藥物治療,觀察指標為治療后的退熱時間,結果見教材表7-12.問三組治療結果的差異是否具有統(tǒng)計學意義?教材表7-12三組乙腦患者的退熱時間/天治療分組退熱時間單克隆抗體組020059胸腺肽組321367102利巴韋林組011151131解:從專業(yè)上考慮,退熱時間一般不服從正態(tài)分布,可采用Kraskal-Wallis檢驗分析三組乙腦患者的退熱時間差異有無統(tǒng)計學意義.各組可分別采用四份位數(shù)描述其集中趨勢和離散趨勢,各組的統(tǒng)計描述如下:表1三組乙腦患者退熱時間的描述性統(tǒng)計量/天組別NP25P50P75單克隆抗體組60.001.006.00胸腺肽組65.008.5017.75利巴韋林組60.757.0012.00〔2建立檢驗假設,確定檢驗水準.:三組乙腦患者的退熱時間相等,:三組乙腦患者的退熱時間不等或不全相等,=0.05.〔3Kraskal-Wallis檢驗結果,=4.799,=2,P=0.091>0.05.結論為,在=0.05的水平上尚不能認為三組治療結果的差異具有統(tǒng)計學意義.〔王玖徐天和高永石德文第8章定性資料的比較思考與練習參考答案一、最佳選擇題1.定性資料的統(tǒng)計推斷常用〔D.A.檢驗B.正態(tài)檢驗C.檢驗D.檢驗E.t′檢驗2.兩組二分類資料發(fā)生率比較,樣本總例數(shù)100,則檢驗自由度為〔A.A.1B.4C.95D.99E.1003.四格表檢驗中,<,可以認為〔B.A.兩總體率不同B.不能認為兩總體率不同C.兩樣本率不同D.不能認為兩樣本率不同E.以上都不對4.等級資料比較宜采用〔E.A.檢驗B.檢驗C.檢驗D.正態(tài)檢驗E.秩和檢驗5.為比較治療某病的新療法與常規(guī)方法,試驗者將100名患者按性別、年齡等情況配成對子,分別接受兩療法治療.觀察得到有28對患者同時有效,5對患者同時無效,11對患者新藥有效常規(guī)治療無效.欲比較兩種療法的有效率是否相同,應選擇的統(tǒng)計分析方法為〔D.A.獨立的兩組二分類資料比較檢驗B.獨立的兩組二分類資料比較校正檢驗C.配對的兩組二分類資料比較檢驗D.配對的兩組二分類資料比較校正檢驗E.Fisher確切概率法二、思考題1.簡述檢驗適用的數(shù)據(jù)類型.答:提示:卡方檢驗是應用較廣的一種定性資料的假設檢驗方法,常用于檢驗兩個或多個樣本率〔或構成比之間有無差別.2.兩組二分類資料的設計類型有幾類?其相應的檢驗方法是什么?答:提示:兩組二分類資料的設計類型主要有2類,即完全隨機設計和配對設計.完全隨機設計和配對設計資料在假設檢驗方法上均采用卡方檢驗.完全隨機設計資料應用公式〔8-1或〔8-4,配對設計資料應用公式〔8-7或〔8-8.3.什么資料適合用秩和檢驗進行檢驗?簡述秩和檢驗步驟.答:提示:進行有序資料的比較時宜采用秩和檢驗.秩和檢驗步驟為:①建立假設,并確定檢驗水準;②根據(jù)不同的設計類型對資料進行編秩并計算秩和;③根據(jù)計算的秩和直接查表或計算相應的統(tǒng)計量再查表,確定值下結論.進行有序資料的比較時宜采用秩和檢驗.4.試證明對于R×C式〔8-11與式〔8-1等價.提示:三、計算題1.某醫(yī)院觀測了28例肝硬化患者和14例再生障礙性貧血患者血清中抗血小板抗體,結果是:肝硬化患者中有2例陽性,再生障礙性貧血患者中有5例陽性.問:兩類患者血清抗血小板抗體陽性率有無差別?解:將資料進行整理列表〔練習表8-1.練習表8-1兩類患者血清抗血小板抗體檢測結果患者類型陽性陰性合計肝硬化患者再生障礙性貧血患者226285914資料屬于獨立的兩組二分類資料比較.理論頻數(shù)分別為4.67、23.33、2.33、11.67,應選用校正公式計算.假設:兩種疾病患者血清抗血小板抗體檢測陽性率相同,=0.05.計算統(tǒng)計量校正卡方=3.6214,自由度=1,=0.0570,無統(tǒng)計學意義,尚不能認為兩種疾病患者血清抗血小板抗體檢測陽性率不同.2.對100名鉤端螺旋體病患者同時用間接免疫抗體試驗和顯微鏡凝集試驗進行血清學診斷,結果見教材表8-18.試比較用兩種方法檢驗的陽性率有無差別?教材表8-18兩種方法的檢驗結果比較〔例數(shù)間接免疫熒光顯微鏡凝集合計+-+661177-61723合計7228100解:答案提示,本資料屬于配對的兩組二分類資料比較,+=11+6=17<40,應選用校正配對卡方公式計算.假設:兩種方法檢測的陽性率相同,=0.05.計算統(tǒng)計量0.9412,=1,=0.332,無統(tǒng)計學意義,尚不能認為兩種方法檢測的陽性率不同.3.研究兩種不同的治療訓練方案對肥胖癥患者的減肥效果情況,結果見教材表8-19.問這兩種治療訓練方案對肥胖癥患者的減肥效果是否相同?教材表8-19兩種治療訓練方案對肥胖癥患者的減肥效果〔例數(shù)治療方案效果較好效果一般效果較差合計甲1622846乙2817550合計44391396解:該資料屬于結果變量為有序變量的定性資料,應選用秩和檢驗.假設:兩種治療方案對肥胖癥患者的減肥效果相同,=0.05.按照治療效果由差到好編秩,計算秩和,統(tǒng)計量=-2.064,=0.039,有統(tǒng)計學意義,可以認為兩種治療方案的減肥效果不同,由兩組平均秩和看,甲組為1974÷46=42.91,乙組為2682÷50=53.64,因為編秩是由差到好,因此可認為乙治療方案的效果好于甲治療方案.4.比較三種中藥方劑對骨質(zhì)疏松癥的治療效果,結果見教材表8-20.三種方劑的治療效果是否有差異?教材表8-20三種中藥方劑對骨質(zhì)疏松癥的治療效果〔例數(shù)分組有效無效合計A方劑18624B方劑121426C方劑111526合計413576解:本題屬于獨立的多組二分類資料比較.假設:三種方劑對骨質(zhì)疏松癥的治療效果相同,=0.05.計算統(tǒng)計量6.3350,=2,=0.042,差別有統(tǒng)計學意義,拒絕H0,接受H1,尚不能認為這三種方劑的治療效果不相同.〔郭秀花羅艷俠第9章關聯(lián)性分析思考與練習參考答案最佳選擇題1.對簡單相關系數(shù)作假設檢驗,,統(tǒng)計結論為〔B.A.兩變量不相關B.兩變量有線性關系C.兩變量無線性關系D.兩變量不會是曲線關系,一定是線性關系E.上述說法都不準確2.計算積矩相關系數(shù)要求〔C.A.是正態(tài)變量,可以不滿足正態(tài)的要求B.是正態(tài)變量,可以不滿足正態(tài)的要求C.兩變量都要求滿足正態(tài)分布規(guī)律D.兩變量只要是測量指標就行E.是定量指標,可以是任何類型的數(shù)據(jù)3.對兩個分類變量的頻數(shù)表資料作關聯(lián)性分析,可用〔C.A.積矩相關B.秩相關C.關聯(lián)系數(shù)D.線性相關E.以上均可4.由樣本算得相關系數(shù),檢驗結果為<0.01,說明〔D.A.兩變量之間有高度相關性B.來自高度相關的總體C.來自總體相關系數(shù)為0的總體 D.來自總體相關系數(shù)不為0的總體E.來自總體相關系數(shù)大于0的總體二、思考題1.1988年某地抽查0~7歲兒童營養(yǎng)不良患病情況如教材表9-10,某醫(yī)師要想了解年齡與營養(yǎng)不良患病率是否有關,你認為應選用什么統(tǒng)計方法?為什么?教材表9-101988年某地抽查0~7歲兒童營養(yǎng)不良患病情況年齡/歲0~1~2~3~4~5~6~7患病人數(shù)982788629598234患病率/%15.711.77.35.1解:提示,用秩相關分析年齡與患病率的關系,因患病率資料一般不服從正態(tài)分布.2.請查找最近三年主題為相關分析或關聯(lián)分析的已發(fā)表國內(nèi)醫(yī)學文獻,至少認真閱讀其中3篇〔建議分別選取Pearson、Spearman相關分析和關聯(lián)分析各1篇,找出其中不妥之處.3.在講散點圖時,我們曾提到分層應慎重,有可能出現(xiàn)分層分析與總體情況大相徑庭的結果.請舉一兩個實例說明這種現(xiàn)象.三、計算分析題1.某學校隨機抽取18名學生,測定其智商〔IQ值,連同當年數(shù)學和語文兩科總成績?nèi)绫斫滩?-11.試計算數(shù)學成績與智商、語文成績與智商以及數(shù)學與語文成績的相關系數(shù),并檢驗總體相關系數(shù)是否為零.能否認為數(shù)學好的原因是語文好,或者語文好的原因是數(shù)學好?教材表9-1118名學生的智商、數(shù)學成績和語文成績編號123456789數(shù)學成績X語文成績Y智商得分Z78846152938998986583767058827889956195100100751059711012076編號101112131415161718數(shù)學成績X語文成績Y智商得分Z7348456775958899817553437078979292889261608896125113126102解:提示,數(shù)學與智商的相關系數(shù)〔Pearson為0.918,語文與智商的相關系數(shù)為0.958,數(shù)學與語文的相關系數(shù)為0.932.各總體相關系數(shù)均不為0.數(shù)學好或者語文好與智商有關系.不能認為數(shù)學好的原因是語文好,或者語文好的原因是數(shù)學好,兩者之間不存在因果關系.2.將10份研究生院的入學申請書讓兩位老師排序,結果見教材表9-12.請問兩人的排序是否相關?教材表9-12兩位老師對10份入學申請書的排序申請書編號12345678910A老師的排序61051728934B老師的排序78546391012解:提示,Spearman相關系數(shù)為0.842,總體相關系數(shù)不為0〔P=0.002,可以認為兩人的排序相關.3.關于丈夫和妻子關節(jié)炎的患病率分析中,100對中年夫婦的患病情況見教材表9-13,試分析丈夫和妻子關節(jié)炎的患病有無關系.教材表9-13100對中年夫婦的患病情況妻子患病情況丈夫患病情況合計有病無病有病162440無病243660合計4060100解:提示,運用交叉分類2×2列聯(lián)表的關聯(lián)分析,=0.00,=3.84>0.00,在α=0.05的水平下,不拒絕H0,尚不能認為中年夫婦中丈夫患關節(jié)炎和妻子患關節(jié)炎有關聯(lián).〔凌莉劉清海簡單線性回歸分析思考與練習參考答案最佳選擇題1.如果兩樣本的相關系數(shù),樣本量,那么〔D.A.回歸系數(shù)B.回歸系數(shù)C.回歸系數(shù)D.統(tǒng)計量E.以上均錯2.如果相關系數(shù)=1,則一定有〔C.A.=B.=C.=D.>E.=3.記為總體相關系數(shù),為樣本相關系數(shù),為樣本回歸系數(shù),下列〔D正確.A.=0時,=0B.||>0時,>0C.>0時,<0D.<0時,<0E.||=1時,=14.如果相關系數(shù)=0,則一定有〔D.A.簡單線性回歸的截距等于0B.簡單線性回歸的截距等于或C.簡單線性回歸的等于0D.簡單線性回歸的等于E.簡單線性回歸的等于05.用最小二乘法確定直線回歸方程的含義是〔B.A.各觀測點距直線的縱向距離相等B.各觀測點距直線的縱向距離平方和最小C.各觀測點距直線的垂直距離相等D.各觀測點距直線的垂直距離平方和最小E.各觀測點距直線的縱向距離等于零二、思考題1.簡述簡單線性回歸分析的基本步驟.答:①繪制散點圖,考察是否有線性趨勢及可疑的異常點;②估計回歸系數(shù);③對總體回歸系數(shù)或回歸方程進行假設檢驗;④列出回歸方程,繪制回歸直線;⑤統(tǒng)計應用.2.簡述線性回歸分析與線性相關的區(qū)別與聯(lián)系.答:區(qū)別:〔1資料要求上,進行直線回歸分析的兩變量,若為可精確測量和嚴格控制的變量,則對應于每個的值要求服從正態(tài)分布;若、都是隨機變量,則要求、服從雙變量正態(tài)分布.直線相關分析只適用于雙變量正態(tài)分布資料.〔2應用上,說明兩變量線性依存的數(shù)量關系用回歸〔定量分析,說明兩變量的相關關系用相關〔定性分析.〔3兩個系數(shù)的意義不同.說明具有直線關系的兩變量間相互關系的方向與密切程度,表示每變化一個單位所導致的平均變化量.〔4兩個系數(shù)的取值范圍不同:-1≤≤1,.〔5兩個系數(shù)的單位不同:沒有單位,有單位.聯(lián)系:〔1對同一雙變量資料,回歸系數(shù)與相關系數(shù)的正負號一致.>0時,>0,均表示兩變量、同向變化;<0時,<0,均表示兩變量、反向變化.〔2回歸系數(shù)與相關系數(shù)的假設檢驗等價,即對同一雙變量資料,.由于相關系數(shù)的假設檢驗較回歸系數(shù)的假設檢驗簡單,故在實際應用中常以的假設檢驗代替的假設檢驗.〔3用回歸解釋相關:由于決定系數(shù)=S/S,當總平方和固定時,回歸平方和的大小決定了相關的密切程度.回歸平方和越接近總平方和,則越接近1,說明引入相關的效果越好.例如當r=0.20,n=100時,可按檢驗水準0.05拒絕H0,接受H1,認為兩變量有相關關系.但=<0.20>2=0.04,表示回歸平方和在總平方和中僅占4%,說明兩變量間的相關關系實際意義不大.3.決定系數(shù)與相關系數(shù)的意義相同嗎?如果不一樣,兩者關系如何?答:現(xiàn)將相關系數(shù)、決定系數(shù)與Y的總變異的關系闡釋如下:假如在一回歸分析中,回歸系數(shù)的變異數(shù)=9,而Y的總變異數(shù)=13,則決定系數(shù)=/=9/14=0.6429/1,相關系數(shù)R=0.8018即將決定系數(shù)表示為一比值關系,當=l時,則=0.6429,我們可以采用直角三角形的"勾股定理"圖示決定系數(shù)與相關系數(shù)的關系,如練習圖10-1所示.SSSS殘差面積=4邊長=2SS回歸面積=9邊長=3SS回歸SS殘差=9=4SS總=13SS殘差SS回歸面積=0.6429邊長=0.8018SS回歸SS殘差=0.6429=0.3571SS總=1練習圖10-1相關系數(shù)、決定系數(shù)與總變異的關系三、計算題1.以例10-1中空氣一氧化氮〔NO為因變量,風速〔X4為自變量,采用統(tǒng)計軟件完成如下分析:〔1試用簡單線性回歸方程來描述空氣中NO濃度與風速之間的關系.〔2對回歸方程和回歸系數(shù)分別進行假設檢驗.〔3繪制回歸直線圖.〔4根據(jù)以上的計算結果,進一步求其總體回歸系數(shù)的95%置信區(qū)間.〔5風速為1.50m/s時,分別計算個體值的95%容許區(qū)間和Y的總體均數(shù)的95%置信區(qū)間,并說明兩者的意義.解:運用SPSS進行處理,主要分析結果如下:〔1簡單線性回歸方程、假設檢驗結果及總體回歸系數(shù)的95%置信區(qū)間如下:Coefficients<a>UnstandardizedCoefficientsStandardizedCoefficientstSig.95%ConfidenceIntervalforBBStd.ErrorBetaLowerBoundUpperBoundConstant0.1590.0198.4220.0000.1200.198風速-0.0530.012-0.680-4.3450.000-0.078-0.028〔2方差分析結果:ANOVA<b>SumofSquaresdfMeanSquareFSig.Regression0.03810.03818.8780.000<a>Residual0.044220.002Total0.08123〔3回歸直線如練習圖10-2.練習圖10-2回歸直線圖2.教材表10-8為本章例10-1回歸分析的部分結果,依次為、、的估計值〔與殘差〔,請以相關分析考察四者之間的關系,以回歸分析考察與、與、與、與之間的關系,并予以解釋.教材表10-8案例分析中回歸分析的部分結果1.300.070.0707-0.0045480.04521.120.040.0415-0.00251.440.080.0935-0.01751.480.130.09860.03041.660.060.1271-0.06810.790.00-0.01080.01181.820.140.1531-0.01811.540.090.1081-0.02111.650.170.12650.04351.440.100.09220.00680.960.040.01680.02221.760.160.14290.01310.950.010.0149-0.00991.780.220.14740.07461.750.120.1426-0.02261.440.010.0929-0.08191.500.150.10170.04331.200.040.0548-0.01481.080.000.0365-0.03351.060.030.0327-0.00371.500.120.10240.01761.840.140.1569-0.01691.440.100.09220.0068解:主要分析結果:<1>四者之間的相關系數(shù)Correlationshathat10.8091.0000.0000.80910.8090.586hat1.0000.80910.000hat0.0000.5860.0001**Correlationissignificantatthe0.01level<2-tailed>.〔2四個變量間的回歸系數(shù)因變量自變量截距回歸系數(shù)tP-0.1360.159456.0160.0001.0050.0016.4570.0000.0880.9993.3940.0030.00001470.00001050.0001.000與呈完全正相關關系,回歸系數(shù)t檢驗結果P=0.000,表明的變異可由完全解釋.與的相關系數(shù)與與的相關系數(shù)相同,表明正是由于的影響引起的變異,與關系即體現(xiàn)了與的變化關系.與體現(xiàn)了扣除的影響后,與殘差仍呈正相關關系.與呈零相關關系,表明扣除了的影響,回歸方程的殘差與不再有相關或回歸關系.〔張巖波郝元濤第11章多重線性回歸分析思考與練習參考答案一、最佳選擇題1.逐步回歸分析中,若增加自變量的個數(shù),則〔D.A.回歸平方和與殘差平方和均增大B.回歸平方和與殘差平方和均減小C.總平方和與回歸平方和均增大D.回歸平方和增大,殘差平方和減小E.總平方和與回歸平方和均減小2.下面關于自變量篩選的統(tǒng)計學標準中錯誤的是〔E.A.殘差平方和〔縮小B.確定系數(shù)〔增大C.殘差的均方〔縮小D.調(diào)整確定系數(shù)〔增大E.統(tǒng)計量增大3.多重線性回歸分析中,能直接反映自變量解釋因變量變異百分比的指標為〔C.A.復相關系數(shù)B.簡單相關系數(shù)C.確定系數(shù)D.偏回歸系數(shù)E.偏相關系數(shù)4.多重線性回歸分析中的共線性是指〔E.A.關于各個自變量的回歸系數(shù)相同B.關于各個自變量的回歸系數(shù)與截距都相同C.變量與各個自變量的相關系數(shù)相同D.與自變量間有較高的復相關E.自變量間有較高的相關性5.多重線性回歸分析中,若對某一自變量的值加上一個不為零的常數(shù),則有〔D.A.截距和該偏回歸系數(shù)值均不變B.該偏回歸系數(shù)值為原有偏回歸系數(shù)值的倍C.該偏回歸系數(shù)值會改變,但無規(guī)律D.截距改變,但所有偏回歸系數(shù)值均不改變E.所有偏回歸系數(shù)值均不會改變二、思考題1.多重線性回歸分析的用途有哪些?答:多重線性回歸在生物醫(yī)學研究中有廣泛的應用,歸納起來,可以包括以下幾個方面:定量地建立一個反應變量與多個解釋變量之間的線性關系,篩選危險因素,通過較易測量的變量估計不易測量的變量,通過解釋變量預測反應變量,通過反應變量控制解釋變量.2.多重線性回歸模型中偏回歸系數(shù)的含義是什么?答:偏回歸系數(shù)的含義是:在控制其他自變量的水平不變的情況下,該自變量每改變一個單位,反應變量平均改變的單位數(shù).3.請解釋用于多重線性回歸參數(shù)估計的最小二乘法的含義.答:最小二乘法的含義是:殘差的平方和達到最小.4.如何判斷和處理多重共線性?答:如果自變量之間存在較強的相關,則存在多重共線性.可以通過分析自變量之間的相關系數(shù)、計算方差膨脹因子和容忍度等指標判斷是否存在多重共線性.如果自變量間存在多重共線性,最簡單的處理辦法是刪除變量,即在相關性較強的變量中刪除測量誤差大的、缺失數(shù)據(jù)多的、從專業(yè)上看意義不是很重要的或者在其他方面不太滿意的變量.其次,也可采用主成分回歸方法.5.如何判斷、分析自變量間的交互作用?答:基于專業(yè)背景知識,構造可能的交互作用項,并檢驗交互作用項是否有統(tǒng)計學意義.6.多重線性回歸模型的基本假定有哪些?如何判斷資料是否滿足這些假定?如果資料不滿足假定條件,常用的處理方法有哪些?答:多重線性回歸的前提條件是線性、獨立性、正態(tài)性和等方差性,可以借助殘差分析等方法判斷資料是否滿足條件.如果資料不滿足前提條件,可以采用變量變換和非線性回歸等方法處理.三、計算題為確定老年婦女進行體育鍛煉還是增加營養(yǎng)會減緩骨骼損傷,一名研究者用光子吸收法測量了骨骼中無機物含量,對三根骨頭主側和非主側記錄了測量值,結果見教材表11-20.分別用兩種橈骨測量結果作為反應變量對其他骨骼測量結果作多重線性回歸分析,提出并擬合適當?shù)幕貧w模型,分析殘差.解:答案提示,需要對自變量進行篩選,而且要考慮是否存在多重共線性,如果存在,應進行適當?shù)奶幚?教材表11-20骨骼中無機物的含量受試者編號主側橈骨橈骨主側肱骨肱骨主側尺骨尺骨11.1031.0522.1392.2380.8730.87220.8420.8591.8731.7410.5900.74430.9250.8731.8871.8090.7670.71340.8570.7441.7391.5470.7060.67450.7950.8091.7341.7150.5490.65460.7870.7791.5091.4740.7820.57170.9330.8801.6951.6560.7370.80380.7990.8511.7401.7770.6180.68290.9450.8761.8111.7590.8530.777100.9210.9061.9542.0090.8230.765110.7920.8251.6241.6570.6860.668120.8150.7512.2041.8460.6780.546130.7550.7241.5081.4580.6620.595140.8800.8661.7861.8110.8100.819150.9000.8381.9021.6060.7230.677160.7640.7571.7431.7940.5860.541170.7330.7481.8631.8690.6720.752180.9320.8982.0282.0320.8360.805190.8560.7861.3901.3240.5780.610200.8900.9502.1872.0870.7580.718210.6880.5321.6501.3780.5330.482220.9400.8502.3342.2250.7570.731230.4930.6161.0371.2680.5460.615240.8350.7521.5091.4220.6180.664250.9150.9361.9711.8690.8690.868資料來源:《實用多元統(tǒng)計分析》〔第4版,RichardA.Johnson&DeanW.Wichern,陸璇譯,清華大學出版社.〔郝元濤張巖波第12章實驗設計思考與練習參考答案一、最佳選擇題1.處理因素作用于受試對象的反映須通過觀察指標來表達,則選擇指標的依據(jù)具有〔E.A.客觀性B.特異性C.敏感性D.特異性和敏感性E.A與D2.以前的許多研究表明,血清三酰甘油的含量與冠心病危險性有關,即三酰甘油的含量越高,患冠心病的危險性就越大,有的醫(yī)生以此篩選危險人群.后來的研究表明,冠心病還與其他因素有關,特別是血清中高含量膽固醇和低含量的高密度脂蛋白,它們常與冠心病同時發(fā)生聯(lián)系,采用嚴格的實驗設計平衡了其他因素的作用后,發(fā)現(xiàn)三酰甘油的含量與冠心病發(fā)病的危險性之間的聯(lián)系就不復存在了.這是以下選項中的〔B選項把握得較好所致.A.重復實驗次數(shù)較多B.均衡性原則考慮得周到C.用多因素設計取代單因素設計D.提高實驗人員的技術水平E.嚴格按隨機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論