醫(yī)學統(tǒng)計學歷年考題及答案_第1頁
醫(yī)學統(tǒng)計學歷年考題及答案_第2頁
醫(yī)學統(tǒng)計學歷年考題及答案_第3頁
醫(yī)學統(tǒng)計學歷年考題及答案_第4頁
醫(yī)學統(tǒng)計學歷年考題及答案_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

試題】2010-01-05/山東大學/醫(yī)學院/2009級/研究生/醫(yī)學統(tǒng)計簡答1給了一張表,計算患病率,發(fā)病率,病死率,以及患者哪個年齡段最多,是多少,發(fā)病率哪個年齡段最多,是多少等等2一個單向有序資料(分組變量無序,指標變量有序),用了卡方檢驗,問你對不對?為什么?如果是你,用什么?3假設檢驗的基本思想和原則4給了多元線性回歸的資料(列出了幾個方程的校正決定系數(shù),決定系數(shù),剩余標準差等的數(shù)值),判斷哪個方程回歸效果最好,為什么?5給了甲流的例子,用某藥治療,用了自身對照(用藥前后抗體濃度變化為指標),得出了藥物有效。問你合不合理,為什么?你的設計是什么?6一型錯誤和二型錯誤的區(qū)別和聯(lián)系7什么是抽樣誤差?舉例說明分類資料和數(shù)量資料的抽樣誤差計算1給了健康人的白天和晚上血壓的相關數(shù)值(x和y各自的平均數(shù),和,平方和,以及兩者差值的均數(shù)等)注:計算時直接帶入公式的相關數(shù)值(1)比較白天晚上血壓有無差別(配對t檢驗計算)(2)白天和晚上血壓有無相關(相關分析)(3)如何用白天血壓估計晚上血壓(回歸分析)2多個平均值進行總體假設檢驗。類如幾種藥的作用效果是否相同(方差分析)(也有人說:一個大題,3問,第一問是配對t檢驗計算,第二問相關分析,第三問,回歸分析,都是計算題15分)3樣本率與總體率的比較(u檢驗)(也有人說:配伍組方差分析)20081.列出樣本標準誤的估計值的公式,至少五個(包括兩樣本差值的標準誤,兩樣本率差值的標準誤等)2.醫(yī)學統(tǒng)計中,將正態(tài)分布視為近似正態(tài)分布有哪幾種情況?列出應用條件和公式3.數(shù)值資料的統(tǒng)計描述指標?公式?4.多元回歸模型的基本形式?參數(shù)含義?回歸效果的評價?5.什么叫截尾值?產(chǎn)生原因?舉例說明6.一同學兩樣本率的比較用了卡方檢驗,你有什么建議?若不符合卡方檢驗的應用條件,你又有什么建議?他再比較三個樣本率是否來自同一總體,也用了卡方檢驗,你又有什么建議?7.一個三因素的2X2X2的析因設計的實驗設計及分析思路8.給了一個數(shù)值資料:小鼠的飲食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十個數(shù)值小鼠的體重增加量也有十個值(1)對體重增加量資料進行統(tǒng)計描述(2)求飲食量和體重增加量的關系(3)由體重增加量的樣本估計其代表總體均數(shù)的可信區(qū)間(4)求小鼠體重增加量為X5(就是從體重增加量的那十個値里取了一個)的95%的置信區(qū)間(5)(3)和(4)中的可信區(qū)間有什么差別?20061直線回歸中的b與多元線性回歸中的B有什么區(qū)別?多元線性回歸中,是否可以用B來表示各自變量對因變量的影響?為什么?2數(shù)值變量的完全隨機設計的樣本與總體的比較,配對設計的兩樣本的比較,成組設計兩樣本比較的統(tǒng)計分析思路3統(tǒng)計分析中P.a,B以及1-B的意義4給了一個單向有序資料,統(tǒng)計效應是有序的,他用了t檢驗,問你對不對,為什么?應該用什么統(tǒng)計方法,并寫出統(tǒng)計思路5有一個兩樣本的秩和檢驗的應用題,寫思路,不要求計算6生存分析中,有哪些非參數(shù)檢驗的方法?兩個生存率的比較用什么檢驗?7給了一個實驗,測量抗體.樣本序列抗體滴度效應是否有效11:40+是21:160++是....就是幾個表格,讓你給每個列個表,并且應該用哪些指標來描述.8正態(tài)分布,二項分布,poisson分布的可信區(qū)間9有兩個變量,讓你說出分析它們相關的統(tǒng)計分析思路10有個析因設計的題,讓你寫出檢驗的思路,好象是還要寫出公式.2005(研究生)舉例說明變量及變量類型。(10分)答案:變量:在搜集資料時,首先要根據(jù)研究目的確定同質(zhì)觀察單位,再對每個觀察單位的某項特征進行測量或觀察,該特征稱為變量。如身高、體重、療效等變量按其性質(zhì)可分為兩種類型:(1)數(shù)值變量:其變量值是定量的,表現(xiàn)為數(shù)值的大小,通常是使用儀器或某種尺度測定出來的,多有度量衡單位。如身高(cm)、體重(kg)、心律(次/min)、血壓(mmHg)等。(2)分類變量:表現(xiàn)為互不相容的類別或?qū)傩裕址譃闊o序與有序兩類:a.無序分類變量:是指所分類別或?qū)傩灾g無程度或順序上的差別,如:性別(男、女)血型(A、B、O、AB)等。b.有序分類變量:是指所分類別或?qū)傩灾g有程度或順序上的差別。如尿糖化驗結(jié)果按-、+-、+、++、+++分類,療效按治愈、好轉(zhuǎn)、無效、惡化分組。在假設檢驗過程中,若設定a為0.05,算得統(tǒng)計量后,得p值為0.015,按a=0.05的檢驗水準拒絕無效假設。請對這一結(jié)論做出適當?shù)脑u論,并為此寫例假設檢驗中p值的含義,以及p與a的關系。(10分)答案:P值為0.015小于檢驗水準a(0.05),依據(jù)“小概率事件在一次隨機試驗中認為不可能發(fā)生”的定理,拒絕H0,接受H1,尚可以認為現(xiàn)有樣本所代表的總體與已知總體不相等。P值的含義是指從H0所規(guī)定的總體中隨機抽樣時,獲得等于及大于(負值為等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。若p>a,按a檢驗水準不拒絕H0,可認為現(xiàn)有樣本所代表的總體與已知總體的差別是由抽樣誤差造成的。若p<=a,依據(jù)“小概率事件在一次隨機試驗中認為不可能發(fā)生”的定理,拒絕H0,接受H1;可認為從已知總體中抽到現(xiàn)有樣本的可能性很小,該樣本可能來自另一總體。寫出數(shù)值變量資料中完全隨機設計的多個樣本比較的統(tǒng)計分析思路(不必寫出計算公式)。(15分)答案:(1)統(tǒng)計描述:描述資料的類型:數(shù)值變量資料頻數(shù)表資料的分布:正態(tài)性檢驗服從正態(tài)分布:均數(shù)、標準差(方差);不服從正態(tài)分布,服從對數(shù)正態(tài)分布:幾何均數(shù)、幾何標準差;偏態(tài)分布:中位數(shù)、四分位數(shù)間距(2)統(tǒng)計推斷:資料的設計類型:完全隨機設計的多個樣本比較分布:正態(tài)性檢驗和方差齊性檢驗:(1)如果樣本服從正態(tài)分布且方差齊,就用完全隨機設計的多個樣本的方差分析來作統(tǒng)計推斷;(2)如果樣本不服從正態(tài)分布或者方差不齊,經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布方差齊,再用方差分析推斷;(3)如果變量變換不能使樣本服從正態(tài)分布且方差齊,就用秩和檢驗來做統(tǒng)計推斷。寫出兩變量之間相關關系的分析思路。(15分)答案:(1)繪制散點圖:在直角坐標系內(nèi)繪制散點圖,看兩變量之間有沒有線性趨勢,如果有就做相關分析。如果兩變量都服從雙變量正態(tài)分布,則做直線相關分析;如果不服從線性模型條件要求即不服從或總體未知的資料,則作Spearman等級相關分析?;蛘哌M行曲線擬合。(2)計算直線相關系數(shù)r或者Spearman秩相關系數(shù)rs。(3)對相關系數(shù)作假設檢驗,由于抽樣誤差的存在,即使從p=0的總體中做隨機抽樣誤差,所得的R值也不一定等于零,應對樣本相關系數(shù)做假設檢驗。根據(jù)檢驗目的,檢驗假設為:H0:P=0;H1=/0.常用t檢驗60937034232合計16709071590五、請解釋多元線性回歸分析中R2和的統(tǒng)計學意義。六、什么是隨訪資料中的截尾值?出現(xiàn)截尾值的原因有哪些?七、中國人民解放軍總后衛(wèi)生部軍需裝備研究所研究五種類型的軍裝在兩種環(huán)境、兩種活動狀態(tài)下著裝戰(zhàn)士的主觀熱感覺(用評分表示),且需要進行全搭配實驗,應采用何種設計?需安排幾個實驗組?請寫出設計方案。八、今測得101名30~49歲的正常成年男子的血清總膽固醇(表2)。試根據(jù)此資料進行全面的統(tǒng)計分析。(10分)血清膽固醇(mmol/L)頻數(shù)2.5~13.0~83.5~94.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合計101九、為了比較工人和農(nóng)民的高血壓患病率,隨機調(diào)查了50~59歲的男性工人1281人,其中高血壓患者386人;又隨機調(diào)查了50~59歲的男性農(nóng)民387人,其中高血壓患者65人。問工人與農(nóng)民的高血壓患病率是否相同?十、今測得10名男20歲男青年的身高與前臂長(表3),問二者有無線性相關關系,若有相關關系,其相關關系的密切程度及方向如何。(10分)表310名男20歲男青年的身高與前臂長編號12345678910身高(cm)170173160155173188178183180165前臂長(cm)45424441475047464943可能用到的界值:,,,。2002級臨床醫(yī)學七年制《醫(yī)學統(tǒng)計學》期末考試試題(A)參考答案一、試述標準差與標準誤的區(qū)別和聯(lián)系答:區(qū)別:⑴意義:標準差是描述數(shù)據(jù)分布離散程度的指標;標準誤是樣本統(tǒng)計量的標準差。⑵公式:;(2分)⑶用途:標準差①用于表示數(shù)據(jù)離散程度的大??;②也可用于計算變異系數(shù)、估計頻數(shù)分布、制定參考值范圍、進行質(zhì)量控制;③很多統(tǒng)計處理方法中要用到標準差。標準誤①用于反映抽樣誤差的大??;②計算總體均數(shù)的可信區(qū)間;③統(tǒng)計處理方法的基礎,如t檢驗。聯(lián)系:標準誤與標準差成正比;若標準差固定不變,可通過增加樣本含量來減少抽樣誤差。二、請以完全隨機設計為例說明方差分析的基本思想答:方差分析的基本思想就是把全部觀察值間的變異----總變異按設計和需要分解成兩個或多個組成部分,產(chǎn)生每部分變異的來源可能不同,比較各部分變異的大小。在完全隨機設計資料的方差分析中,是把總變異分解為組間變異和和組內(nèi)變異:分解為和;分解為和,得組間變異和組內(nèi)變異分別為=和=,若各組的來自同一總體,則各組間的變異與組內(nèi)變異一樣,均由隨機誤差所致,=,F(xiàn)值()服從F分布,查F界值表得到相應的P值,然后根據(jù)所取的檢驗水準做出推斷結(jié)論。答案難以統(tǒng)一,只要基本意思表達正確,均應給分,閱卷時需靈活掌握,注意把握尺度。三、在某次假設檢驗中,檢驗水準為0.05,所得的概率為0.001,請就本例分別說明和的意義?答:稱檢驗水準,是預先給定的概率值,它確定了小概率事件的標準;P的含義是指從規(guī)定的總體隨機抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率,即抽樣誤差的概率。將獲得的概率P與檢驗水準進行比較可得出結(jié)論。本例0.05,0.0010.05,拒絕,接受,結(jié)論具有統(tǒng)計學意義,可以認為不同或不等。四、研究人員調(diào)查了2005年某社區(qū)全部居民的全死因死亡及惡性腫瘤死亡人數(shù)(見表1),根據(jù)該資料可以得出哪些統(tǒng)計信息?答:可以得到以下統(tǒng)計信息:各年齡組人口構(gòu)成比、各年齡組全死因構(gòu)成比、惡性腫瘤死因構(gòu)成比和各年齡組惡性腫瘤死亡構(gòu)成比、粗死亡率和年齡別死亡率、惡性腫瘤死亡率和年齡別惡性腫瘤死亡率。(不要求:腫瘤后的死亡人數(shù)占全死因死亡人數(shù)的比例、全死因壽命表死亡概率、全死因壽命表生存概率、去腫瘤死亡后的生存概率、去腫瘤死亡后的尚存人數(shù)、去腫瘤死亡后的死亡人數(shù)、去腫瘤死亡后的生存人年數(shù)、去腫瘤死亡后的生存總?cè)四陻?shù)、去腫瘤死亡后各年齡尚存者的平均預期壽命。)五、請解釋多元線性回歸分析中R2和的統(tǒng)計學意義。答:R2為決定系數(shù),其意義是回歸平方和占總離均差平方和的比例,用R2可定量評價在的總變異中,由變量組建立的線性回歸方程所能解釋的比例。為剩余標準差,可以說明估計值的精確度,剩余標準差越小,表示回歸方程的估計精度越高。六、什么是隨訪資料中的截尾值?出現(xiàn)的原因有哪些?答:由于某種原因使得部分病人不能隨訪到底,稱之為截尾,從起點至截尾點所經(jīng)歷的時間稱為截尾值。出現(xiàn)截尾值的原因主要有隨訪對象失訪、治療措施改變、研究工作結(jié)束時事件尚未發(fā)生等情況。七、研究五種類型的軍裝在兩種環(huán)境、兩種活動狀態(tài)下著裝戰(zhàn)士的主觀熱感覺(用評分表示),且需要進行全搭配實驗,應采用何種設計?需安排幾個實驗組?請寫出設計方案。答:應采用2×2析因設計,需安排4個實驗組。具體設計方案如下:狀態(tài)1狀態(tài)2環(huán)境11234512345環(huán)境21234512345八、今測得101名30~49歲正常成年男子的血清總膽固醇(表2)。據(jù)此資料進行全面的統(tǒng)計分析。(10分)答:⑴由頻數(shù)表可看出,資料近似服從正態(tài)分布,可用均數(shù)和標準差描述其集中趨勢和離散趨勢。,⑵制定95%參考值范圍:⑶估計總體均數(shù)的可信區(qū)間:n=101>50九、為了比較工人和農(nóng)民的高血壓患病率,隨機調(diào)查了50~59歲的男性工人1281人,其中高血壓患者386人;又隨機調(diào)查了50~59歲的男性農(nóng)民387人,其中高血壓患者65人。問工人與農(nóng)民的高血壓患病率是否相同?答:首先將資料整理成下表形式:是否患高血壓是否合計工人3868951281農(nóng)民65322387合計451121716681.建立檢驗假設,確定檢驗水準工人與農(nóng)民的高血壓患病率相同工人與農(nóng)民的高血壓患病率不同2.選定檢驗方法,計算檢驗統(tǒng)計量(可選用下列兩種方法之一):(1)檢驗:(2)u檢驗:⑶確定P值,作出推斷結(jié)論,(或),所以P<0.05。拒絕,接受,可以認為工人和農(nóng)民的高血壓患病率不同。十、今測得10名男20歲男青年的身高與前臂長(表3),問二者有無線性相關關系,若有相關關系,其相關關系的密切程度及方向如何。(10分)⑴作散點圖(略)⑵求相關系數(shù),,⑶相關系數(shù)的假設檢驗①兩變量間無線性相關關系兩變量間有線性相關關系②③所以P<0.05,拒絕,接受,可以認為兩變量間存在線性相關關系,并且呈正相關,即身高越長,前臂長越長。2002級臨床醫(yī)學七年制《醫(yī)學統(tǒng)計學》期末考試題(B卷)試述t分布與u分布的聯(lián)系與區(qū)別。請以完全隨機設計資料為例說明方差分析的基本思想。什么是假設檢驗的檢驗效能?其大小與哪些因素有關系?四、某醫(yī)師對一組高血壓病人在治療過程中作追蹤觀察,記錄其死因,并與未作治療的高血壓病人組作比較,兩組死因構(gòu)成比見表1。有人據(jù)此提出:“高血壓患者經(jīng)過治療雖然可以降低充血性心力衰竭等的病死率,但卻使因冠狀動脈硬化性心臟病和心臟病猝死的死亡危險性增加了?!边@樣的認識是否正確,為什么?死亡原因治療組未治療組充血性心力衰竭4.323.2腦血管病23.239.6尿毒癥9.812.2冠狀動脈病和心臟病猝死48.717.1其它原因14.07.9合計100.0100.0五、請分別解釋Logistic回歸模型和Cox回歸模型中偏回歸系數(shù)的意義。六、生存時間資料有哪些特點?生存分析常用的分析方法有哪些?七、某研究室人員為研究5個不同劑量的甲狀腺提取液對豚鼠甲狀腺重的影響,考慮到豚鼠的種系和體重對觀測指標可能有一定的影響,選用5個種系的豚鼠作實驗,并按5個不同的體重標準選擇受試對象,根據(jù)專業(yè)知識得知,藥液、豚鼠種系、體重之間不存在交互作用。本研究應采用何種設計類型?共需多少只豚鼠?請寫出實驗設計方案。八、今測得101名30~49歲的正常成年男子的血清總膽固醇(表2)。試根據(jù)此資料進行全面的統(tǒng)計分析。(10分)血清膽固醇(mmol/L)頻數(shù)2.5~13.0~83.5~94.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合計101九、某醫(yī)院收集了305例手術患者的資料,其中手術時間≥5小時者242人,感染者13人;手術時間<5小時者63人,感染者7人。試據(jù)此分析手術時間長短對患者切口感染是否有影響?十、某地10名一年級女大學生的胸圍(cm)與肺活量(L)數(shù)據(jù)如表3所示,試進行直線回歸分析。(10分)學生編號12345678910胸圍X72.583.978.388.477.181.778.374.873.779.4肺活量Y2.513.111.913.282.832.863.161.912.983.28可能有用到的界值:,,,。方差分析用F界值:2002級臨床醫(yī)學七年制《醫(yī)學統(tǒng)計學》期末考試試題參考答案(B卷)一、試述t分布與u分布的異同與聯(lián)系(10分)答:相同點:t分布與u分布均為以0為中心的單峰對稱分布。不同點:(1)t分布是一個分布族,t曲線的形狀與自由度有關,自由度越小,t值越分散,曲線越低平;自由度越大,t值越往中間集中,曲線峰值越高。而u分布即標準正態(tài)分布的圖形,是唯一的一條曲線。(2)特定自由度的t分布曲線與u分布曲線相比,峰值低而尾部高翹,相應區(qū)間內(nèi)曲線下的面積小于u分布。聯(lián)系:t分布的極限形式是u分布。隨著自由度的增加,t分布逐漸接近u分布,當自由度時,t分布u分布。二、請以完全隨機設計為例說明方差分析的基本思想答:方差分析的基本思想就是把全部觀察值間的變異----總變異按設計和需要分解成兩個或多個組成部分,產(chǎn)生每部分變異的來源可能不同,比較各部分變異的大小。在完全隨機設計資料的方差分析中,是把總變異分解為組間變異和和組內(nèi)變異:分解為和;分解為和,得組間變異和組內(nèi)變異分別為=和=,若各組的來自同一總體,則各組間的變異與組內(nèi)變異一樣,均由隨機誤差所致,=,F(xiàn)值()服從F分布,查F界值表得到相應的P值,然后根據(jù)所取的檢驗水準做出推斷結(jié)論。三、什么是檢驗效能?其大小與哪些因素有關?(10分)答:檢驗效能是指,在假設檢驗中,當無效假設H0不正確時,用現(xiàn)有統(tǒng)計方法能夠檢驗出其錯誤的能力,其概率用1-表示。其中為犯第二類錯誤即當H0不正確但不拒絕H0的概率。檢驗效能的大小與設定的檢驗水準、樣本含量n、兩總體參數(shù)的差值有關。其它條件一定時,越大,檢驗效能越高;樣本量n越大,檢驗效能越高;兩總體參數(shù)的差值越大,檢驗效能越高。反之,檢驗效能越低。五、請分別解釋Logistic回歸模型和Cox回歸模型中偏回歸系數(shù)的意義。答:Logistic回歸模型中的偏回歸系數(shù)i的意義為,當其它協(xié)變量均不變時,xi每變化一個單位或一個等級時,比數(shù)比的自然對數(shù)(lnORi)平均變化i個單位,可以反映xi對結(jié)局事件的作用強度。Cox回歸模型中的偏回歸系數(shù)i的意義為,當其它協(xié)變量均不變時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論