醫(yī)學(xué)統(tǒng)計學(xué) 總結(jié) 重點 筆記 復(fù)習(xí)資料_第1頁
醫(yī)學(xué)統(tǒng)計學(xué) 總結(jié) 重點 筆記 復(fù)習(xí)資料_第2頁
醫(yī)學(xué)統(tǒng)計學(xué) 總結(jié) 重點 筆記 復(fù)習(xí)資料_第3頁
醫(yī)學(xué)統(tǒng)計學(xué) 總結(jié) 重點 筆記 復(fù)習(xí)資料_第4頁
醫(yī)學(xué)統(tǒng)計學(xué) 總結(jié) 重點 筆記 復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章2選1總體:總體(population)是根據(jù)研究目的確定的同質(zhì)觀察單位(研究對象)的全體,實際上是某一變量值的集合。可分為有限總體和無限總體??傮w中的所有單位都能夠標(biāo)識者為有限總體,反之為無限總體。樣本:從總體中隨機抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。3選1小概率事件:我們把概率很接近于0(即在大量重復(fù)試驗中出現(xiàn)的頻率非常低)的事件稱為小概率事件。P值:P 值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學(xué)根據(jù)顯著性檢驗方法所得到的P 值反應(yīng)結(jié)果真實程度,一般以P 0.05 認為有統(tǒng)計學(xué)意義, P

2、0.01 認為有高度統(tǒng)計學(xué)意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05 或0.01。 P值是:1) 一種概率,一種在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率。2) 拒絕原假設(shè)的最小顯著性水平。3) 觀察到的(實例的) 顯著性水平。4) 表示對原假設(shè)的支持程度,是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法。小概率原理:一個事件如果發(fā)生的概率很小的話,那么可認為它在一次實際實驗中是不會發(fā)生的,數(shù)學(xué)上稱之小概率原理,也稱為小概率的實際不可能性原理。統(tǒng)計學(xué)中,一般認為等于或小于0.05或0.01的概率為小概率。資料的類型(3選1)(1)計量資料:對每個觀察單位用定量的方法測定

3、某項指標(biāo)量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般12有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(shù)(10/L)、脈搏(次/分)、血壓(KPa)等。(2)計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。如調(diào)查某地某時的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。(3)等級資料:將觀

4、察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、+、+等。等級資料與計數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。兩種誤差(2選1)抽樣誤差(sampling error )由于抽樣而引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計數(shù))之間的差異。抽樣誤差是由個體變異或其它隨機因素造成的,是

5、不可避免的,但誤差分布有規(guī)律可循,可進行估計和分析。系統(tǒng)誤差(systematic error):由于測量儀器結(jié)構(gòu)本身的問題、刻度不準(zhǔn)確或測量環(huán)境改變等原因,在多次測量時所產(chǎn)生的,總是偏大或總是偏小的誤差,稱為系統(tǒng)誤差。它帶有規(guī)律性,經(jīng)過校正和處理,通??梢詼p少或消除。統(tǒng)計的步驟(考填空題,四個空)統(tǒng)計工作的步驟設(shè)計:設(shè)計內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。設(shè)計是整個研究中最關(guān)鍵的一環(huán),是今后工作應(yīng)遵循的依據(jù)。收集資料:應(yīng)采取措施使能取得準(zhǔn)確可靠的原始數(shù)據(jù)。整理資料:簡化數(shù)據(jù),使其系統(tǒng)化、條理化,便于進一步分析計算。分析資料:計算有關(guān)指標(biāo),反映事物的綜合特征,闡明事物的內(nèi)在聯(lián)系和

6、規(guī)律。分析資料包括統(tǒng)計描述和統(tǒng)計推斷。實驗設(shè)計的基本原則 (考填空題,三個空)隨機化原則、對照的原則、重復(fù)的原則。2選1參數(shù):參數(shù)()是指總體的統(tǒng)計指標(biāo),如總體均數(shù)、總體率等。總體參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計量估計未知的總體參數(shù)。統(tǒng)計量:統(tǒng)計量()是指樣本的統(tǒng)計指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計量可用來估計總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機變量。第二章頻數(shù)表的制作步驟以及頻數(shù)分布表的用途(問答題)頻數(shù)分布表的編制步驟:例:某市1982年50名7歲男童的身高(cm)資料如下,試編制頻數(shù)表。

7、114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2 120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.71、

8、找出觀察值中的最大值(largest value)、最小值(smallest value),求極差(range)。 極差等于最大值減最小值。本例最大值=128.3,最小值=110.8,則極差=128.3-110.8=17.5(cm )2、確定分組數(shù)和組距(class interval)。組數(shù)的多少是根據(jù)例數(shù)的多少來確定的,以能夠反映出頻數(shù)分布的特征為原則,一般分1015組。組距為相鄰兩組的間隔,組距=極差/組數(shù)。本例擬分10組,則組距=17.5/10=1.752,為劃記方便,可取稍大或稍小的數(shù)(當(dāng)然本例組距也可取1.5)。3、確定組段。第一組段包括要最小值,取較最小值稍小且劃分方便的數(shù),本例取

9、“110”。最后組段包括最大值并寫出其上限值。4、劃記。將各觀察值以劃“正”字的方法,一筆代表一例,劃在相應(yīng)組段中。例如第一個數(shù)l14.4應(yīng)在組段“114”處劃,第二個數(shù)117.2應(yīng)在“116”處劃,以此類推。5、統(tǒng)計各組段的頻數(shù)。全部數(shù)據(jù)劃記完后,清點各組段的人數(shù)。根據(jù)編制出的頻數(shù)表即可了解該數(shù)值變量資料的頻數(shù)分布特征。頻數(shù)分布表的用途1、描述資料的分布特征和分布類型。頻數(shù)分布有兩個重要特征:集中趨勢和離散趨勢。大部分觀察值向某一數(shù)值集中的趨勢稱為集中趨勢,常用平均數(shù)指標(biāo)來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩側(cè)逐漸減少,稱離散趨勢,是個體差異所致,可用一系列的變異指標(biāo)來反映。2

10、、便于進一步計算有關(guān)指標(biāo)或進行統(tǒng)計分析。當(dāng)數(shù)據(jù)較多且需手工計算時,常先編制頻數(shù)表,再進行統(tǒng)計計算。3、發(fā)現(xiàn)特大、特小的可疑值。如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個特大值或特小值,使人懷疑其是否準(zhǔn)確,需進一步檢查和核對并做相應(yīng)處理。4、據(jù)此繪制頻數(shù)分布圖。描述數(shù)據(jù)分布集中趨勢的指標(biāo)和描述數(shù)據(jù)分布離散程度的指標(biāo) (考選擇或者填空) 描述數(shù)據(jù)分布集中趨勢的指標(biāo)算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。 描述數(shù)據(jù)分布離散程度的指標(biāo)極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。正態(tài)分布的特征(考選擇題 、對圖形的影響)服從正態(tài)分布的變量的頻數(shù)分布由 、 完全決定。(1) 是正態(tài)分布的位置參

11、數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 x =為對稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于 。(2) 描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,越大,數(shù)據(jù)分布越分散,越小,數(shù)據(jù)分布越集中。也稱為是正態(tài)分布的形狀參數(shù),越大,曲線越扁平,反之,越小,曲線越瘦高。標(biāo)準(zhǔn)正態(tài)分布(填空)21標(biāo)準(zhǔn)正態(tài)分布是一種特殊的正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的 =0, =1 ,通常用u(或Z)表2示服從標(biāo)準(zhǔn)正態(tài)分布的變量,記為N(0,1)。 正態(tài)分布的應(yīng)用(簡答)某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細胞數(shù)、血紅蛋白量,以及實驗中的隨機誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(biāo)(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換

12、后的新變量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對數(shù)轉(zhuǎn)換后服從正態(tài)分布的指標(biāo),被稱為服從對數(shù)正態(tài)分布。1. 估計頻數(shù)分布 一個服從正態(tài)分布的變量只要知道其均數(shù)與標(biāo)準(zhǔn)差就可根據(jù)公式即可估計任意取值范圍內(nèi)頻數(shù)比例。2. 制定參考值范圍(1)正態(tài)分布法 適用于服從正態(tài)(或近似正態(tài))分布指標(biāo)以及可以通過轉(zhuǎn)換后服從正態(tài)分布的指標(biāo)。(2)百分位數(shù)法 常用于偏態(tài)分布的指標(biāo)。表3-1中兩種方法的單雙側(cè)界值都應(yīng)熟練掌握。3. 質(zhì)量控制:為了控制實驗中的測量(或?qū)嶒灒┱`差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據(jù)是:正常情況下測量(或?qū)嶒灒┱`差服從正態(tài)分布。4. 正態(tài)分布是許多統(tǒng)

13、計方法的理論基礎(chǔ)。 檢驗、方差分析、相關(guān)和回歸分析等多種統(tǒng)計方法均要求分析的指標(biāo)服從正態(tài)分布。許多統(tǒng)計方法雖然不要求分析指標(biāo)服從正態(tài)分布,但相應(yīng)的統(tǒng)計量在大樣本時近似正態(tài)分布,因而大樣本時這些統(tǒng)計推斷方法也是以正態(tài)分布為理論基礎(chǔ)的。醫(yī)學(xué)參考值范圍的制定(計算題 )確定參考值范圍的單雙側(cè):一般生理物質(zhì)指標(biāo)多為雙側(cè)、毒物指標(biāo)則多為單側(cè)。確定百分位點:一般取95%或99%。例題某市 20 歲男學(xué)生 160 人的脈搏數(shù)(次/分鐘),經(jīng)正態(tài)性檢驗服從正態(tài)分布。求得= 76.10,S =9.32。試估計脈搏數(shù)的95%、99%參考值范圍。解:脈搏數(shù)的95%正常值范圍為: ±1.96 S=76.10

14、 ± 1.96(9.32)=57.8394.37脈搏數(shù)的99%正常值范圍為:±2.58 S =76.10 ± 2.58(9.32)=52.05100.37第三章標(biāo)準(zhǔn)誤的概念,計算公式。標(biāo)準(zhǔn)誤:抽樣研究中,樣本統(tǒng)計量與總體參數(shù)間的差別稱為抽樣誤差(sampling error)。統(tǒng)計上用標(biāo)準(zhǔn)誤(standard error,SE)來衡量抽樣誤差的大小,即樣本均數(shù)的標(biāo)準(zhǔn)差,是描述均數(shù)抽樣分布的離散程度及衡量均數(shù)抽樣誤差大小的尺度。t分布的圖形特征及其與正態(tài)分布的區(qū)別(簡答)t分布的圖形特征1以0為中心,左右對稱的單峰分布;2t分布是一簇曲線,其形態(tài)變化與n(確切地說與

15、自由度)大小有關(guān)。自由度越小,t分布曲線越低平;自由度越大,t分布曲線越接近標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線。t分布對應(yīng)于每一個自由度,就有一條t分布曲線,每條曲線都有其曲線下統(tǒng)計量t的分布規(guī)律,計算較復(fù)雜。t 分布與正態(tài)分布比較的區(qū)別t 分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特點:都是單峰、對稱分布;t 分布峰值較低,而尾部較高;隨自由度增大,t 分布趨近與標(biāo)準(zhǔn)正態(tài)分布;當(dāng)趨向,t 分布的極限分布是標(biāo)準(zhǔn)正態(tài)分布。置信區(qū)間和參數(shù)估計 (名解2選1)置信區(qū)間:在統(tǒng)計學(xué)中,一個概率樣本的置信區(qū)間(Confidence interval)是對這個樣本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概

16、率落在測量結(jié)果的周圍的程度。給出的是被測量參數(shù)的測量值的可信程度。1、對于具有特定的發(fā)生概率的隨機變量,其特定的價值區(qū)間-一個確定的數(shù)值范圍(“一個區(qū)間”)。2、在一定置信水平時,以測量結(jié)果為中心,包括總體均值在內(nèi)的可信范圍。3、該區(qū)間包含了參數(shù)真值的可信程度。4、參數(shù)的置信區(qū)間可以通過點估計量構(gòu)造,也可以通過假設(shè)檢驗構(gòu)造。參數(shù)估計:指用樣本指標(biāo)值(統(tǒng)計量)估計總體指標(biāo)值(參數(shù))。參數(shù)估計有兩種方法:點估計和區(qū)間估計??尚艆^(qū)間與參考值范圍的不同點(簡答)應(yīng)注意:可信區(qū)間與參考值范圍的意義、計算公式和用途均不同。1.從意義和用途來看95參考值范圍是指同質(zhì)總體內(nèi)包括95個體值的估計范圍,而總體均數(shù)

17、95可信區(qū)間是指按95可信度估計的總體均數(shù)的所在范圍??尚艆^(qū)間用于估計總體參數(shù),總體參數(shù)只有一個 。參考值范圍用于估計變量值的分布范圍,變量值可能很多甚至無限 。2.從計算公式看若指標(biāo)服從正態(tài)分布,95參考值范圍的公式是:±1.96s。總體均數(shù)95可信區(qū)間的公式是:。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用為0.05,自由度為v的t界值。t檢驗的應(yīng)用條件和類型(填空)t檢驗的應(yīng)用條件:要求各樣本來自相互獨立的正態(tài)總體且各總體方差齊。t檢驗的類型:單樣本t檢驗,獨立t檢驗,配對t檢驗配對設(shè)計和完全隨機設(shè)計(名解2選1)完全隨機設(shè)計(completely random desi

18、gn):完全隨機設(shè)計僅涉及一個處理因素(但可為多水平),故又稱單因素(one-way)設(shè)計。它是將受試對象按隨機化的方法分配到各個處理組中,觀察實驗效應(yīng),臨床試驗中的隨機對照試驗也屬于此類設(shè)計。配對設(shè)計(paired design):是將受試對象按一定條件匹配成對,再隨機分配每對中的兩個受試對象到不同處理組。配對的因素是影響實驗效應(yīng)的主要非處理兇素。假設(shè)檢驗的基本求解步驟或者注意事項。(簡答2選1)假設(shè)檢驗的基本步驟1.建立假設(shè),確定檢驗水準(zhǔn)假設(shè)有零假設(shè)(H0)和備擇假設(shè)(H1)兩個,零假設(shè)又叫作無效假設(shè)或檢驗假設(shè)。H0和H1的關(guān)系是互相對立的,如果拒絕H0,就要接受H1.根據(jù)備擇假設(shè)不同,假

19、設(shè)檢驗有單、雙側(cè)檢驗兩種。檢驗水準(zhǔn)用表示,通常取0.05或0.10.檢驗水準(zhǔn)說明了該檢驗犯第一類錯誤的概率。2.根據(jù)研究目的和設(shè)計類型選擇適合的檢驗方法這里的檢驗方法,是指參數(shù)檢驗方法,有u檢驗、t檢驗和方差分析三種,對應(yīng)于不同的檢驗公式。對雙樣本資料,要注意區(qū)分成組設(shè)計和配對設(shè)計的資料類型。如果資料里有"配成對子"字樣,或者是對同一對象用兩種方法來處理,一般就可以判定是配對設(shè)計資料。3.確定P值并作出統(tǒng)計結(jié)論u檢驗得到的是u統(tǒng)計量或稱u值,t檢驗得到的是t統(tǒng)計量或稱t值。方差分析得到的是F統(tǒng)計量或稱F值。將求得的統(tǒng)計量絕對值與界值相比,可以確定P值。當(dāng)0.05時,u值要和

20、u界值1.96相比較,確定P值。如果u1.96,則P0.05.反之,如u1.96,則P0.05.t值 要和某自由度的t界值相比較,確定P值。如果t值t界值,故P0.05.反之,如tt界值,則P0.05.相同自由度的情況下,單側(cè)檢驗的t界值 要小于雙側(cè)檢驗的t界值,因此有可能出現(xiàn)算得的t值大于單側(cè)t界值,而小于雙側(cè)t界值的情況,即單側(cè)檢驗顯著,雙側(cè)檢驗未必就顯著,反之,雙側(cè)檢驗顯著, 單側(cè)檢驗必然會顯著。即單側(cè)檢驗更容易出現(xiàn)陽性結(jié)論。當(dāng)P0.05時,接受零假設(shè),認為差異無統(tǒng)計學(xué)意義,或者說二者不存在質(zhì)的區(qū)別。當(dāng)P0.05時,拒絕零假設(shè),接受備擇假設(shè),認為差異有統(tǒng) 計學(xué)意義,也可以理解為二者存在質(zhì)

21、的區(qū)別。但即使檢驗結(jié)果是P0.01甚至P0.001,都不說明差異相差很大,只表示更有把握認為二者存在差異。假設(shè)檢驗時應(yīng)注意的事項(一)要有嚴密的抽樣研究設(shè)計;樣本必須是從同質(zhì)總體中隨機抽取的;要保證組間的均衡性和資料的可比性。(二)根據(jù)現(xiàn)有的資料的性質(zhì)、設(shè)計類型、樣本含量大小正確選用檢驗方法。(三)對差別有無統(tǒng)計學(xué)意義的判斷不能絕對化,因檢驗水準(zhǔn)只是人為規(guī)定的界限,是相對的。差別有統(tǒng)計學(xué)意義時,是指無效假設(shè)h0被接受的可能性只有5%或不到5%,甚至不到1%,根據(jù)小概率事件一次不可能拒h0,但尚不能排除有5%或1%出現(xiàn)的可能,所以可能產(chǎn)生第一類錯誤;同樣,若不拒絕h0,可能產(chǎn)生第二類錯誤。(四)

22、統(tǒng)計學(xué)上差別顯著與否,與實際意義是有區(qū)別的。如應(yīng)用某藥治療高血壓,平均降低舒張壓0.5kpa,并得出差別有高度統(tǒng)計學(xué)意義的結(jié)論。從統(tǒng)計學(xué)角度,說明該藥有降壓作用,但實際上,降低0.5kpa是無臨床意義。因此要結(jié)合專業(yè)作出恰如其分的結(jié)論。第一類錯誤與第二類錯誤(名解 2選1)型錯誤又稱第一類錯誤(type error):拒絕了實際上成立的,為“棄真”的錯誤,其概率通常用表示??扇挝惨部扇‰p尾,假設(shè)檢驗時研究者可以根據(jù)需要確定值大小,一般規(guī)定0.05或0.01,其意義為:假設(shè)檢驗中如果拒絕時,發(fā)生型錯誤的概率為5或1,即100次拒絕的結(jié)論中,平均有5次或1次是錯誤的。型錯誤又稱第二類錯誤(typ

23、e error):不拒絕實際上不成立的,為“存?zhèn)巍钡腻e誤,其概率通常用表示。只取單尾,假設(shè)檢驗時值一般不知道,在一定情況下可以測算出,如已知兩總體的差值(如)、樣本含量和檢驗水準(zhǔn)。以下圖說明兩類錯誤:第四章為什么等級資料不可用方差分析?資料不相互獨立方差分析的基本思想 應(yīng)用條件(簡答)方差分析(analysis of variance,ANOVA )的基本思想就是根據(jù)資料的設(shè)計類型,即變異的不同來源將全部觀察值總的離均差平方和(sum of squares of deviations from mean,SS)和自由度分解為兩個或多個部分,除隨機誤差外,其余每個部分的變異可由某個因素的作用(或

24、某幾個因素的交互作用)加以解釋,如各組均數(shù)的變異SS 組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F 分布作出統(tǒng)計推斷,判斷各因素對各組均數(shù)有無影響。方差分析的應(yīng)用條件(1) 各樣本是相互獨立的隨機樣本,且來自正態(tài)分布總體。(2) 各樣本的總體方差相等,即方差齊性(homoscedasticity)。第五章分類資料的統(tǒng)計描述(幾個常用相對數(shù)指標(biāo) 填空題)率(強度相對數(shù),頻率相對數(shù))、構(gòu)成比、相對比應(yīng)用相對數(shù)時應(yīng)注意的問題(簡答題 六條) 計算相對數(shù)的分母一般不宜過小。 分析時不能以構(gòu)成比代替率。 不能用構(gòu)成比的動態(tài)分析代替率的動態(tài)分析。 對觀察單位數(shù)不等的幾個

25、率,不能直接相加求其總率。 在比較相對數(shù)時應(yīng)注意可比性。 對樣本率(或構(gòu)成比)的比較應(yīng)隨機抽樣,并做假設(shè)檢驗。率的標(biāo)準(zhǔn)化的基本思想,應(yīng)注意的問題(分析題)率的標(biāo)準(zhǔn)化的基本思想 :要比較兩個總率時,發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同,而且影響到了總率的結(jié)果,這時就不宜再直接比較總率,而應(yīng)考慮采用標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法的基本思想,就是采用統(tǒng)一的標(biāo)準(zhǔn)(統(tǒng)一的內(nèi)部構(gòu)成)計算出消除內(nèi)部構(gòu)成不同影響后的標(biāo)準(zhǔn)化率(調(diào)整率),然后再進行比較。二、直接標(biāo)準(zhǔn)化法的計算方法當(dāng)已知所比較資料各組率Pi,可選用直接法計算標(biāo)化率。三、間接標(biāo)準(zhǔn)化死亡比的計算方法當(dāng)所比較的資料已知各自某現(xiàn)象總發(fā)生數(shù)r及各分

26、組觀察單位數(shù)時,宜采用間接法計算標(biāo)化率。第六章二項分布,Piosson分布 在什么條件下接近正態(tài)分布(選擇或填空)第七章(考計算題)配對與完全隨機設(shè)計下的四格表的計算列四格表公式選擇給個例題把為研究靜脈曲張是否與肥胖有關(guān),觀察 122 對同胞兄弟,每對同胞兄弟中有一個屬肥胖,另一個屬正常體重,記錄得靜脈曲張發(fā)生情況見表8-2,試分析之。評析這是一個配對設(shè)計的資料,因此用配對檢驗公式計算。第八章參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計(名解 2選1)1 參數(shù)統(tǒng)計樣本所來自的總體分布具有某個已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計分析的目的就是對這些未知的參數(shù)進行估計或檢驗。此類方法稱為參數(shù)統(tǒng)計。2 非參數(shù)統(tǒng)計樣

27、本所來自的總體分布難以用某種函數(shù)式來表達, 還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計分析方法,又稱為無分布型式假定(assumption freestatistics)的統(tǒng)計分析方法。它檢驗的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計不需對總體分布(總體參數(shù))作出特殊假設(shè)。非參數(shù)統(tǒng)計的特點和適用范圍 (簡答)1特點(1)樣本所來自的總體

28、的分布形式為任何形式,甚至是未知的,都能適用。(2)收集資料方便,可用“等級”或“符號”來評定觀察結(jié)果。(3)多數(shù)非參數(shù)方法比較簡便,易于理解和掌握。(4)缺點是損失信息量,適用于參數(shù)統(tǒng)計法的資料用非參數(shù)統(tǒng)計方法進行檢驗將降低檢驗效能。2適用范圍(1)等級資料。(2)偏態(tài)分布資料。當(dāng)觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變量變換仍未達到正態(tài)或近似正態(tài)分布時,宜用非參數(shù)檢驗。(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達到齊性。(4)個別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計工作量大,可采用非參數(shù)統(tǒng)計方法

29、進行初步分析,挑選其中有意義者再進一步分析(包括參數(shù)統(tǒng)計內(nèi)容)。(7)對于一些特殊情況,如從幾個總體所獲得的數(shù)據(jù),往往難以對其原有總體分布作出估計,在這種情況下可用非參數(shù)統(tǒng)計方法。非參數(shù)檢驗的優(yōu)缺點:(簡答)非參數(shù)統(tǒng)計與傳統(tǒng)的參數(shù)統(tǒng)計相比,有以下優(yōu)點:1、非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛。2、多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結(jié)果,因而比較節(jié)約時間。3、大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計學(xué)知識。4、大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用。5

30、、當(dāng)推論多達3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。但非參數(shù)統(tǒng)計方法也有以下缺點:1、由于方法簡單,用的計量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計方法同時使用時,就不如參數(shù)統(tǒng)計方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進行檢驗時,非參數(shù)統(tǒng)計方法與參數(shù)統(tǒng)計方法相比,第類錯誤的概率要大些。2、對于大樣本,如不采用適當(dāng)?shù)慕?,計算可能變得十分?fù)雜。注 意:凡符合或經(jīng)過變換后符合參數(shù)檢驗條件的資料,最好用參數(shù)檢驗。當(dāng)資料不具備參數(shù)檢驗的條件時,非參數(shù)檢驗是一種有效的分析方法。配對設(shè)計的符號秩和檢驗方法(簡答)(1)假設(shè):H0:差值總體中位數(shù)Md=0H1:Md

31、0 =0.05(2)求差值(3)編秩次:依差值的絕對值從小到大編秩次。編秩次時遇差數(shù)等于 0,舍去不計,同時樣本例數(shù)減1;遇絕對值相等差數(shù),符號相同順次編秩次,符號相反取平均秩次,且符號相反。(4)求秩和并確定檢驗統(tǒng)計量:分別求出正負秩次之和,正秩和以 T+表示,負秩和的絕對值以T-表示。T+及T-之和應(yīng)等于 n(n+1)/2,任取T+(或 T-)作檢驗統(tǒng)計量T 。(5)確定 P 值和作出推斷結(jié)論:當(dāng) n50 時,查 T 界值表,得出 P值。若檢驗統(tǒng)計量T值在上、下界值范圍內(nèi),其 P值大于表上方相應(yīng)概率水平;若 T值在上、下界值上若范圍外,其 P值小于表上方相應(yīng)概率水平。第九章線性相關(guān)系數(shù)(名

32、解)線性相關(guān)系數(shù):表示兩個變數(shù)線性相關(guān)方向及程度的統(tǒng)計數(shù)或參數(shù)。又叫直線相關(guān)系數(shù),簡稱相關(guān)系數(shù)。,|R|的極值為1,|R|越大(接近1),則直線關(guān)系越好。線性相關(guān)系數(shù)取值范圍(填空)-1r1樣本相關(guān)系數(shù) r的假設(shè)檢驗(填空題)(1)r 界值表法;(2)t檢驗法。線性相關(guān)或回歸應(yīng)用應(yīng)注意的問題(簡答)作回歸分析和相關(guān)分析時要有實際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸、相關(guān)分析,必須對兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認識。在進行回歸分析和相關(guān)分析之前,應(yīng)繪制散點圖。但觀察點的分布有直線趨勢時,才適宜作回歸、相關(guān)分析。如果散點圖呈明顯曲線趨勢,應(yīng)使之直線化再行分析。散點圖還能提示資料有無可疑異常點。直線回歸方程的應(yīng)用范圍一般以自變量的取值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論