版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章2選1總體:總體(population )是根據(jù)研究目的確定的同質(zhì)觀察單位(研究對(duì)象)的全體, 實(shí)際上是某一變量值的集合??煞譃橛邢蘅傮w和無限總體??傮w中的所有單位都能夠標(biāo)識(shí) 者為有限總體,反之為無限總體??傮wpopulation根據(jù)研究目的而確定的同質(zhì)觀察單位的全體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測(cè)量結(jié)果的集合稱為樣本( sample)。樣 本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。樣本sample從總體中隨機(jī)抽得的部分觀察單位,其實(shí)測(cè)值的集合。3選1小概率事件:我們把概率很接近于0 (即在大量重復(fù)試驗(yàn)中出現(xiàn)的頻率非常低)的事件稱為小概率事件。p值:p值
2、即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得 到的p值反應(yīng)結(jié)果真實(shí)程度,一般以 p < 0.05認(rèn)為有統(tǒng)計(jì)學(xué)意義,p <0.01認(rèn)為有高度統(tǒng)計(jì)學(xué)意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05或0.01。p值是:1) 一種概率,一種在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率。2)拒絕原假設(shè)的最小顯著性水平。3)觀察到的(實(shí)例的)顯著性水平。4)表示對(duì)原假設(shè)的支持程度,是用于確定是否應(yīng)該拒絕原假設(shè)的另一種方法。小概率原理:一個(gè)事件如果發(fā)生的概率很小的話,那么可認(rèn)為它在一次實(shí)際實(shí)驗(yàn)中是 不會(huì)發(fā)生的,數(shù)學(xué)上稱之小概率原理,也稱為小概率的實(shí)際
3、不可能性原理。統(tǒng)計(jì)學(xué)中,一 般認(rèn)為等于或小于 0.05或0.01的概率為小概率。資料的類型(3選1)(1)計(jì)量資料:對(duì)每個(gè)觀察單位用定量的方法測(cè)定某項(xiàng)指標(biāo)量的大小,所得的資料稱 為計(jì)量資料(measurement data )。計(jì)量資料亦稱定量資料、測(cè)量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(1012/l)、脈搏(次/分)、血壓(kpa)等。計(jì)量資料measurement data 定量資料 quantitative data數(shù)值變量資料numericalvariable為觀測(cè)每個(gè)觀察單位某項(xiàng)指標(biāo)的大小,而獲得的資料。(2
4、)計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料 (count data )。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相 容的類別或?qū)傩?。如調(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、 無效的人數(shù);調(diào)查一批少數(shù)民族居民的a、b、ar o四種血型的人數(shù)等。計(jì)量資料enumeration data 定性資料qualitative data無序分類變量資料 unorderedcategorical variable名義變量資料 nominal variable為將觀察單位按某種屬性或類別分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。(3
5、)等級(jí)資料:將觀察單位按測(cè)量結(jié)果的某種屬性的不同程度分組,所得各組的觀察 單位數(shù),稱為等級(jí)資料(ordinal data )。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可 分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但 這種差別卻不能準(zhǔn)確測(cè)量;一批腎病患者尿蛋白含量的測(cè)定結(jié)果分為+、+、+等。等級(jí)資料ranked data 半定量資料semi-quantitative data有序分類變量 ordinalcategorical variable 資料為將觀察單位按某種屬性的不同程度分成等級(jí)后分組計(jì)數(shù),分類匯總各組觀察單位后而得到的資料。等級(jí)資料與計(jì)數(shù)資料不同:屬性分
6、組有程度差別,各組按大小順序排列。等級(jí)資料與計(jì)量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。兩種誤差(2選1)抽樣誤差(sampling error )由于抽樣而引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計(jì)數(shù))之間的差異。抽樣誤差是由個(gè)體變異或其它隨機(jī)因素造成的,是不可避免的,但誤差分布 有規(guī)律可循,可進(jìn)行估計(jì)和分析。系統(tǒng)誤差(systematic error ):由于測(cè)量?jī)x器結(jié)構(gòu)本身的問題、刻度不準(zhǔn)確或測(cè)量環(huán)境改變等原因,在多次測(cè)量時(shí)所產(chǎn)生的,總是偏大或總是偏小的誤差 ,稱為系統(tǒng)誤差。它帶 有規(guī)律性,經(jīng)過校正和處理,通??梢詼p少或消除。統(tǒng)計(jì)的步驟(考填空題,四個(gè)空)統(tǒng)計(jì)工作的步驟1 .設(shè)
7、計(jì):設(shè)計(jì)內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。設(shè)計(jì)是整個(gè) 研究中最關(guān)鍵的一環(huán),是今后工作應(yīng)遵循的依據(jù)。2 .收集資料:應(yīng)采取措施使能取得準(zhǔn)確可靠的原始數(shù)據(jù)。3 .整理資料:簡(jiǎn)化數(shù)據(jù),使其系統(tǒng)化、條理化,便于進(jìn)一步分析計(jì)算。4 .分析資料:計(jì)算有關(guān)指標(biāo),反映事物的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。分析資料包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。實(shí)驗(yàn)設(shè)計(jì)的基本原則(考填空題,三個(gè)空)隨機(jī)化原則、對(duì)照的原則、重復(fù)的原則。2選1參數(shù):參數(shù)(p a r a m a t e r )是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的
8、樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。統(tǒng)計(jì)量:統(tǒng)計(jì)量(statistic)是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率 等。樣本統(tǒng)計(jì)量可用來估計(jì)總體參數(shù)??傮w參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。第二章頻數(shù)表的制作步驟以及頻數(shù)分布表的用途(問答題)頻數(shù)分布表的編制步驟:例:某市1982年50名7歲男童的身高(cm)資料如下,試編制頻數(shù)表。114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1123.5118.3120.3116.2114.7119.7114.8119.6113.2120.0119.8116.8119.8122.51
9、19.7120.7114.3122.0117.0122.55 19.7124.9126.1120.0124.6120.0121.5114.3124.1117.26 20.2120.8126.6121.5126.1117.7124.1128.37 21.8118.71、找出觀察值中的最大值(largest value )、最小值(smallest value ),求極差 (range )。極差等于最大值減最小值。本例最大值=128.3 ,最小值=110.8 ,則極差=128.3-110.8=17.5(cm )2、確定分組數(shù)和組距(class interval )。組數(shù)的多少是根據(jù)例數(shù)的多少來確定
10、的,以能夠反映出頻數(shù)分布的特征為原則,一般 分10 15組。組距為相鄰兩組的間隔,組距=極差/組數(shù)。本例擬分10組,則組距=17.5/10=1.75弋2,為劃記方便,可取稍大或稍小的數(shù)(當(dāng)然本例組距也可取1.5)。3、確定組段。第一組段包括要最小值,取較最小值稍小且劃分方便的數(shù),本例取“110”。最后組段包括最大值并寫出其上限值。4、劃記。將各觀察值以劃“正”字的方法,一筆代表一例,劃在相應(yīng)組段中。例如第一個(gè)數(shù)l14.4應(yīng)在組段“ 114”處劃,第二個(gè)數(shù)117.2應(yīng)在“ 116”處劃,以此類推。5、統(tǒng)計(jì)各組段的頻數(shù)。全部數(shù)據(jù)劃記完后,清點(diǎn)各組段的人數(shù)。根據(jù)編制出的頻數(shù)表即可了解該數(shù)值變量資料的
11、頻數(shù)分布特征。頻數(shù)分布表的用途1、描述資料的分布特征和分布類型。頻數(shù)分布有兩個(gè)重要特征:集中趨勢(shì)和離散趨勢(shì)。大部分觀察值向某一數(shù)值集中的趨勢(shì)稱為集中趨勢(shì),常用平均數(shù)指標(biāo)來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩 側(cè)逐漸減少,稱離散趨勢(shì),是個(gè)體差異所致,可用一系列的變異指標(biāo)來反映。2、便于進(jìn)一步計(jì)算有關(guān)指標(biāo)或進(jìn)行統(tǒng)計(jì)分析。當(dāng)數(shù)據(jù)較多且需手工計(jì)算時(shí),常先編制頻數(shù) 表,再進(jìn)行統(tǒng)計(jì)計(jì)算。3、發(fā)現(xiàn)特大、特小的可疑值。如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個(gè)組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個(gè)特大值或特小值,使人懷疑其是否準(zhǔn)確,需進(jìn)一步檢查和核對(duì)并做相應(yīng)處理。4、據(jù)此繪制頻數(shù)分布圖。描述數(shù)據(jù)分布集中趨勢(shì)的
12、指標(biāo)和描述數(shù)據(jù)分布離散程度的指標(biāo)(考選擇或者填空)2 .描述數(shù)據(jù)分布集中趨勢(shì)的指標(biāo)算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。3 .描述數(shù)據(jù)分布離散程度的指標(biāo)極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。正態(tài)分布的特征(考選擇題u、(t對(duì)圖形的影響)服從正態(tài)分布的變量的頻數(shù)分布由0 、b完全決定。(1) u是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢(shì)位置。正態(tài)分布以x =u為對(duì)稱軸,左右完全對(duì)稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于 u。(2) b描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,b越大,數(shù)據(jù)分布越分散,b越小,據(jù)分布越集中。b也稱為是正態(tài)分布的形狀參數(shù),b越大,曲線越扁平,反之,b越小,曲線越瘦高。標(biāo)準(zhǔn)
13、正態(tài)分布(填空)1 .標(biāo)準(zhǔn)正態(tài)分布是一種特殊的正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的u0, (t21,通常用u (或z)表示服從標(biāo)準(zhǔn)正態(tài)分布的變量,記為un (0, 12)。正態(tài)分布的應(yīng)用(簡(jiǎn)答)某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量,以及實(shí)驗(yàn)中的隨機(jī)誤差, 呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(biāo)(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換后的新變 量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對(duì)數(shù)轉(zhuǎn)換后服從正態(tài)分布 的指標(biāo),被稱為服從對(duì)數(shù)正態(tài)分布。2 .估計(jì)頻數(shù)分布一個(gè)服從正態(tài)分布的變量只要知道其均數(shù)與標(biāo)準(zhǔn)差就可根據(jù)公式即 可估計(jì)任意取值范圍內(nèi)頻數(shù)比例。3 .制定參考值范圍(1)正態(tài)分布法 適
14、用于服從正態(tài)(或近似正態(tài))分布指標(biāo)以及可以通過轉(zhuǎn)換后服從 正態(tài)分布的指標(biāo)。(2)百分位數(shù)法 常用于偏態(tài)分布的指標(biāo)。表 3-1中兩種方法的單雙側(cè)界值都應(yīng)熟練 掌握。4 .質(zhì)量控制:為了控制實(shí)驗(yàn)中的測(cè)量 (或?qū)嶒?yàn))誤差,常以 作為上、下警戒值,以 作 為上、下控制值。這樣做的依據(jù)是:正常情況下測(cè)量(或?qū)嶒?yàn))誤差服從正態(tài)分布。5 .正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)。檢驗(yàn)、方差分析、相關(guān)和回歸分析等多種統(tǒng)計(jì)方法均要求分析的指標(biāo)服從正態(tài)分布。許多統(tǒng)計(jì)方法雖然不要求分析指標(biāo)服從正態(tài)分 布,但相應(yīng)的統(tǒng)計(jì)量在大樣本時(shí)近似正態(tài)分布,因而大樣本時(shí)這些統(tǒng)計(jì)推斷方法也是以正 態(tài)分布為理論基礎(chǔ)的。醫(yī)學(xué)參考值范圍的制定(
15、計(jì)算題)確定參考值范圍的單雙側(cè):一般生理物質(zhì)指標(biāo)多為雙側(cè)、毒物指標(biāo)則多為單側(cè)。確定百分位點(diǎn):一般取 95曬99%表3t常用參考值范闈的制定概率 (%)正態(tài)分布法白分位效法雙側(cè)單側(cè)雙惻單惻上 限下限上限9。t+ 1.645x-1.28s7+1,2854°%外了 士1565x-1.64sx+ 1.64599x + 2.5hsx-23354例題 某市20歲男學(xué)生160人的脈搏數(shù)(次/分鐘),經(jīng)正態(tài)性檢驗(yàn)服從正態(tài)分布。求得 八二 76.10, s =9.32 。試估計(jì)脈搏數(shù)的 95% 99嗾考值范圍。解:脈搏數(shù)的 95%e常值范圍為:、± 1.96 s=76.10 ± 1
16、.96 (9.32 )=57.83 -94.37脈搏數(shù)的99%e常值范圍為:±2.58 s =76.10± 2.58 (9.32 ) =52.05 100.37第三章標(biāo)準(zhǔn)誤的概念,計(jì)算公式。標(biāo)準(zhǔn)誤開:抽樣研究中,樣本統(tǒng)計(jì)量與總體參數(shù)間的差別稱為抽樣誤差( samplingerror )。統(tǒng)計(jì)上用標(biāo)準(zhǔn)誤(standard error , se)來衡量抽樣誤差的大小,即樣本均數(shù)的 標(biāo)準(zhǔn)差,是描述均數(shù)抽樣分布的離散程度及衡量均數(shù)抽樣誤差大小的尺度。標(biāo)準(zhǔn)差表4-1均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)注主的區(qū)別均數(shù)的標(biāo)注誤意義記法反映一組數(shù)據(jù)的離散情況c7 (樣木估計(jì)侑5)計(jì)算反映了的抽樣誤差大小 仃7
17、千本估if值擰皿方法增大樣本含量可減小標(biāo)準(zhǔn)誤。個(gè)體差井或自然變片,不能通過統(tǒng)計(jì)寧法來控制t分布的圖形特征及其與正態(tài)分布的區(qū)別(簡(jiǎn)答)t分布的圖形特征1 .以0為中心,左右對(duì)稱的單峰分布;2 . t分布是一簇曲線,其形態(tài)變化與n (確切地說與自由度 y )大小有關(guān)。自由度 y越小,t分布曲線越低平;自由度 v越大,t分布曲線越接近標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線。f(t)-5-4-3-2-101234t分布對(duì)應(yīng)于每一個(gè)自由度 v ,就有一條t分布曲線,每條曲線都有其曲線下統(tǒng)計(jì)量t的分布規(guī)律,計(jì)算較復(fù)雜。t分布與正態(tài)分布比較的區(qū)別t分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特點(diǎn):都是單峰、對(duì)稱分布; t分布峰值較低,
18、 而尾部較高;隨自由度增大, t分布趨近與標(biāo)準(zhǔn)正態(tài)分布;當(dāng) y趨向8, t分布的極限 分布是標(biāo)準(zhǔn)正態(tài)分布。置信區(qū)間和參數(shù)估計(jì)(名解2選1)置信區(qū)間:在統(tǒng)計(jì)學(xué)中,一個(gè)概率樣本的置信區(qū)間( confidence interval )是對(duì)這個(gè) 樣本的某個(gè)總體參數(shù)的區(qū)間估計(jì)。置信區(qū)間展現(xiàn)的是這個(gè)參數(shù)的真實(shí)值有一定概率落在測(cè) 量結(jié)果的周圍的程度。給出的是被測(cè)量參數(shù)的測(cè)量值的可信程度。1、對(duì)于具有特定的發(fā)生概率的隨機(jī)變量,其特定的價(jià)值區(qū)間- 一個(gè)確定的數(shù)值范圍(“一個(gè)區(qū)間”)。2、在一定置信水平時(shí),以測(cè)量結(jié)果為中心,包括總體均值在內(nèi)的可信范圍。3、該區(qū)間包含了參數(shù) 0真值的可信程度。4、參數(shù)的置信區(qū)間可以
19、通過點(diǎn)估計(jì)量構(gòu)造,也可以通過假設(shè)檢驗(yàn)構(gòu)造。參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。參數(shù)估計(jì)有兩種方 法:點(diǎn)估計(jì)和區(qū)間估計(jì)。可信區(qū)間與參考值范圍的不同點(diǎn)(簡(jiǎn)答)應(yīng)注意:可信區(qū)間與參考值范圍的意義、計(jì)算公式和用途均不同。1 .從意義和用途來看95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個(gè)體值的估計(jì)范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計(jì)的總體均數(shù)的所在范圍??尚艆^(qū)間用于估計(jì)總體參數(shù),總體參數(shù)只有 一個(gè)。參考值范圍用于估計(jì)變量值的分布范圍,變量值可能很多甚至無限。2 .從計(jì)算公式看若指標(biāo)服從正態(tài)分布,95%參考值范圍的公式是:x ± 1.96s。總體均數(shù)95%可信
20、區(qū)間的公式是:7建'。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用 1.96 ,后者用“為0.05 ,自由度為v的t界值。t檢驗(yàn)的應(yīng)用條件和類型(填空)t檢驗(yàn)的應(yīng)用條件:要求各樣本來自相互獨(dú)立的正態(tài)總體且各總體方差齊。t檢驗(yàn)的類型:?jiǎn)螛颖?t檢驗(yàn),獨(dú)立t檢驗(yàn),配對(duì)t檢驗(yàn)配對(duì)設(shè)計(jì)和完全隨機(jī)設(shè)計(jì)(名解2選1)完全隨機(jī)設(shè)計(jì)(completely random design ):完全隨機(jī)設(shè)計(jì)僅涉及一個(gè)處理因素(但可 為多水平),故又稱單因素(one-way)設(shè)計(jì)。它是將受試對(duì)象按隨機(jī)化的方法分配到各個(gè) 處理組中,觀察實(shí)驗(yàn)效應(yīng),臨床試驗(yàn)中的隨機(jī)對(duì)照試驗(yàn)也屬于此類設(shè)計(jì)。配對(duì)設(shè)計(jì)(paired design
21、):是將受試對(duì)象按一定條件匹配成對(duì),再隨機(jī)分配每對(duì)中的兩 個(gè)受試對(duì)象到不同處理組。配對(duì)的因素是影響實(shí)驗(yàn)效應(yīng)的主要非處理兇素。假設(shè)檢驗(yàn)的基本求解步驟或者注意事項(xiàng)。(簡(jiǎn)答 2選1)假設(shè)檢驗(yàn)的基本步驟1 .建立假設(shè),確定檢驗(yàn)水準(zhǔn) a假設(shè)有零假設(shè)(h0)和備擇假設(shè)(h1)兩個(gè),零假設(shè)又叫作無效假設(shè)或檢驗(yàn)假設(shè)。h0和h1的關(guān)系是互相對(duì)立的,如果拒絕h0,就要接受h1.根據(jù)備擇假設(shè)不同,假設(shè)檢驗(yàn)有單、雙側(cè)檢驗(yàn)兩種。檢驗(yàn)水準(zhǔn)用a表示,通常取0.05或0.10.檢驗(yàn)水準(zhǔn)說明了該檢驗(yàn)犯第一類錯(cuò)誤的概率。2 .根據(jù)研究目的和設(shè)計(jì)類型選擇適合的檢驗(yàn)方法這里的檢驗(yàn)方法,是指參數(shù)檢驗(yàn)方法,有u檢驗(yàn)、t檢驗(yàn)和方差分析三種
22、,對(duì)應(yīng)于不同的檢驗(yàn)公式。對(duì)雙樣本資料,要注意區(qū)分成組設(shè)計(jì)和配對(duì)設(shè)計(jì)的資料類型。如果資料里有"配成對(duì)子”字樣,或者是對(duì)同一對(duì)象用兩種方法來處理,一般就可以判定是配對(duì)設(shè)計(jì)資料。3 .確定p值并作出統(tǒng)計(jì)結(jié)論u檢驗(yàn)得到的是u統(tǒng)計(jì)量或稱u值,t檢驗(yàn)得到的是t統(tǒng)計(jì)量或稱t值。方差分析得到的是f統(tǒng)計(jì)量或稱f值。將求得的統(tǒng)計(jì)量絕對(duì)值與界值相比,可以確定p值。當(dāng)a =0.05時(shí),u值要和u界值1.96相比較,確定p值。如果u<1.96 ,則p>0.05.反之, 如u>1.96 ,則pv 0.05.t值要和某自由度的t界值相比較,確定 p值。如果t值vt界 值,故p>0.05.反
23、之,如t>t界值,則p< 0.05.相同自由度的情況下,單側(cè)檢驗(yàn)的 t界 值 要小于雙側(cè)檢驗(yàn)的t界值,因此有可能出現(xiàn)算得的 t值大于單側(cè)t界值,而小于雙側(cè)t 界值的情況,即單側(cè)檢驗(yàn)顯著,雙側(cè)檢驗(yàn)未必就顯著,反之,雙側(cè)檢驗(yàn)顯著,單側(cè)檢驗(yàn)必然會(huì)顯著。即單側(cè)檢驗(yàn)更容易出現(xiàn)陽(yáng)性結(jié)論。當(dāng)p>0.05時(shí),接受零假設(shè),認(rèn)為差異無統(tǒng)計(jì)學(xué)意義,或者說二者不存在質(zhì)的區(qū)別。當(dāng)p<0.05時(shí),拒絕零假設(shè),接受備擇假設(shè),認(rèn)為差異有統(tǒng)計(jì)學(xué)意義,也可以理解為二者存在質(zhì)的區(qū)別。但即使檢驗(yàn)結(jié)果是p< 0.01甚至p< 0.001 ,都不說明差異相差很大,只表示更有把握認(rèn)為二者存在差異。假設(shè)檢
24、驗(yàn)時(shí)應(yīng)注意的事項(xiàng)(一)要有嚴(yán)密的抽樣研究設(shè)計(jì);樣本必須是從同質(zhì)總體中隨機(jī)抽取的;要保證組間的均 衡性和資料的可比性。(二)根據(jù)現(xiàn)有的資料的性質(zhì)、設(shè)計(jì)類型、樣本含量大小正確選用檢驗(yàn)方法。(三)對(duì)差別有無統(tǒng)計(jì)學(xué)意義的判斷不能絕對(duì)化,因檢驗(yàn)水準(zhǔn)只是人為規(guī)定的界限,是相 對(duì)的。差別有統(tǒng)計(jì)學(xué)意義時(shí),是指無效假設(shè) h0被接受的可能性只有 5煙不到5%甚至不 到1%根據(jù)小概率事件一次不可能拒h0,但尚不能排除有 5m 1%出現(xiàn)的可能,所以可能產(chǎn)生第一類錯(cuò)誤;同樣,若不拒絕 h0,可能產(chǎn)生第二類錯(cuò)誤。(四)統(tǒng)計(jì)學(xué)上差別顯著與否,與實(shí)際意義是有區(qū)別的。如應(yīng)用某藥治療高血壓,平均降 低舒弓壓0.5kpa ,并得出
25、差別有高度統(tǒng)計(jì)學(xué)意義的結(jié)論。從統(tǒng)計(jì)學(xué)角度,說明該藥有降壓 作用,但實(shí)際上,降低 0.5kpa是無臨床意義。因此要結(jié)合專業(yè)作出恰如其分的結(jié)論。第一類錯(cuò)誤與第二類錯(cuò)誤(名解2選1)i型錯(cuò)誤又稱第一類錯(cuò)誤(type i error ):拒絕了實(shí)際上成立的 風(fēng),為“棄真” 的錯(cuò)誤,其概率通常用a表示。a可取單尾也可取雙尾,假設(shè)檢驗(yàn)時(shí)研究者可以根據(jù)需要確定置值大小,一般規(guī)定 a =0.05或a = 0.01,其意義為:假設(shè)檢驗(yàn)中如果拒絕m時(shí),發(fā)生i型錯(cuò)誤的概率為5%或1%,即100次拒絕4的結(jié)論中,平均有5次或1次是錯(cuò)誤的。n型錯(cuò)誤又稱第二類錯(cuò)誤(type n error ):不拒絕實(shí)際上不成立的 乩,
26、為“存?zhèn)巍?的錯(cuò)誤,其概率通常用 力表示。6只取單尾,假設(shè)檢驗(yàn)時(shí) s值一般不知道,在一定情況下可以測(cè)算出,如已知兩總體的差值孑(如乂-肉)、樣本含量m和檢驗(yàn)水準(zhǔn)任。以下圖說明兩類錯(cuò)誤:從兩總體中抽樣樣本均數(shù)與總體均數(shù)匕索假設(shè)檢驗(yàn)示意第四章為什么等級(jí)資料不可用方差分析?資料不相互獨(dú)立方差分析的基本思想應(yīng)用條件(簡(jiǎn)答)方差分析(analysis of variance , anova)的基本思想就是根據(jù)資料的設(shè)計(jì)類型, 即變異的不同來源將全部觀察值總的離均差平方和( sum of squares of deviations from mean, ss)和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其
27、余每個(gè)部分的變異可由某 個(gè)因素的作用(或某幾個(gè)因素的交互作用)加以解釋,如各組均數(shù)的變異ss組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助f分布作出統(tǒng)計(jì)推斷,判斷各因素對(duì)各組均數(shù)有無影響。方差分析的應(yīng)用條件(1)各樣本是相互獨(dú)立的隨機(jī)樣本,且來自正態(tài)分布總體。(2) 各樣本的總體方差相等,即方差齊性(homoscedasticity)。第五章分類資料的統(tǒng)計(jì)描述(幾個(gè)常用相對(duì)數(shù)指標(biāo)填空題)率(強(qiáng)度相對(duì)數(shù),頻率相對(duì)數(shù))、構(gòu)成比、相對(duì)比應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問題(簡(jiǎn)答題六條)計(jì)算相對(duì)數(shù)的分母一般不宜過小。 分析時(shí)不能以構(gòu)成比代替率。 不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分
28、析。(4)對(duì)觀察單位數(shù)不等的幾個(gè)率,不能直接相加求其總率。在比較相對(duì)數(shù)時(shí)應(yīng)注意可比性。(6)對(duì)樣本率(或構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。率的標(biāo)準(zhǔn)化的基本思想,應(yīng)注意的問題(分析題)率的標(biāo)準(zhǔn)化的基本思想:要比較兩個(gè)總率時(shí),發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同, 而且影響到了總率的結(jié)果,這時(shí)就不宜再直接比較總率,而應(yīng)考慮采用標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法的基本思想,就是采用統(tǒng)一的標(biāo)準(zhǔn)(統(tǒng)一的內(nèi)部構(gòu)成)計(jì)算出消除內(nèi)部構(gòu)成不同影響后的標(biāo)準(zhǔn)化率(調(diào)整率),然后再進(jìn)行比較。二、直接標(biāo)準(zhǔn)化法的計(jì)算方法當(dāng)已知所比較資料各組率 pi,可選用直接法計(jì)算標(biāo)化率。三、間接標(biāo)準(zhǔn)化死亡比的計(jì)算方法當(dāng)所比較
29、的資料已知各自某現(xiàn)象總發(fā)生數(shù)r及各分組觀察單位數(shù)時(shí),宜采用間接法計(jì)算標(biāo)化率。第八早二項(xiàng)分布,piosson分布在什么條件下接近正態(tài)分布(選擇或填空)特定條件下,二項(xiàng)分布、p口感電分布可近似于某種其它的分布,這一特性拓寬了它們的應(yīng) 用范圍二項(xiàng)分布的正態(tài)近似:當(dāng)盯較大,卜不接近。也不接近i時(shí)|二項(xiàng)分布b 5,共)近似正 態(tài)分布n (口二r)=二項(xiàng)分布的p。辿。n分布近似:當(dāng)打很大,亢很小,用r =人為一常數(shù)時(shí),二項(xiàng)分布近似于pois son 分布二poisson分布的正態(tài)近似:poisson分布p ( u ),當(dāng).相當(dāng)大時(shí)(220),其分布近似于正 態(tài)分布°第七章(考計(jì)算題)配對(duì)與完全隨
30、機(jī)設(shè)計(jì)下的四格表的計(jì)算列四格表表8/2配對(duì)四格表的形式a處理 _b處理+ -+abcd公式選擇給個(gè)例題把為研究靜脈曲張是否與肥胖有關(guān),觀察122對(duì)同胞兄弟,每對(duì)同胞兄弟中有一個(gè)屬肥胖,另一個(gè)屬正常體重,記錄得靜脈曲張發(fā)生情況見表8-2,試分析之。表s-2122對(duì)同胞兄弟靜肱曲張發(fā)生情況正常體重.合計(jì)發(fā)生未發(fā)生發(fā)生19524未發(fā)生12s698合計(jì)3191122評(píng)析這是一個(gè)配對(duì)設(shè)計(jì)的資料,因此用配對(duì) , 檢驗(yàn)公式計(jì)算?!暗姆逝终吲c正常體重者的靜脈曲張發(fā)生情況無差別肥胖者與正常體重者的靜脈曲張發(fā)生情況不同a =0-052 花十(|5-】2|-1丫v1 = != ! = 2j2 t v = 1兒 方+
31、c5 + 12x:=2.1l<zo5j , q0.05.尚不能認(rèn)為靜脈曲張與肥胖有關(guān)°第八章參數(shù)統(tǒng)計(jì)與非參數(shù)統(tǒng)計(jì)(名解2選1)1 .參數(shù)統(tǒng)計(jì)樣本所來自的總體分布具有某個(gè)已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計(jì)分 析的目的就是對(duì)這些未知的參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。此類方法稱為參數(shù)統(tǒng)計(jì)。2 .非參數(shù)統(tǒng)計(jì)樣本所來自的總體分布難以用某種函數(shù)式來表達(dá),還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布 的具體形式的統(tǒng)計(jì)方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計(jì)法(non-parametric statistics), 或稱
32、為不拘分布 ( distribution-free statistics) 的統(tǒng)計(jì)分析方法,又稱為無分布型式假定( assumption free statistics )的統(tǒng)計(jì)分析方法。 它檢驗(yàn)的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計(jì)不需對(duì)總體分布(總體參數(shù))作出特殊假設(shè)。非參數(shù)統(tǒng)計(jì)的特點(diǎn)和適用范圍(簡(jiǎn)答)1 .特點(diǎn)(1)樣本所來自的總體的分布形式為任何形式,甚至是未知的,都能適用。(2)收集資料方便,可用“等級(jí)”或“符號(hào)”來評(píng)定觀察結(jié)果。(3)多數(shù)非參數(shù)方法比較簡(jiǎn)便,易于理解和掌握。(4)缺點(diǎn)是損失信息量,適用于參數(shù)統(tǒng)計(jì)法的資料用非參數(shù)統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)將降低 檢驗(yàn)效能。2 .適用范圍(1)等級(jí)資料
33、。(2)偏態(tài)分布資料。當(dāng)觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變 量變換仍未達(dá)到正態(tài)或近似正態(tài)分布時(shí),宜用非參數(shù)檢驗(yàn)。(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達(dá)到齊性。(4)個(gè)別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計(jì)工作量大,可采用非參數(shù)統(tǒng)計(jì)方法進(jìn)行初步分析,挑選其中有意義者再進(jìn)一步分析(包括參數(shù)統(tǒng)計(jì)內(nèi)容)。(7)對(duì)于一些特殊情況,如從幾個(gè)總體所獲得的數(shù)據(jù),往往難以對(duì)其原有總體分布作 出估計(jì),在這種情況下可用非參數(shù)統(tǒng)計(jì)方法。非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn):(簡(jiǎn)答)非參數(shù)統(tǒng)計(jì)與傳統(tǒng)的參數(shù)統(tǒng)計(jì)相比,有以下優(yōu)點(diǎn):1、
34、非參數(shù)統(tǒng)計(jì)方法要求的假定條件比較少,因而它的適用范圍比較廣泛。2、多數(shù)非參數(shù)統(tǒng)計(jì)方法要求的運(yùn)算比較簡(jiǎn)單,可以迅速完成計(jì)算取得結(jié)果,因而比較 節(jié)約時(shí)間。3、大多數(shù)非參數(shù)統(tǒng)計(jì)方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì) 學(xué)知識(shí)。4、大多數(shù)非參數(shù)統(tǒng)計(jì)方法可用來分析如象由等級(jí)構(gòu)成的數(shù)據(jù)資料,而對(duì)計(jì)量水準(zhǔn)較低 的數(shù)據(jù)資料,參數(shù)統(tǒng)計(jì)方法卻不適用。5、當(dāng)推論多達(dá)3個(gè)以上時(shí),非參數(shù)統(tǒng)計(jì)方法尤具優(yōu)越性。但非參數(shù)統(tǒng)計(jì)方法也有以下缺點(diǎn):1、由于方法簡(jiǎn)單,用的計(jì)量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計(jì)方法同時(shí)使用時(shí),就 不如參數(shù)統(tǒng)計(jì)方法敏感。若為追求簡(jiǎn)單而使用非參數(shù)統(tǒng)計(jì)方法,其檢驗(yàn)功效就要差些。這 就是說,在給
35、定的顯著性水平下進(jìn)行檢驗(yàn)時(shí),非參數(shù)統(tǒng)計(jì)方法與參數(shù)統(tǒng)計(jì)方法相比,第n 類錯(cuò)誤的概率3要大些。2、對(duì)于大樣本,如不采用適當(dāng)?shù)慕疲?jì)算可能變得十分復(fù)雜。注意:凡符合或經(jīng)過變換后符合參數(shù)檢驗(yàn)條件的資料,最好用參數(shù)檢驗(yàn)。當(dāng)資料不具備參數(shù) 檢驗(yàn)的條件時(shí),非參數(shù)檢驗(yàn)是一種有效的分析方法。配對(duì)設(shè)計(jì)的符號(hào)秩和檢驗(yàn)方法(簡(jiǎn)答)假設(shè):h0:差值總體中位數(shù)md=0h1: m卡 0a =0.05(2)求差值(3)編秩次:依差值的絕對(duì)值從小到大編秩次。編秩次時(shí)遇差數(shù)等于0 ,舍去不計(jì),同時(shí)樣本例數(shù)減1;遇絕對(duì)值相等差數(shù),符號(hào)相同順次編秩次,符號(hào)相反取平均秩次,且符號(hào) 相反。(4)求秩和并確定檢驗(yàn)統(tǒng)計(jì)量:分別求出正負(fù)秩次
36、之和,正秩和以t+表示,負(fù)秩和的絕對(duì)值以t-表示。t+及t-之和應(yīng)等于n(n+1)/2 ,任取t+(或t-)作檢驗(yàn)統(tǒng)計(jì)量t 。(5)確定p值和作出推斷結(jié)論:當(dāng) n w50時(shí),查t界值表,得出p值。若檢驗(yàn)統(tǒng)計(jì) 量t值在上、下界值范圍內(nèi),其 p值大于表上方相應(yīng)概率水平;若 t值在上、下界值上若范 圍外,其p值小于表上方相應(yīng)概率水平。第九章線性相關(guān)系數(shù)(名解)線性相關(guān)系數(shù):表示兩個(gè)變數(shù)線性相關(guān)方向及程度的統(tǒng)計(jì)數(shù)或參數(shù)。又叫直線相關(guān)系 數(shù),簡(jiǎn)稱相關(guān)系數(shù)。,|r|的極值為1,|r|越大(接近1),則直線關(guān)系越好。線性相關(guān)系數(shù)取值范圍(填空)-1 < r < 1樣本相關(guān)系數(shù)r的假設(shè)檢驗(yàn)(填空題)(1) r界值表法;(2) t檢驗(yàn)法。線性相關(guān)或回歸應(yīng)用應(yīng)注意的問題(簡(jiǎn)答)作回歸分析和相關(guān)分析時(shí)要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸、相關(guān) 分析,必須對(duì)兩種現(xiàn)象間的內(nèi)在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 證券公司圍護(hù)樁施工合同
- 道路施工隊(duì)合作協(xié)議
- 農(nóng)村房屋拆遷補(bǔ)償合同
- 劇院排水設(shè)施安裝合同
- 培訓(xùn)零售環(huán)境防疫措施
- 醫(yī)療器械招投標(biāo)規(guī)范解讀
- 無抵押企業(yè)借款合同
- 通信設(shè)備質(zhì)量管理辦法
- 商業(yè)綜合體二手房交易合同范文
- 制造執(zhí)行系統(tǒng)操作與應(yīng)用課件 3-4-2典型離散制造工藝
- 冀教版小學(xué)數(shù)學(xué)四年級(jí)上冊(cè)教案7.1《垂線的認(rèn)識(shí)》
- 小學(xué)四年級(jí)數(shù)學(xué)上冊(cè)口算題卡
- 門禁安全檢查制度范本
- NB/T 11257-2023井工煤礦采掘工作面防治水安全條件評(píng)價(jià)
- 請(qǐng)款單(可直接打印-標(biāo)準(zhǔn)模板)
- 班主任德育工作:班主任培訓(xùn)講課件
- RJ45插拔測(cè)試報(bào)告
- 2022年病歷質(zhì)控考核標(biāo)準(zhǔn)完整
- 教師爭(zhēng)做新時(shí)代的“大先生”心得體會(huì)8篇
- 腰椎間盤突出健康教育課件
- 公共事務(wù)管理專業(yè)
評(píng)論
0/150
提交評(píng)論