版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)學(xué)統(tǒng)計(jì)學(xué)理論復(fù)習(xí)交通大學(xué)醫(yī)學(xué)院生物統(tǒng)計(jì)學(xué)教研室分機(jī)776444zhang
1一.
基本概念統(tǒng)計(jì)學(xué)是研究怎樣去有效地收集,整理和分析帶有隨機(jī)性的數(shù)據(jù),以對(duì)所的問題作出推斷和,直至為采取一定的決策和行動(dòng)提供依據(jù)和建議的科學(xué)。醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容有統(tǒng)計(jì)研究設(shè)計(jì),統(tǒng)計(jì)描述,統(tǒng)計(jì)推斷,因素間的關(guān)系、分類和檢測(cè)等研究。2實(shí)驗(yàn)設(shè)計(jì)3一、基本要素1處理因素
2受試對(duì)象
3實(shí)驗(yàn)效應(yīng)二、基本原則對(duì)照的原則空白、安慰劑、自身、實(shí)驗(yàn)、標(biāo)準(zhǔn)對(duì)照重復(fù)的原則個(gè)別/偶然
普遍/必然
(樣本含量大?。╇S機(jī)化原則統(tǒng)計(jì)描述指用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)定和描述,不涉及由樣本推斷總體問題。統(tǒng)計(jì)推斷指用樣本推斷總體。一個(gè)統(tǒng)計(jì)問題所研究的對(duì)象的全體稱為總體。按隨機(jī)的方式從總體中抽取若干
構(gòu)成一個(gè)樣本。45用于描述總體分布的數(shù)字特征的量稱為參數(shù),例如總體均數(shù)μ、總體標(biāo)準(zhǔn)差σ、總體率π、總體回歸系數(shù)β、總體相關(guān)系數(shù)ρ等都是總體的參數(shù),總體參數(shù)一般是未知的。不包含總體中任何未知參數(shù)的樣本指標(biāo)和樣本數(shù)據(jù)的函數(shù)稱為統(tǒng)計(jì)量,例如樣本均數(shù)、樣本標(biāo)準(zhǔn)差S、樣本率P、樣本回歸系數(shù)b、樣本相關(guān)系數(shù)r等都是統(tǒng)計(jì)量。6統(tǒng)計(jì)推斷可以分為二個(gè)部分:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是根據(jù)總體中所抽得的樣本,由樣本統(tǒng)計(jì)量估計(jì)總體分布中的未知參數(shù)??煞譃辄c(diǎn)估計(jì)和區(qū)間估計(jì)。選擇一個(gè)適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值稱為點(diǎn)估計(jì)。根據(jù)一定的正確度和精確度要求確定一個(gè)概率水平,由樣本統(tǒng)計(jì)量計(jì)算出一個(gè)適當(dāng)?shù)膮^(qū)間作為未知總體參數(shù)真值所在的范圍,稱為區(qū)間估計(jì)。稱此概率水平為度或置信度,也水平,或置信水平。所估計(jì)的區(qū)間區(qū)間或置信區(qū)間,區(qū)間的端點(diǎn)稱為可可稱為稱為
信限。區(qū)間的大小與樣本含量及小有關(guān),一般地說,隨著
度的加大,度的大區(qū)間也加大,隨著樣本含量的加大,
區(qū)間縮小。7假設(shè)檢驗(yàn)又稱顯著性檢驗(yàn),先對(duì)總體的參數(shù)或分布作出某種假設(shè),假設(shè)有兩種(1)檢驗(yàn)假設(shè)用H0表示,(2)對(duì)立假設(shè)或備擇假設(shè)用H1表示,H0與H1是相互聯(lián)系、相互對(duì)立的假設(shè)。然后選擇適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量,進(jìn)行統(tǒng)計(jì)推斷,究竟是
H0,還是不
H0。其基本步驟為:12建立H0,H1。選擇合適的統(tǒng)計(jì)檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量。3
根據(jù)檢驗(yàn)統(tǒng)計(jì)量的分布,計(jì)算概率P值,或者根據(jù)其臨界值表,決定P的大小。89P值是H0成立的情況下,由于抽樣誤差得到的樣本之差異大于等于計(jì)算出的統(tǒng)計(jì)量的概率。如果P>0.05,結(jié)論為差異無統(tǒng)計(jì)學(xué)意義;如果P≤0.05,結(jié)論為差異有統(tǒng)計(jì)學(xué)意義。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)與假設(shè)檢驗(yàn)的目的有關(guān)。當(dāng)H0:μ1=μ2,H1:μ1≠μ2時(shí),就是雙側(cè)檢驗(yàn);當(dāng)H0:μ1=μ2
,H1:μ1>μ2或H1:μ1<μ2時(shí),就是單側(cè)檢驗(yàn)。其主要區(qū)別在備擇假設(shè)H1上面。如果H1:μ1≠μ2時(shí)就用到二側(cè)(即μ1>μ2
,或μ2>μ1);如果μ1>μ2就只用到一側(cè)。如t值表中由于
t分布左右對(duì)稱,雙側(cè)的概率P就是單側(cè)概率P之二倍,單側(cè)概率P較小,
故易于產(chǎn)生
H0之統(tǒng)計(jì)推斷。因而單側(cè)檢驗(yàn)如果誤認(rèn)為是雙側(cè)的,就不易
H0;而雙側(cè)檢驗(yàn)如誤用單側(cè)就較易
H0了。10必須根據(jù)實(shí)際問題本身決定使用單側(cè)還是雙側(cè),決不能因?yàn)閱蝹?cè)易于
H0就盲目選用。通常進(jìn)行的都為雙側(cè)檢驗(yàn);進(jìn)行單側(cè)檢驗(yàn)時(shí)必須特別說明,要有充分的理由,并且在實(shí)驗(yàn)設(shè)計(jì)階段就要預(yù)先規(guī)定好。11由假設(shè)檢驗(yàn)作出統(tǒng)計(jì)推斷時(shí),不論是
H0,還是不 H0,都有可能發(fā)生誤差(或稱錯(cuò)誤),根據(jù)所犯誤差的性質(zhì),可以區(qū)分為第一類誤差(用α表示)和第二類誤差(用β表示)。當(dāng)
類錯(cuò)誤,不了實(shí)際上成立的H0時(shí),稱為犯第一實(shí)際上不成立的H0時(shí),稱為犯第二類錯(cuò)誤。12用假設(shè)檢驗(yàn)作統(tǒng)計(jì)推斷時(shí),第一類誤差α常是已知的,β常常未知,1-β又稱為檢驗(yàn)的效能,即當(dāng)H0實(shí)際上不成立時(shí)假設(shè)檢驗(yàn)
H0的概率。當(dāng)1-β很大時(shí),表明該統(tǒng)計(jì)檢驗(yàn)效能很高。影響效能的四要素:客觀上兩組效應(yīng)差異越大,效能越大。間標(biāo)準(zhǔn)差越小,效能越大。樣本量越大,效能越大。第Ⅰ類誤差的概率越大,效能越大。要同時(shí)降低α,β值的唯一辦法是加大樣本。1314資料一般可分成三大類,即計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。計(jì)量資料又稱測(cè)量資料,它是測(cè)量每個(gè)觀察單位某項(xiàng)指標(biāo)值的大小所得的資料。計(jì)數(shù)資料,將觀察單位按某種屬性或類別分組計(jì)數(shù),得到各類別觀察單位計(jì)數(shù)的資料,稱為計(jì)數(shù)資料。等級(jí)資料又稱為半定量資料,它是將觀察單位按某種屬性的不同程度分組計(jì)算所得出的各個(gè)不同程度的觀察單位計(jì)數(shù)的資料。15不同的資料類型,其統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)檢驗(yàn)的方法是不相同的。計(jì)量資料的統(tǒng)計(jì)指標(biāo)為均數(shù),標(biāo)準(zhǔn)差等,統(tǒng)計(jì)檢驗(yàn)方法為t檢驗(yàn),方差分析等;當(dāng)不符合條件時(shí)用非參數(shù)統(tǒng)計(jì)分析法。計(jì)數(shù)資料的統(tǒng)計(jì)指標(biāo)為率,構(gòu)成比等,統(tǒng)計(jì)檢驗(yàn)方法為χ2檢驗(yàn);等級(jí)資料的統(tǒng)計(jì)指標(biāo)也為率,構(gòu)成比等,統(tǒng)計(jì)檢驗(yàn)方法為非參數(shù)統(tǒng)計(jì)分析法。正態(tài)分布(normal
distribution)記為N(μ,σ2),標(biāo)準(zhǔn)正態(tài)分布:N(0,1)均數(shù)μ:位置參數(shù),μ增大,曲線向右移動(dòng)...標(biāo)準(zhǔn)差σ:形狀參數(shù),σ增大,數(shù)據(jù)分散,曲線低平...16正態(tài)曲線下的面積規(guī)律-417-3
-2
-1012
34-3-2-
+
+2
+3S(-,
-)=3210.)5=0.0152128738S(-,
+)=211)=0.695798772正態(tài)曲線下的面積規(guī)律2.5%2.5%95%+1.96-1.9618正態(tài)曲線下的面積規(guī)律5%5%90%+1.96-1.9619正態(tài)曲線下的面積規(guī)律0.5%0.5%99%-2.58+2.5820二.計(jì)量資料的統(tǒng)計(jì)指標(biāo)正態(tài)分布資料的平均水平和離散程度常用均數(shù)和標(biāo)準(zhǔn)差表示。非正態(tài)分布資料的平均水平和離散程度常用中位數(shù)和四分位數(shù)間距表示。幾何均數(shù)適用
倍數(shù)關(guān)系的資料,如抗體滴度、效價(jià)等,也用于對(duì)數(shù)正態(tài)分布的資料如某些傳染病的潛伏期等。2122百分位數(shù)主要用于描述一組資料在各個(gè)百分位置上的水平,用一組百分位數(shù)如P5,P25,P50,P75,P95,可以描述總體或樣本的分布特征,如集中位置、變異度等。百分位數(shù)還可用以確定醫(yī)學(xué)正常值范圍。變異系數(shù)無量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標(biāo)或者平均水平相差懸殊的指標(biāo)的變異程度。統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤描述樣本統(tǒng)計(jì)量抽樣誤差,標(biāo)準(zhǔn)誤小,表示抽樣誤差小,統(tǒng)計(jì)量較穩(wěn)定,與參數(shù)較接近。對(duì)
稱:skewness=0;正偏態(tài):skewness>0;峰偏左,長(zhǎng)尾向右。個(gè)別數(shù)據(jù)特別大(右)負(fù)偏態(tài):skewness<0;峰偏右,長(zhǎng)尾向左。
個(gè)別數(shù)據(jù)特別?。ㄗ螅?3偏態(tài)系數(shù)(skewness)評(píng)價(jià)正態(tài)分布對(duì)稱性的指標(biāo)偏態(tài)負(fù)偏態(tài)正偏態(tài)24峰態(tài)系數(shù)(kurtosis)評(píng)價(jià)正態(tài)分布正態(tài)峰的指標(biāo)。正態(tài)峰:kurtosis=0;平闊峰:kurtosis<0;尖峭峰:kurtosis>0;扁平分布尖峰分布峰度與標(biāo)準(zhǔn)正態(tài)分布比較!眾數(shù)、中位數(shù)和均數(shù)的關(guān)系對(duì)稱分布均數(shù)=中位數(shù)=眾數(shù)負(fù)偏態(tài)均數(shù)
中位數(shù)
眾數(shù)正偏態(tài)眾數(shù)
中位數(shù)
均數(shù)2526三.t檢驗(yàn)要檢驗(yàn)總體均數(shù)是否為某值:用樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)。配對(duì)資料的兩組比較,或處理前后的比較:用配對(duì)t檢驗(yàn)。按完全隨機(jī)化設(shè)計(jì)的兩個(gè)樣本均數(shù)的比較:用團(tuán)體t檢驗(yàn)。抽樣分布:t分布用途:t檢驗(yàn)、回歸系數(shù)及相關(guān)系數(shù)檢驗(yàn)等。標(biāo)準(zhǔn)正態(tài)分布df=t
(df
=
13)t
(df
=
5)Zt不同度的t
分布27t分布的特征t分布為一簇單峰分布曲線t分布以0為中心,左右對(duì)稱t分布與
度有關(guān),
低,而兩側(cè)尾部翹得越高;度越小,t分布的峰越度逐漸增大時(shí),t分布逐漸
近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)
度為無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。2829t檢驗(yàn)條件樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)要求樣本來自正態(tài)分布的總體。配對(duì)t檢驗(yàn)要求差值d來自正態(tài)分布的總體。
團(tuán)體t檢驗(yàn)要求兩個(gè)樣本都來自正態(tài)分布并具有相同的方差。如不符合要求可作變量置換或用非參數(shù)統(tǒng)計(jì)分析方法。小樣本團(tuán)體t檢驗(yàn)如方差不齊時(shí)可用t'檢驗(yàn)。四.方差分析方差分析主要用于檢驗(yàn)計(jì)量資料中兩個(gè)或兩個(gè)以上均數(shù)間差別顯著性的方法。要求各樣本都來自正態(tài)總體,且有一個(gè)相同的方差σ2,僅僅均數(shù)可以不相同;還需假定每一個(gè)觀察值都由若效果可分成若分累加而成,也即總的分,而每一部分都有一個(gè)特定的含義,稱之謂效應(yīng)的可加性。方差分析的應(yīng)用條件:可加性、方差齊性、正態(tài)性、獨(dú)立性。30方差分析法的基本思想為:根據(jù)效應(yīng)的可加性,將總的離均差平方和分解成若干部分,每一部分都與某一種效應(yīng)相對(duì)應(yīng),總度也被分為相應(yīng)的各個(gè)部分,各部分的離均差平方和除以相應(yīng)
度得出各個(gè)均方,然后列出方差分析表算出F值,作出統(tǒng)計(jì)推斷。分解越細(xì)致,各部分含義就越明確。效率也越高。3132若發(fā)現(xiàn)方差不齊性時(shí),先從實(shí)驗(yàn)本身檢查,能否找到可能的解釋,如果找不到適當(dāng)?shù)睦碛?可考慮作變量置換。對(duì)于服從對(duì)數(shù)正態(tài)分布的資料可用對(duì)數(shù)變換,即將主要變量取對(duì)數(shù)值后再作方差分析;對(duì)于服從泊松分布的資料可用平方根變換;對(duì)于表達(dá)成百分?jǐn)?shù)的資料可用平方根反正弦變換。如果變量置換也無法克服方差不齊性,或者變量置換方法在實(shí)驗(yàn)中無法得到合理的解釋時(shí),可使用非參數(shù)統(tǒng)計(jì)分析方法。33單因素方差分析用于按完全隨機(jī)化設(shè)計(jì)資料的樣本均數(shù)的比較。隨機(jī)單位組設(shè)計(jì)方差分析用于比較某因素各水平的樣本均數(shù),同時(shí)控制另一個(gè)分類因素的作用。拉丁方設(shè)計(jì)方差分析用于比較某因素各水平的樣本均數(shù),同時(shí)控制另二個(gè)分類因素的作用。34五.直線相關(guān)與回歸在醫(yī)學(xué)研究中常常要分析兩個(gè)變量間的關(guān)系,
兩變量間如果存在一定的因果關(guān)系,則??蓪⒁粋€(gè)變量看作自變量,而另一個(gè)變量則看作為應(yīng)變量,然后以一個(gè)直線方程將兩者聯(lián)系起來,利用這方程可以由自變量的值來估計(jì)應(yīng)變量的值,這種方程稱為直線回歸方程,研究這類問題的方法稱為回歸分析。如果兩變量間雖有一定的關(guān)系存在,但不是因果關(guān)系,此時(shí)就只能進(jìn)行相關(guān)分析,這種關(guān)系就稱為相關(guān)。35相關(guān)關(guān)系的圖示
負(fù)線性相關(guān)-1
<
r
<0
非線性相關(guān)
完全負(fù)線性相關(guān)完全正線性相關(guān)
r
=
1正線性相關(guān)0<
r
<
1r
=
-1
不相關(guān)r
=
0A
BCr
=
0相關(guān)分析只是以相關(guān)系數(shù)來描述兩個(gè)變量間線性相關(guān)的程度和方向,并不闡明事物間存在聯(lián)系的本質(zhì),也不是兩事物間存在聯(lián)系的
。要闡明兩事物間的本質(zhì)聯(lián)系,必須憑專業(yè)知識(shí)從理論上加以論證。36xyn
n(x
,
y
)1
1(x
,
y
)(x2
,
y2)(
xi
,
yi
)P}i
i(y
–^y
)y?
a
bx最小二乘法b
lxy
/
lxx
(x
x)(
y
y)
/[(x
x)2
]a
y
bx得出直線回歸程:y?
a
bx3738兩變量間如果存在回歸關(guān)系,則它們之間也必然是相關(guān)的。H0:β=0,H1:β≠0,與H0:ρ=0,H1:ρ≠0,是完全一致的。所以通常作直線回歸分析時(shí),只須利用計(jì)算器直接求得b,a和r后,再查r界值表判定r的顯著性后,即可得知回歸方程是否有顯著意義,不必另行檢驗(yàn)。39決定系數(shù)R2:表示Y的變異中可由方程中的自變量組合所決定的部分占多少。R2越接近1,說明回歸方程的效果越好,即Y的變異中可由方程中的自變量組合所決定的部分越多;R2越接近0,說明回歸方程的效果越差,即Y的變異中只有很少一部分能由方程中的自變量組合所決定,即使該方程有顯著意義,也不能認(rèn)為該方程的效果可以令人滿意,啟示我們還應(yīng)進(jìn)一步尋找其他對(duì)Y可能有顯著作用的變量或變量組合。八.計(jì)數(shù)資料的統(tǒng)計(jì)分析計(jì)數(shù)資料的描述性統(tǒng)計(jì)指標(biāo)主要是:率和構(gòu)成比。,率說明某種現(xiàn)象發(fā)生的頻率或強(qiáng)度。構(gòu)成比表示事物或現(xiàn)象
各構(gòu)成部分的通常以100作為比例基數(shù),
故常稱為百分比。構(gòu)成比和率是兩個(gè)不同的相對(duì)數(shù),不能。4041四格表和2×K表卡方檢驗(yàn)用于兩個(gè)或多個(gè)率差異的比較。行×列表卡方檢驗(yàn)用于兩個(gè)或多個(gè)構(gòu)成比差異的顯著性檢驗(yàn)以及兩種屬性間獨(dú)立性檢驗(yàn)。0.00.10.20.30.40.503615189?¨·?Y×??
×?óé×?óé
×?óé×?óé?è
£?
1?è
£?
2?è
£?
3?è
£?
62
2
/
2(
/
21)1
ef
(
2
)
2(
/
2)
23.847.8112.5912α
=0.05的臨界值4243四格表卡方檢驗(yàn)當(dāng)總例數(shù)大于等于40,各理論頻數(shù)大于等于5,不須校正。當(dāng)總例數(shù)大于等于40,有一格理論頻數(shù)小于5,但大于等于1,用卡方校正公式。當(dāng)總例數(shù)小于40,或有一格理論頻數(shù)小于1,不能用卡方檢驗(yàn),必須用確切概率計(jì)算。常用Fishe
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年安全生產(chǎn)責(zé)任基金抵押合同
- 2025年在線醫(yī)療健康平臺(tái)用戶注冊(cè)協(xié)議
- 2025年保密協(xié)議信息轉(zhuǎn)換書
- 2025年代理渠道合作協(xié)議
- 2025年旅游項(xiàng)目管理標(biāo)準(zhǔn)協(xié)議
- 《英語選修課》課件
- 2024 浙江公務(wù)員考試行測(cè)試題(A 類)
- 2025版美容護(hù)膚中心場(chǎng)地租賃合同范本4篇
- 2025版基礎(chǔ)設(shè)施建設(shè)工程施工合同終止補(bǔ)充協(xié)議2篇
- 買賣墓地合同(2024版)
- 2025年度房地產(chǎn)權(quán)證辦理委托代理合同典范3篇
- 柴油墊資合同模板
- 湖北省五市州2023-2024學(xué)年高一下學(xué)期期末聯(lián)考數(shù)學(xué)試題
- 城市作戰(zhàn)案例研究報(bào)告
- 【正版授權(quán)】 ISO 12803:1997 EN Representative sampling of plutonium nitrate solutions for determination of plutonium concentration
- 道德經(jīng)全文及注釋
- 2024中考考前地理沖刺卷及答案(含答題卡)
- 多子女贍養(yǎng)老人協(xié)議書范文
- 彩票市場(chǎng)銷售計(jì)劃書
- 骨科抗菌藥物應(yīng)用分析報(bào)告
- 支付行業(yè)反洗錢與反恐怖融資
評(píng)論
0/150
提交評(píng)論