2016級安徽醫(yī)科大學醫(yī)學統(tǒng)計學重點概述_第1頁
2016級安徽醫(yī)科大學醫(yī)學統(tǒng)計學重點概述_第2頁
2016級安徽醫(yī)科大學醫(yī)學統(tǒng)計學重點概述_第3頁
2016級安徽醫(yī)科大學醫(yī)學統(tǒng)計學重點概述_第4頁
2016級安徽醫(yī)科大學醫(yī)學統(tǒng)計學重點概述_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

名詞解釋總體population:就是根據(jù)研究目確實定的同質(zhì)觀察單位的全體,確切的說,是同質(zhì)的所有觀察單位*種變量值的集合樣本sample:就是從總體中隨機抽取局部觀察單位,其實測值的集合同質(zhì)homogeneity:性質(zhì)一樣的事物稱為同質(zhì),否則稱為異質(zhì)系統(tǒng)誤差:是指數(shù)據(jù)搜集和測量過程中由于儀器不準確、標準不規(guī)等人為原因,造成觀察結(jié)果偏大或偏小的一種誤差,是由確定原因造成的誤差。隨機誤差:是由一些非人為的偶然因素,使得結(jié)果或大或小,是不確定、不可預知的一種誤差,分為隨機測量誤差和抽樣誤差抽樣誤差samplingerror:由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及樣本統(tǒng)計量之間的差異稱為抽樣誤差定量資料:是通過度量衡的方法,測定每一單個觀察單位*項研究指標的量的大小得到的資料,也稱計量變量或數(shù)值變量。定性資料:是將全體觀察單位按*種性質(zhì)或特征分組,然后再分別清點各組觀察單位的個數(shù)所得到的資料,稱定性資料也稱計數(shù)變量或分類變量。等級資料:是將觀察單位按屬性的等級分組,清點各組的觀察單位數(shù),所得的資料為等級資料,又稱有序分類資料。變異系數(shù):又稱變異程度,簡稱變異度,記為CV,是相對數(shù),用于比擬單位不同或均數(shù)相差較大的多組資料的變異程度。公式為CV=s/*×100%小概率事件〔原理〕:假設在一次觀察或試驗中發(fā)生的可能性很小或幾乎不可能發(fā)生,可以看做很可能不發(fā)生,則稱該事件為小概率事件。率rate:是*現(xiàn)象實際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的觀察單位總數(shù)之比,用以說明*現(xiàn)象發(fā)生的頻率或強度構(gòu)成比:說明*一事物部各組成局部所占的比重或分布,等于*一組成局部的觀察單位數(shù)/同一事物各組成局部的觀察單位總數(shù)×100%醫(yī)學參考值圍referencerange:指醫(yī)學領域中特定的“正常〞人群〔即排除了對所研究指標有影響的疾病和相關因素的特定人群〕的解剖、生理、生化指標及組織代產(chǎn)物含量等數(shù)據(jù)的大多數(shù)個體〔一般為95%〕的取值圍置信區(qū)間:是對這個樣本的*個總體參數(shù)的區(qū)間估計,置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度,給出的是被測量參數(shù)的測量值的可信程度均數(shù)為95%的CI值〔置信區(qū)間〕:按一定的概率或可信度〔1-a〕用一個區(qū)間來估計總體參數(shù)所在的圍,這個圍稱作可信度為1-a的可信區(qū)間〔CI〕又稱置信區(qū)間,95%的可信區(qū)間中的95%是可信度,即,所求的可信區(qū)間包含總體參數(shù)的可信程度為95%標準誤standarderror:是反映均數(shù)抽樣誤差大小及樣本統(tǒng)計量之間離散程度的指標檢驗水準sizeoftest:亦稱顯著性水準,用α表示,它是預先確定的概率值,即小概率事件的標準,一般情況下α取0.05P值:指H0成立,從所規(guī)定的總體中隨機抽樣,所獲得等于及大于〔或等于及小于〕現(xiàn)有樣本計算獲得的檢驗統(tǒng)計量值的概率Ⅰ類錯誤typeⅠerror:如果實際情況與H0一致,僅僅因為抽樣的原因,使得假設檢驗的結(jié)論為拒絕原本正確的H0,導致推斷結(jié)論錯誤,這樣的錯誤稱為Ⅰ類錯誤。犯Ⅰ類錯誤的概率用α來控制〔假陽性/棄真錯誤〕第Ⅱ類錯誤typeⅡerror:如果實際情況與H0不一致,僅僅因為抽樣的原因,使得假設檢驗的結(jié)論為不拒絕原本錯誤的H0,導致推斷結(jié)論錯誤,這樣的錯誤稱為Ⅱ類錯誤。犯Ⅱ類錯誤的概率用β來控制〔假陰性/取尾錯誤〕檢驗效能powerofatest:為1-β,即當兩總體確實有差異〔H0不成立〕,按照事先確定的檢驗水準α,假設檢驗能發(fā)現(xiàn)該差異〔拒絕H0〕的能力,1-β也取單尾配對設計:配對設計是將受試對象按配對條件配成對子,每對中的個體承受不同的處理,配對設計一般以主要的非實驗因素作為配比條件,而不以實驗因素作為配比條件完全隨機設計:又稱成組設計,只有單個研究因素,該因素有多個水平,如在實驗中安隨機化原則將受試對象隨機分配到一個研究因素的多個水平中去,然后觀察實驗效能隨機區(qū)組設計:又稱配伍設計,屬于兩因素方差分析,用于多個樣本均屬的比擬析因設計:當兩個因素或多個因素之間存在相互影響或交互作用時,可用該設計來進展分析。該設計不僅可以分析多個因素的獨立作用,也可以分析多個因素間的交互作用,是一種高效率的方差分析方法卡方檢驗的根本思想:通過計算實際頻數(shù)與理論頻數(shù)的吻合程度來判斷所給的處理因素是否有效卡方值:實際頻數(shù)與理論頻數(shù)的吻合程度,其大小即用卡方值來表示。非參數(shù)檢驗:不依賴于總體分布類型,也不對總體參數(shù)進展統(tǒng)計推斷的假設檢驗的方法,稱為非參數(shù)檢驗線性相關關系:如果具有相關關系的隨機變量組成的散點圖在直角坐標系中呈直線趨勢,就稱這兩個變量存在線性相關關系線性相關方關系:如果兩個隨機變量中,一個變量有小到大變化時,另一個變量也相應的由小變大〔或由大變小〕,并且呈直線趨勢,就稱這兩個變量存在直線相關關系〔教師給的定義〕相關系數(shù):是說明兩變量間線性關系的密切程度和相關方向的一個統(tǒng)計指標,樣本的相關系數(shù)用r表示,總體的相關系數(shù)用ρ表示回歸系數(shù):在回歸方程中表示自變量*對因變量y影響大小的參數(shù),正回歸系數(shù)表示y隨*增大而增大,負回歸系數(shù)表示y隨*增大而減小最小二乘法原理:即各實測點到回歸直線法的縱向距離的平方和最小,是回歸方程可以較好的反映各實測點的分布情況雙盲:受試對象和實驗者都不知道受試對象分在哪一組調(diào)查設計的四種方法:1〕單純隨機抽樣:保證總體中每一個個體都有同等的時機被抽出來作為樣本的抽樣方法2〕系統(tǒng)抽樣:即先將總體的全部個體按與研究現(xiàn)象無關的特定排序編號,依次每隔假設干抽取的一個個體組成樣本3〕分層抽樣:先將總體全部個體按*種特征分成假設干層,再從每層隨機抽取一定數(shù)量的個體合起來組成樣本4〕整群抽樣:先將總體分成假設干群體,形成一個抽樣框,從中隨機抽取幾個群體組成樣本,對抽中群體的全部個體進展調(diào)查簡答題簡述頻數(shù)表的繪制方法找出最大值、最小值和極差:極差=最大值—最小值確定組距、組段、組數(shù):頻數(shù)表一般設8-15個組段,常用極差的1/10取整作組距,第一組段包括最小值,最后一個組段要包括最大值并寫出其下限上限列表劃記:把確定的組段序列制成表的形式,得出各組段頻數(shù)簡述應用相對數(shù)的考前須知計算相對數(shù)時分母一般不宜過小。只有當觀察單位足夠多時,計算出的相對數(shù)才比擬穩(wěn)定,且能正確反映實際情況。分析時注意構(gòu)成比和率的區(qū)別。構(gòu)成比說明事物部各組成局部所占的比重,即只能說明分布,不能說明*現(xiàn)象發(fā)生的頻率或強度。合計率的計算。對觀察單位不等的幾個率,不能直接相加求其平均率,而應用合計的數(shù)據(jù)來計算。比擬相對數(shù)時應注意資料的可比性。除了研究因素以外,其他影響因素應盡可能相近或一樣比擬才有意義。對樣本率、構(gòu)成比的比擬應作假設檢驗,不能憑外表數(shù)值大小下結(jié)論。確定醫(yī)學參考值圍的原則:制定“正常〞人群的入選標準確定樣本量的大小,在符合入選標準的人群中隨機抽樣對樣本中的每個個體進展指標測量確定是否要分組制定參考值圍根據(jù)該指標*的背景意義,確定參考值的圍是雙側(cè)還是單側(cè)根據(jù)樣本資料的分布情況確定采用正態(tài)分布法還是百多分位數(shù)法檢驗假設的根本步驟:建立檢驗假設,確定檢驗水準選擇檢驗方法,計算統(tǒng)計量確定P值,做出推斷結(jié)論簡述假設檢驗應用的考前須知假設檢驗的前提是要有嚴密的抽樣研究設計:應盡量從同質(zhì)總體中隨機抽取,盡量保證組間均衡性,以確保資料具有可比性。正確選定假設檢驗方法:資料性質(zhì)、分布類型、設計類型、樣本大小等不同,以及分析的目的不同,適用的假設檢驗的方法也不同。正確理解“差異無統(tǒng)計學意義〞:H0成立可能性是小概率,也就是說兩者差異存在的可能性較大,“差異統(tǒng)計學意義〞也不一定具有臨床意義。結(jié)論不能絕對化:是否拒絕H0取決于研究對象有無本質(zhì)差異和抽樣誤差大小,以及檢驗水準的上下,而檢驗水準與實驗設計密切相關。報告結(jié)論時應注意:應列出樣本計算的檢驗統(tǒng)計量值,注明采用的是單側(cè)檢驗還是雙側(cè)檢驗,寫出P值。簡述假設檢驗應注意的問題:選擇檢驗方法必須符合資料的適用條件單側(cè)檢驗和雙側(cè)檢驗的選擇正確理解P值得意義結(jié)論不能絕對化當假設檢驗的結(jié)果為不拒絕時,應考慮該檢驗的檢驗效能,如果檢驗效能較低,則此時的結(jié)論可靠性較差方差分析的根本思想:是根據(jù)資料的設計類型和研究目的,將全部觀察值總的離散程度和自由度分解為相應的幾個局部,除了隨機誤差外,其余每個局部的變異可由*個因素的作用加以解釋,如各組均數(shù)間的變異可由處理因素的作用加以解釋6.在進展雙向無序行列表卡方檢驗時發(fā)生偏性的處理方法:P157增大樣本量,當樣本量增大時理論頻數(shù)會增大根據(jù)專業(yè)知識對理論頻數(shù)較小的行或者列進展合并或者刪除改用雙向無序行×列表的Fisher確切概率法7.簡述秩和檢驗的優(yōu)缺點及應用〔1〕優(yōu)點:①計算簡單便于掌握缺點:①損失信息②應用圍廣②檢驗效率低③收集資料方便應用:①分布型未知②能以嚴重程度、優(yōu)劣等級、效果大小和名次先后等等級資料③分布極度偏態(tài)④本組個別變量值偏離過大,遠離本組其它變量值⑤方差不齊時⑥篩選或只需獲得初步結(jié)果。秩和檢驗編秩次的方法:按差值的絕對值大小編秩次,并根據(jù)差值的正負給秩次加上正負號假設差值為0,則舍去不計,相應的對子數(shù)n隨之減少假設差值的絕對值相等,則取平均秩次在進展雙向無序行列表卡方檢驗時發(fā)生偏性的處理方法:P157增大樣本量,當樣本量增大時理論頻數(shù)會增大根據(jù)專業(yè)知識對理論頻數(shù)較小的行或者列進展合并或者刪除改用雙向無序行×列表的Fisher確切概率法10.簡述應用線性相關分析的考前須知繪散點圖了解線性趨勢,樣本的相關系數(shù)接近零時并不意味著兩變量間一定無相關性線性相關分析要求兩個變量都是隨機變量,且僅適用于二元正態(tài)分布資料作相關分析時,應該剔除離群值,出現(xiàn)異常點時慎用相關相關要有實際意義,兩變量相關并不代表兩變量間一定存在在聯(lián)系r=0說明無相關或非線性相關分層資料盲目合并易出假象教師的更簡潔:進展相關分析前應先繪制散點圖,以提示是否有必要進展線性相關分析樣本的相關系數(shù)為0時,并不意味著兩變量一定無相關性一個數(shù)值隨機變動,而另一個變量的數(shù)值卻是人為選定的,此時不宜做相關分析〔兩變量都應是隨機的,均符合正態(tài)分布〕作相關分析時,應該剔除離群值,出現(xiàn)異常點時慎用相關相關分析要有實際意義,相關未必真有在聯(lián)系分層資料盲目合并易出現(xiàn)假象線性回歸分析的適用條件:線性獨立正態(tài)方差相等因變量Y與自變量*呈線性關系每個個體觀察值之間相互獨立因變量Y屬于正態(tài)隨機變量在一定圍,不同的*值所對應的隨機變量Y的方差相等12.簡述應用線性回歸的考前須知進展線性回歸分析時,應先繪散點圖,提示有直線趨勢存在時,可作線性回歸分析進展線性回歸分析時,一般要求因變量Y是來自正態(tài)總體的隨機變量,自變量*可以是正態(tài)隨機變量,也可以是準確測量和嚴密控制的值進展線性回歸分析要有實際意義,不能把毫無關聯(lián)的兩個事物或現(xiàn)象進展進展線性回歸分析進展線性回歸分析必須進展假設檢驗,以推斷兩變量間的線性關系是否存在回歸直線不能外延,以自變量取值圍為限簡述線性回歸與相關的區(qū)別及聯(lián)系區(qū)別:①資料要求不同:相關:兩變量均為隨機變量,并服從雙變量正態(tài)分布回歸:Y服從正態(tài)分布,*為選定變量②統(tǒng)計意義不同:相關:只反映兩變量間相互依存回歸:有一個變量推算另一個變量回歸關系與原度量衡單位有關,相關關系則無③分析目的不同:相關:兩變量間線性關系的密切程度及相關方向回歸:用函數(shù)公式定量表達因變量隨自變量變化的關系聯(lián)系:①變量間關系的方向一致:對同一資料,其相關系數(shù)r與回歸系數(shù)b的正負號一致②假設檢驗等價:實際分析中常以r的假設檢驗代替對b的檢驗③r與b值可相互換算④用回歸解釋相關:r2稱決定系數(shù),r2越接近1,回歸效果越好。填空題統(tǒng)計學的研究對象是變異的數(shù)據(jù)醫(yī)學統(tǒng)計學工作的根本步驟是:設計、搜集資料、整理資料、分析資料,其中最重要的步驟是科研設計SPSS主要有4大窗口:數(shù)據(jù)編輯窗口〔DataEditor〕、結(jié)果輸出窗口〔Viewer〕、程序編輯窗口〔Synta*Editor〕、圖表編輯窗口〔ChartEditor〕SPSS能直接調(diào)用的數(shù)據(jù)文件類型常用的有:*.sav、*.*ls、*.dbf、*.t*t、*.dat等比資料的集中趨勢常用的描述方法是幾何均數(shù)G定量資料的集中趨勢:均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)定量資料的離散趨勢:全距、四分位數(shù)間距、方差、標準差、變異系數(shù)偏態(tài)分布的集中趨勢常用的描述方法是中位數(shù);偏態(tài)分布的離散趨勢常用的描述方法是四分位間距單位不同或均數(shù)相差較大的多組資料常用的描述方法是:變異系數(shù)CV參數(shù)是指:總體的統(tǒng)計指標;統(tǒng)計量是指:樣本的統(tǒng)計指標標準正態(tài)分布是一種特殊的正態(tài)分布,標準正態(tài)分布的:μ=0,σ2=1,通常用u〔或Z〕表示服從標準正態(tài)分布的變量,記為:u~N〔0,12〕正態(tài)分布函數(shù)中μ代表:總體均數(shù)〔位置參數(shù)〕,σ代表總體標準差〔變異度參數(shù)〕正態(tài)分布曲線區(qū)間面積為95%的圍是:〔μ-1.96σ,μ+1.96σ〕99%的圍是:〔μ-2.58σ,μ+2.58σ〕90%的圍是:〔μ-1.64σ,μ+1.64σ〕正態(tài)分布數(shù)據(jù)的參數(shù)估計±1.96S;偏態(tài)分布數(shù)據(jù)的參數(shù)估計〔P25,P75〕二項分布的條件:每次試驗只有兩種結(jié)果〔死亡或者存活〕、實驗結(jié)果之間彼此獨立、每次試驗結(jié)果發(fā)生概率固定不變二項分布近似正態(tài)分布的條件是:當n足夠大時〔n≥50〕,只要π不太靠近0或1,尤其是nπ和n〔1-π〕均大于5Poisson分布的條件:每次試驗只有兩種結(jié)果〔死亡或者存活〕、實驗結(jié)果之間彼此獨立、每次試驗結(jié)果發(fā)生概率固定不變+總體發(fā)生概率π非常小Poisson分布近似正態(tài)分布的條件是:λ≥20Poisson分布的兩個特性是:均數(shù)與方差相等,觀察結(jié)果有可加性t分布的自由度ν越小,t分布曲線越低平,尾部越高;自由度ν越大,t分布曲線越接近標準正態(tài)分布〔u分布〕Z分布與自由度無關醫(yī)學參考值圍通常表達為±1.96S;置信區(qū)間圍通常表達為±1.96S;其中圍較寬的是醫(yī)學參考值圍假設檢驗的根本原理是反證法思想和小概率事件配對樣本均數(shù)的t檢驗,配對設計主要由以下幾種形式:①兩種同質(zhì)受試對象分別承受兩種不同的處理②同一受試對象或者同一樣本的兩個局部分別承受兩種不同的處理③同一受試對象承受*種處理前后t檢驗的應用條件有:樣本例數(shù)n較小、樣本均是隨機樣本、符合正態(tài)分布、方差齊〔兩樣本〕t檢驗P<0.05拒絕H0有統(tǒng)計學意義;正態(tài)性檢驗P<0.05為非正態(tài)分布,通常運用秩和檢驗做單側(cè)檢驗時如果運用了雙側(cè)檢驗可以導致第Ⅱ類錯誤增大;可以同時減小第Ⅰ類錯誤和第Ⅱ類錯誤的方法是增加樣本含量方差分析應用條件有兩觀察值互相獨立、服從正態(tài)分布、方差齊性完全隨機設計組間變異包含處理效應+隨機誤差;組變異包括隨機誤差;SS總=SS組間+SS組;ν總=ν組間+ν組隨機區(qū)組設計的兩因素方差分析中,總變異可以分解為三個局部,即處理效應、區(qū)組間變異和隨機誤差SS總通??梢苑譃镾S處理、SS區(qū)組和SS誤差,SS總=SS處理+SS區(qū)組+SS誤差v總=v處理+v區(qū)組+v誤差行列表χ2檢驗,要求不能有理論數(shù)(T)小于1,且1≤T<5的格子數(shù)不超過總格子數(shù)的1/5,否則產(chǎn)生偏倚。處理方法有三種:①增大樣本含量②對理論頻數(shù)較小的行或列進展合并或者刪除③改用雙向無序行×列的Fisher確切概率法四格表的自由度等于1;四格表的周邊合計數(shù)不變時,如果*格子的實際頻數(shù)有變化,則其理論頻數(shù)不變統(tǒng)計表的制作原則:重點突出、層次清楚、簡單明了統(tǒng)計表的構(gòu)造包括標題、標目、線條、數(shù)字、備注統(tǒng)計表的種類:簡單表、復合表統(tǒng)計圖的構(gòu)造:標題、圖域、標目、刻度、圖例表示相互獨立的各指標的大小用直條圖〔單式/復式〕;表示全體中各局部的比重用百分條圖或圓圖〔構(gòu)成圖〕;表示連續(xù)性資料的開展變化或一事物隨另一事物變遷的情況用線圖〔普通線圖、半對數(shù)線圖〕;比擬事物開展速度用半對數(shù)圖;表示連續(xù)性資料的頻數(shù)分布用直方圖;表示兩組或多組連續(xù)性資料的平均指標和變異指標用箱式圖,表示兩事物的相關關系用散點圖;表示*現(xiàn)象的數(shù)量在地域上的分布用統(tǒng)計地圖箱式圖:箱子越長,表示資料數(shù)據(jù)越分散,即變異程度越大;反之變異程度越小。橫線在箱子中點處表示對稱分布,否則為偏態(tài)分布普通線圖:橫軸、縱軸均為算術尺度半對數(shù)線圖:橫軸為算術尺度,縱軸為對數(shù)尺度*地調(diào)查的863例惡性腫瘤死者,分別由省、市、縣、鄉(xiāng)醫(yī)院最后確診。現(xiàn)欲說明各級醫(yī)院確診比例,宜繪制圓圖/構(gòu)成圖(統(tǒng)計圖)非參數(shù)檢驗的優(yōu)點:計算簡單便于掌握、應用圍廣、收集資料方便;缺點:損失信息、檢驗效率低線性相關分析的步驟:繪制散點圖→觀察兩變量的線性趨勢→計算相關系數(shù)→相關系數(shù)的假設檢驗回歸分析的步驟:繪制散點圖→求回歸方程→回歸系數(shù)的假設檢驗→線性回歸方程圖回歸系數(shù)的估計原則:最小二乘法原則線性相關系數(shù)的取值圍:-1≤r≤1;r假設檢驗方法:r界值表法、t檢驗法相關系數(shù)的統(tǒng)計推斷方法:查表法、t檢驗配對設計秩和檢驗的統(tǒng)計推斷方法:查表法、正態(tài)近似法完全隨機(成組)設計兩樣本秩和檢驗的統(tǒng)計推斷方法:查表法、正態(tài)近似法完全隨機(成組)設計多樣本秩和檢驗的統(tǒng)計推斷方法:查表法、χ2正態(tài)近似法等級相關秩和檢驗應用圍:偏態(tài)分布、分布類型未知、等級資料實驗設計的根本原則:對照原則、隨機化原則、重復原則、盲法原則實驗設計的根本要素:處理因素、受試對象、實驗效應計算與分析表1數(shù)據(jù)如下,卡方檢驗如下。問:應該選擇哪種方法及哪組數(shù)值?新舊防護服是否對皮膚病患病率有影響?表1穿新舊兩種防護服工人的皮膚病患病率比擬防護服種類皮膚病炎癥患病率(%)陽性例數(shù)(理論頻數(shù))陰性例數(shù)(理論頻數(shù))新1(3.8)14(11.2)6.7舊10(7.2)18(20.8)35.7表2卡方檢驗(SPSS)結(jié)果值df漸進Sig.(雙側(cè))準確Sig.(雙側(cè))準確Sig.(單側(cè))Pearson卡方4.329a1.037連續(xù)校正b2.9381.087似然比5.0561.025Fisher的準確檢驗.065.038線性和線性組合4.2281.040有效案例中的N43由于n≥40,但有1≤T<5,所以選用χ2檢驗校正公式,即選擇結(jié)果的第二行數(shù)據(jù)進展分析假設檢驗:①建立檢驗假設:H0:π1=π2,即新舊防護服對皮膚病患病率無影響H1:π1,≠π2,即新舊防護服對皮膚病患病率有影響②確定假設檢驗水準:α=0.05③計算檢驗統(tǒng)計量:根據(jù)表2可得χ2=2.938,ν=1④確定P值,作出推斷結(jié)論:χ20.05,1=3.84,根據(jù)表2可得P=0.087>0.05,按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為新舊防護服對皮膚病患病率有影響。2.對11份工業(yè)污水測定氟離子(mg/L),每份水樣同時采用電極法及分光光度法測定,結(jié)果見表3。三人對兩種方法測定結(jié)果有無差異進展了統(tǒng)計分析,(1)甲用獨立樣本t檢驗,t=-0.072,P=0.943;(2)乙則先對每份樣品的差值做正態(tài)性檢驗(P<0.05),然后用配對設計的符號秩和檢驗(Wilco*onSignedRanksTest),得到z=1.633,P=0.102;(3)丙用配對設計的t檢驗,t=0.441,P=0.669。請問哪個人統(tǒng)計方法運用得當,并對該結(jié)果進展恰當分析表3兩法測定的氟離子濃度結(jié)果(mg/L)樣品號電極法分光光度法樣品號電極法分光光度法110.58.8716.414.7221.618.8819.517.2314.913.5912715.5430.227.61018.716.358.49.1119.59.567.77丙的統(tǒng)計方法運用得當分析:該樣本屬于同一樣本的兩個局部分別承受兩種不同處理,即應該采用配對樣本均數(shù)的t檢驗假設檢驗:①建立檢驗假設:H0:μd=0,即兩種檢測方法無差異H1:μd≠0,即兩種檢測方法有差異②確定假設檢驗水準:α=0.05③計算檢驗統(tǒng)計量:t=0.441,ν=10④確定P值,作出推斷結(jié)論:P=0.669>0.05,按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為兩種檢測方法有差異*研究者測定51名腫瘤患者蛋白激酶(PKC)水平以及*單核苷酸多態(tài)性(SNP)的3種基因型GG、GA、AA(詳見下表),他欲分析男、女PKC水平間有無差異,用什么統(tǒng)計分析方法?又想了解3種基因型PKC水平間有無差異,用什么統(tǒng)計方法分析(PKC數(shù)據(jù)經(jīng)正態(tài)性檢驗服從正態(tài)分布)性別基因型PKC性別基因型PKC性別基因型PKC男GA65.8男AA67.6女GA70.4男GA71.4男AA68.4女GA74男GA76.6男AA71.8女GA75.2男GA78.2男AA73.5女GA80.2男GA79.8男AA80.6女GA84.5男GA80.2男AA60.8女GA85.4男GA80.4男GG38.2女GA89.2男GA82.4男GG39.2女AA60.5男GA82.8男GG39.4女AA52.6男GA85.6男AA45.8女AA62.6男GA86.8男GA46.8女AA60.4男GA87.2男GG49.6女AA74.2男GA88.6男AA49.6女GG41.2男AA53.2男AA52.4女GA41.4男AA58.2男AA52.8女GA42.6男AA65.5男GA67.8女GA44.5男AA67.4男AA68.8女AA52.4分析男女PKC水平間有無差異應該用兩獨立樣本的t檢驗①建立檢驗假設:H0:μ1=μ2,即男女PKC水平間無差異H1:μ1≠μ2,即男女PKC水平間有差異②確定假設檢驗水準:α=0.05③計算檢驗統(tǒng)計量:t=0.511,ν=49④確定P值,作出推斷結(jié)論:P=0.612>0.05,按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為男女PKC水平間有差異〔2〕分析3種基因型PKC水平間有無差異應選用完全隨機設計資料的方差分析,并進展3組均數(shù)間的兩兩比擬①建立檢驗假設:H0:3種基因型PKC水平總體均數(shù)水平一樣H1:3種基因型PKC水平總體均數(shù)水平不全一樣②確定假設檢驗水準:α=0.05③計算檢驗統(tǒng)計量:F=16.608④確定P值,作出推斷結(jié)論:P=0.000<0.05,按α=0.05水準,拒絕H0,差異有統(tǒng)計學意義,所以可以認為3種基因型PKC水平總體均數(shù)水平不全一樣。為了進一步了解三組間均值兩兩比擬情況,SNK檢驗顯示1、2組,1、3組和2、3組之間均有統(tǒng)計學意義,可認為3種基因型PKC水平完全不相等。有28份白喉病人的咽喉涂抹標本,把每份標本分別接種在甲、乙兩種白喉桿菌培養(yǎng)基上,觀察兩種白喉桿菌生長情況,“+〞號表示生長,“-〞號表示不生長,結(jié)果如下表。問兩種白喉桿菌培養(yǎng)基的效果有無差異?甲種乙種合計+-+11〔a〕9〔b〕20-1〔c〕7〔d〕8合計121628〔1〕建立檢驗假設H0:總體π1=π2,即兩種白喉桿菌培養(yǎng)基的效果一樣H1:總體π1,≠π2,即兩種白喉桿菌培養(yǎng)基的效果不同〔2〕確定假設檢驗水準:α=0.05〔3〕計算檢驗統(tǒng)計量:本例b=9,c=1,b+c<40,〔4〕確定P值,作出推斷結(jié)論:χ2=4.90>χ20.05,1=3.84,P<0.05,按α=0.05水準,拒絕H0,承受H1,差異有統(tǒng)計學意義,可認為甲、乙兩種白喉桿菌培養(yǎng)基的效果有差異,甲培養(yǎng)基培養(yǎng)效果優(yōu)于乙培養(yǎng)基。四、補充知識點1.頻數(shù)分布表的用途:①描述資料的分布特征和分布類型,②便于進一步計算有關指標或進展統(tǒng)計分析,③發(fā)現(xiàn)特大、特小的可疑值,④據(jù)此繪制頻數(shù)分布圖2.正態(tài)分布圖形的特征:①υ是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以*=υ為對稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)一樣,均等于υ;②σ描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,σ越大,數(shù)據(jù)分布越分散,σ越小,數(shù)據(jù)分布越集中。σ也稱為是正態(tài)分布的形狀參數(shù),σ越大,曲線越扁平,反之,σ越小,曲線越瘦高3.正態(tài)分布的應用:①估計頻數(shù)分布,②制定參考值圍,③質(zhì)量控制,④正態(tài)分布是許多統(tǒng)計方法的理論根底4.t分布圖形的特征:①以0為中心,左右對稱的單峰分布,②t分布是一簇曲線,其形態(tài)變化與n〔確切地說與自由度ν〕大小有關。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近標準正態(tài)分布〔u分布〕曲線5.醫(yī)學參考值圍的制定標準誤與標準差7.方差分析的根本思想:就是根據(jù)資料的設計類型,即變異的不同來源將全部觀察值總的離均差平方和及自由度分解為兩個或多個局部,除隨機誤差外,其余每個局部的變異可由*個因素的作用〔或*幾個因素的交互作用〕加以解釋,如各組均數(shù)的變異SS組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F分布作出統(tǒng)計推斷判斷各因素對各組均數(shù)有無影響。8.卡方檢驗公式選擇①當n≥40,且所有格子的T≥5時,選用卡方檢驗根本公式或?qū)S霉舰诋攏≥40,但有1≤T<5時,選用卡方檢驗校正公式或改用四格表資料Fisher③當n<40,或T<1時,須用四格表資料Fisher確切概率法配對設計的符號秩和檢驗方法(1)假設:H0:差值總體中位數(shù)Md=0,H1:Md≠0,α=0.05(2)求差值(3)編秩次:依差值的絕對值從小到大編秩次。編秩次時遇差數(shù)等于0,舍去不計,同時樣本例數(shù)減1;遇絕對值相等差數(shù),符號一樣順次編秩次,符號相反取平均秩次,且符號相反。(4)求秩和并確定檢驗統(tǒng)計量:分別求出正負秩次之和,正秩和以T+表示,負秩和的絕對值以T-表示。T+及T-之和應等于n(n+1)/2,任取T+(或T-)作檢驗統(tǒng)計量T。(5)確定P值和作出推斷結(jié)論:當n≤50時,查T界值表,得出P值。假設檢驗統(tǒng)計量T值在上、下界值圍,其P值大于表上方相應概率水平;假設T值在上、下界值上假設圍外,其P值小于表上方相應概率水平。10.配對設計的形式有:①兩種同質(zhì)受試對象分別承受兩種不同的處理,②同一受試對象或同一樣本的兩個局部分別承受兩種不同的處理,③同一受試對象承受*種處理前后。注意:做t檢驗時,一定要分清是配對樣本的t檢驗還是兩獨立樣本的t檢驗;做卡方檢驗時,一定要注意公式的適用條件。大綱:t檢驗:單樣本均數(shù)的t檢驗、配對樣本均數(shù)的t檢驗、兩獨立樣本均數(shù)的t檢驗方差分析:完全隨機設計資料的方差分析、隨機區(qū)組資料的方差分析、多組均數(shù)比擬的方差齊性檢驗、多組均數(shù)間的兩兩比擬名解小概率事件:假設在一次觀察或?qū)嶒炛?事件發(fā)生的概率很小,可以看做很可能不發(fā)生,該事件稱小概率事件。不同研究問題對小概率的要求不同,習慣上,把P≤0.05或P≤0.01稱為“小概率事件〞,這種小概率事件雖然不是不可能發(fā)生,但一般認為小概率事件在一次隨機試驗中根本不會發(fā)生,這就是小概率原理。抽樣誤差:由于個體差異存在造成的樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的差異。抽樣誤差是隨機的、不可預知的、不可防止的,但抽樣誤差是有規(guī)律的可以被認識的,其大小用標準誤表示,可以用適當增加樣本含量來減小抽樣誤差。同質(zhì):一個總體中包含許多個體,性質(zhì)一樣的事物為同質(zhì),否則稱異質(zhì)。變異:同質(zhì)事物間,各觀察單位的差異。標準差:反映一組數(shù)據(jù)的平均離散水平或變異程度,適用于對稱分布的資料,特別對正態(tài)分布或近似正態(tài)分布的資料。方差開平方:公式見書。四分位數(shù)間距:比極差穩(wěn)定,并未考慮所有變量值,常用于偏態(tài)分布資料的變異度,Q=P75-P25均數(shù)的標準誤:用于表示均數(shù)抽樣誤差大小的指標,反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)抽樣誤差的大小。標準正態(tài)分布:正態(tài)分布經(jīng)轉(zhuǎn)換后變?yōu)榭傮w均數(shù)為0,總體標準差為1的正態(tài)分布稱標準正態(tài)分布。均數(shù)為95%的CI值〔置信區(qū)間〕:按一定的概率或可信度〔1-a〕用一個區(qū)間來估計總體參數(shù)所在的圍,這個圍稱作可信度為1-a的可信區(qū)間〔CI〕又稱置信區(qū)間,95%的可信區(qū)間中的95%是可信度,即,所求的可信區(qū)間包含總體參數(shù)的可信程度為95%10、第一類錯誤:如實際情況與H0一致,僅僅由于抽煙的原因,使得假設檢驗的結(jié)論為拒絕原本正確的H0,導致推斷結(jié)論錯誤,這樣的錯誤稱為~第二類錯誤:如實際情況和H0不一致,由于抽樣原因使得假設檢驗的結(jié)論為不拒絕原本錯誤的H0,則導致了另一種推斷錯誤,這樣的錯誤稱為~檢驗效能:1-b成為檢驗效能,即當兩總體確實有差異〔H0不成立〕,按照事先確定的檢驗水準a,假設檢驗能發(fā)現(xiàn)該差異〔拒絕H0〕的能力,1-b也取單尾11、P值:是指H0成立從所規(guī)定的總體中隨機抽樣,所獲得等于及大于〔或等于及小于〕現(xiàn)有樣本計算獲得的檢驗統(tǒng)計量值的概率。12、相關系數(shù):定量描述兩變量間線性關系的密切程度和相關方向的統(tǒng)計指標。r無單位,-1≤r≤1,r值為正—正相關,為負,—負相關,|r|=1---完全相關,|r|=0---零相關。13、調(diào)查設計的四種方法1〕單純隨機抽樣:保證總體中每一個個體都有同等的時機被抽出來作為樣本的抽樣方法2〕系統(tǒng)抽樣:即先將總體的全部個體按與研究現(xiàn)象無關的特定排序編號,依次每隔假設干抽取的一個個體組成樣本3〕分層抽樣:先將總體全部個體按*種特征分成假設干層,再從每層隨機抽取一定數(shù)量的個體合起來組成樣本4〕整群抽樣:先將總體分成假設干群體,形成一個抽樣框,從中隨機抽取幾個群體組成樣本,對抽中群體的全部個體進展調(diào)查14、雙盲:受試對象和實驗執(zhí)行者都不知道受試對象分在哪一組。二、填空1、兩獨立樣本t檢驗應用條件:小樣本、隨機正態(tài)、方差齊同;配對t檢驗應用條件差值服從正態(tài)分布;樣本t檢驗應用條件:小樣本、隨機正態(tài)2、醫(yī)學參考值圍確定的方法:正態(tài)分步法、百分位數(shù)法3、秩和檢驗的應用條件等級資料、原始資料分布不明確、偏態(tài)資料4、相關分析分類正相關、負相關、零相關5、等級相關分析條件等級資料、原始資料分布不明確、偏態(tài)資料6、調(diào)查設計按研究對象分類有哪些?全面調(diào)查、抽樣調(diào)查、典型調(diào)查;按時間分為病例對照和隊列研究。7、等概率抽樣有哪些?單純抽樣、系統(tǒng)抽樣、整群抽樣、分層抽樣8、調(diào)查表考評從哪些方面考評信度、效度、可承受度9、實驗設計三要素受試對象、處理因素、實驗效果三原則重復、對照、隨機10、隨機的種類隨機抽樣、隨機分組、實驗順序隨機11、實驗設計中影響樣本含量因素一類錯誤概率、二類錯誤概率、容許誤差、總體標準差12.衛(wèi)生統(tǒng)計學的研究對象是變異數(shù)據(jù)13.統(tǒng)計推斷包括區(qū)間估計、假設檢驗14、描述正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論