中醫(yī)統(tǒng)計學復習_第1頁
中醫(yī)統(tǒng)計學復習_第2頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、1.中醫(yī)統(tǒng)計學:處理中醫(yī)理論與實踐中的同質性和變異性的科學與藝術.以概率論和數(shù)理統(tǒng)計原理為基礎,以中醫(yī)理論與實踐為主體,通過對數(shù)據(jù)的搜集、整理、分析和推斷,從而達到探討中醫(yī)理論與方法內(nèi)在規(guī)律的目 的.2. 總體:根據(jù)研究目的確定的同質觀測單位的集合.(無限總體和有限總體)3. 樣本:從統(tǒng)計總體中隨機抽取的、具有代表性的部分觀測單位的集合.4. 同質:構成總體的各個觀測單位在某一方面或某幾方面的性質相同或基本相同.5. 變異:在同質基礎上各觀察單位(或個體)之間的差異6. 事件:泛指事物發(fā)生的某種情況或在調(diào)查、 觀察和實驗中獲得的某種結果.(確定性事件和隨機事件)8. 頻率:某種現(xiàn)象在重復隨機試

2、驗中發(fā)生的比例.9. 概率:某隨機事件 A 發(fā)生的可能性大小,記為 P(A).10. 頻數(shù):指研究對象安某屬性進行分組后,各組中觀測值的個數(shù).11. 眾數(shù):一群數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的值.12. 隨機:在抽樣、分組、實驗/試驗順序安排過程中,每個觀測單位都不受研究者主觀意愿驅使,具有同等的機會被抽中、分配或安排,目的是保證樣本具有代表性.13. 隨機變量:隨機事件各種不同的結果.(離散型變量和連續(xù)型變量)14. 量值:隨機事件各種具體的觀測值.15.誤差:實際觀測值與真值之差個差或樣本指標與總體指標之差.(非隨機誤差(粗差、系統(tǒng)誤差)和隨機誤差(測量誤差、抽樣誤差)16. 分布:隨機變量取

3、值的變化及相應的頻率變化的規(guī)律性.17. 頻數(shù)分布:指觀測值按大小分組,各個組段內(nèi)觀測值個數(shù)(頻數(shù))的分布,是了解數(shù)據(jù)分布形態(tài)特征和規(guī)律的基礎.18. 正態(tài)分布:(高斯分布)一種常見的、最重要的連續(xù)型對稱分布 標準正態(tài)分布:期望值卩=0,標準差(T =1 的正態(tài)分布19. 醫(yī)學參考值范圍:為了減小變異的影響,提高參考值作為為判斷正?;虍惓5目煽啃运_定的絕大多數(shù)正常人醫(yī)學參考值的波動范圍.20. 構成比:事物內(nèi)部各組成部分所占整體的比重或分布,常用百分數(shù)表示.構成比=(某現(xiàn)象內(nèi)部某一部分的個體數(shù)/某現(xiàn)象內(nèi)部個體數(shù)之和)X100%21. 相對比:描述兩個有關指標的比例關系(通常以倍數(shù)或百分數(shù)表示

4、). 率:表示某現(xiàn)象發(fā)生的頻率或強度,是頻率指標.22. 抽樣誤差:由個體差異和隨機抽樣造成的樣本和總體、樣本與樣本相應統(tǒng)計指標之 間的差異.23. 區(qū)間估計:結合樣本統(tǒng)計量和標準誤確定一個具有較大可信度的包含總體參數(shù)的區(qū) 間,該區(qū)間稱為總體參數(shù)的 1可信區(qū)間(CI)24. 無效假設:記為“呂,表示差別由抽樣誤差引起,無統(tǒng)計學意義.備擇假設:記為 -表示差別為處理因素所致,有統(tǒng)計學意義.分為單側和雙側兩種 形式25. 檢驗水準: (顯著性水準)符號為,事先規(guī)定的對假設成立與否作出判斷的依據(jù),常 取 0.05或 0.0126. P 值:在檢驗假設所規(guī)定的總體中作隨機抽樣,獲得等于及大于/小于現(xiàn)有

5、樣本統(tǒng)計 量的概率,即各樣本統(tǒng)計量的差異來自抽樣誤差的概率,是判斷成立與否的依據(jù). 確定 P 值的方法有查表法和計算法27.1 型錯誤:統(tǒng)計推斷結果拒絕了實際上成立的 H。,犯了”棄真”的錯誤.指組間差異 實際上不存在,統(tǒng)計推斷結果卻錯誤地認為存在組間差異,故稱為以假為真 的錯誤為陽性錯誤,其概率用表示II 性錯誤:統(tǒng)計推斷結果不拒絕實際上是不成立的 H。,犯了”存?zhèn)巍钡腻e誤.指組間 確實存在差異,統(tǒng)計推斷結果卻未檢查出該差異,故稱為以真為假的錯誤 為陰性錯誤,其概率用 N 表示28. 檢驗效能:(把握度)符號為 1 -卩,當組間確實存在差異時,按所規(guī)定的水平能發(fā)現(xiàn)組間差異的能力,或當日計不成

6、立時拒絕 Hu 的概率29. 秩次:全部觀測值按順序排列的位序.秩和:同組秩次之和秩和檢驗:用于總體為非正態(tài)或不易確定的分布資料、不能或未加精確測量資料等 效率較高的非參數(shù)檢驗方法30. 相關:指一個變量增大,另一個變量也隨之增大或減少的共變現(xiàn)象相關關系:兩個變量有共變現(xiàn)象直線相關:判斷兩個變量之間有無直線相關關系并回答相關的方向和相關程度如何的統(tǒng)計分析方法相關系數(shù):符號為 r,說明具有相關關系的兩個變量間相關關系的密切程度與相關方 向的指標.31. 直線回歸:用直線回歸方程或數(shù)學模型描述兩個變量間線性依存關系的一種統(tǒng)計分 析方法回歸系數(shù):回歸方程中表示自變量 x 對因變量 y 影響大小的參數(shù)

7、,在直線回歸方程中卜門咔磁中 x 每改變一個單位,y 變動 b 個單位.32. 無序資料:(名義資料)取值通常是具有某種特征或屬性的個數(shù),特點是可在非數(shù)字中取值,各類之間具有性質上的差異;有序資料:(等級資料或半定量資 料),特點是各等級間有程度或量的差異,即可按數(shù)量的相對大小或程度 的高低排出順序.1. 統(tǒng)計學的主要內(nèi)容:研究設計(專業(yè)設計和統(tǒng)計學設計)、統(tǒng)計描述、統(tǒng)計推斷(參數(shù) 估計和假設檢驗)2. 假設檢驗的步驟:1)建立檢驗假設、確定檢驗水準 2)選擇檢驗方法、計算統(tǒng)計量 3) 確定 P 值、做出推論3. 專業(yè)設計的基本要素:受試對象、處理因素和試驗效應4. 統(tǒng)計設計的基本原則:對照(

8、空白、實驗、安慰劑、標準、歷史、自身、相互和復合處理對照)、隨機(單純、系統(tǒng)、整群和分層隨機抽樣)、均衡、重復5. 受試對象的選擇需滿足:對處理因素有較強的敏感性和特異性、 對處理因素有較穩(wěn)定的反應性、可行性6. 數(shù)值變量的統(tǒng)計描述:1)集中趨勢描述:描述一組觀測值集中趨勢的指標,是對同質基礎上的樣本或總體一般特征的指標.主要作用是作為一組觀測值的代表,表 明該組觀測值集中趨勢的特征便與同類研究對象進行對比分析.常用的平均 數(shù)有算數(shù)平均數(shù)(總體均數(shù)卩、樣本均數(shù)又)、幾何平均數(shù) G 和中位數(shù) M;2)離散 趨勢描述:及變異性指標,描述一組同質觀測值變異程度大小(即數(shù)據(jù)的均勻性)的綜合指標.常用的

9、變異性指標有極差 R、四分位數(shù)間距 Q、標準差 s、變異系 數(shù) CV 標準誤 SE.7. 中醫(yī)統(tǒng)計資料類型:1)計量資料:由數(shù)值變量產(chǎn)生的資料,即對每個觀察單位用計量方法測得某項標志數(shù)值大小所獲得的資料.特點是變量值大多有單位,其具體取 值通常是正實數(shù)(零、正實數(shù)和小數(shù));2)計數(shù)資料:由分類變量產(chǎn)生的資料,即 對每個觀察單位按某種屬性分組計數(shù)而得的資料.特點是變量值表現(xiàn)為互不相 容的屬性或類別,無度量衡單位.分為二分類資料(按互不相容的屬性分類)和多 分類資料(按不同類別分類(無序資料和有序資料)8. 直線相關的注意事項:1)線性相關表示兩個變量間的關系是雙向的,當散點圖出現(xiàn)直線趨勢時再做分

10、析2) 相關系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的資料3) 樣本相關系數(shù) r 是總體相關系數(shù)1的一個估計值,r 與間存在抽樣誤差,必須作假 設檢驗4)相關分析是用相關系數(shù)來描述兩個變量間相互關系的密切程度和方向,相關關系不一定是因果關系9. 應用相對數(shù)的注意事項:1) 計算時分母不宜太小,若觀察單位數(shù)較小,宜直接用絕對數(shù)表示;2)觀察單位數(shù)不等的幾個率不能直接相加求其合計率;3) 資料對比時應注意可比性;4)資料分析時不能已構成比代替10. 直線回歸注意的問題:1)作回歸分析要有實際意義,不能把毫無關聯(lián)的兩種現(xiàn)象做回歸分析.2) 在進行直線回歸分析前應先繪制散點圖,觀察點的分布有直線趨勢時

11、才適宜作直線回歸分析,若呈曲線趨勢宜直線化后再分析3) 適用范圍一般以自變量的取值范圍為限,在此范圍內(nèi)求出的估計值稱為內(nèi)插,超過此范圍的值稱為外 延,應避免外延.11. 應用檢驗假設注意事項:1) 事先進行嚴密的統(tǒng)計學設計:除對比的主要因素外,其他可能影響結果的因素在對比的組間應相同或相近2) 單側檢驗和雙側檢驗的選擇:雙側檢驗的檢驗思路比單側寬且無限制條件,較為常用,適用于對預試驗結果分析,雙側的接受域位于某一特定分布的中部,拒絕 域分布在兩側,而單側檢驗的接受域和拒絕域各占某一特定分布的一側,同一檢U驗水準下單側比雙側界值小、拒絕域大、更易得出拒絕 門 03) 靈活確定 水準:根據(jù)實際工作

12、中對不同分析目的和要求,選用的 往往有一定的靈活性4) 選擇正確地統(tǒng)計方法:應根據(jù)分析目的、不同的資料類型及分布、設計方案的種類、樣本量的大小等選用適當?shù)臋z驗方法5) 正確理解統(tǒng)計推斷的意義:統(tǒng)計推斷結論是依據(jù)現(xiàn)有的設計、研究方法與條件、資料及分析目的和要求所取的水準,采用的統(tǒng)計分析方法等做出具有相應概率 的解釋,不宜將結論的意義擴大或縮小6) 假設檢驗的結論不能絕對化:統(tǒng)計學結論是具有概率性質的推論,不能使用”肯定”、”證明”、”一定”、”說明”等詞,此外有統(tǒng)計學意義時不一定有專業(yè) 意義.(假設檢驗是否具有統(tǒng)計學意義取決于被研究事物有無本質差異、抽樣誤 差的大小、所選用的高低及死單側還是雙側

13、)7)結合專業(yè)知識作出推論:假設檢驗可幫助研究者作出合理的推斷,不能代替研究者做出專業(yè)結論8)CI 與假設檢驗的區(qū)別與聯(lián)系:CI 推斷參考值的范圍(量的大?。僭O檢驗判斷各參數(shù)間有無質的不同12. 統(tǒng)計表的結構:1)表號:位于頂線上方、標題的左側,與標題之間的空 2 個字符,以阿 拉伯數(shù)字表示2)標題:位于頂線上方、標號之后,簡明扼要地說明表的內(nèi)容;3)標目:橫標目是統(tǒng) 計表的主語,表示被說明事物的主要標志,縱標目是統(tǒng)計表的謂語,說明主語的各 項指標.對標目的要求是文字簡明、層次清楚,一張表內(nèi)不要安排過多標目;4)線條:一般只出現(xiàn)頂線、標目線和底線 3 條等長線;5)數(shù)字:一律采用阿拉伯數(shù)字

14、,同 一指標的小數(shù)位數(shù)應一致,位次對齊;6)備注:一般不列入表中,必要時可用* 表示率和構成比的區(qū)別區(qū)別率構成比概念表示某現(xiàn)象發(fā)生的頻率或強度表示事物內(nèi)部各組成部分所占比重或分 布特點某一分率的改變對其他無影響任一部分比重的增減都會影響其他部分意義反映事物的普遍性及嚴重程度事物按一個特征分類時,反映事物內(nèi)部 組成的結構特征事物按兩個特征分類時,反映兩個特征 之間的關聯(lián)關系合計各個率不能直接相加一定為 100%標準差和均數(shù)標準誤的區(qū)別標準差均數(shù)標準誤意義描述個體觀測值間的變異程 度大小、描述同一總體中隨機抽出 n 相同的 多個樣本均屬建德離散性公式Js = vS(xx)/(n- 1)-S/vn_

15、-與 n 的關系隨著 n 的增大逐漸趨于穩(wěn)定隨著 n 的增大逐漸減小,與 n 的平方根成反比用途表示觀測值變異大小 結合均數(shù)描述正態(tài)分布的特 征在正態(tài)分布時做參考值范圍 的估計計算變異系數(shù)和均數(shù)的標準 誤表示樣本抽樣誤差的大小 描述樣本均數(shù)的可靠性 結合均數(shù)估計總體均數(shù)的 CI進行均數(shù)間差別的假設檢驗總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別區(qū)別總體均數(shù)的可信區(qū)間參考值范圍的區(qū)別涵義根據(jù)抽樣分布原理,按預先規(guī)定的概率(1旳給出被估計總體均數(shù)肯德數(shù)值范 圍.表示某總體均數(shù)的可能范圍表示某項解剖、生理、生化等 指標絕大多數(shù)個體觀測值可能 出現(xiàn)的范圍 1計算a 已知a 未知:呦說” + t 叫片)正態(tài)分布

16、心血於(雙側) 非正態(tài)分布 P 梵卩 io。-豐(雙側)與 n 的 關系n 越大,CI 越小;n 無窮大,CI 趨近 0n 越大,參考值范圍越穩(wěn)疋用途估計總體均數(shù)估計某項指標絕大多數(shù)觀測單 位的波動范圍直線相關與回歸的區(qū)別和聯(lián)系直線相關直線回歸聯(lián)系(1)反映應變量 y 與自變量 x 的互依關系雙 向變化的關系體現(xiàn)應變量 y 隨自變量 x 變化的依存關系,單向的關系對兩個變量間的關系進仃描述,看是否有 關系、關系是否密切及關系的性質對兩個變量做定量描述,研究兩個變量 的數(shù)量關系只適用 x,y 服從雙變量正態(tài)分布資料既適用于 x,y 服從雙變量正態(tài)分布資 料,也適用于 y 服從雙變量正態(tài)分布,x

17、是可以精確測量和嚴格控制的變量r無單位,r的絕對值越大,兩變量的關系越 密切,相關程度越高b 有單位,b 的絕對值越大,回歸直線越陡,y 的平均變化越大兩事物或現(xiàn)象間存在相關關系,不一定是 因果關系兩事物或現(xiàn)象間存在因果關系,則必然 相關區(qū)別(1)同時計算 r 和 b,r 與 b 同正負,r 為正說明兩變量間的相互關系是同向變化的;b 為正說明 x 增(減)一個單位,y 平均增(減)b 個單位(2)r 和 b 的假設檢驗等價,即對同一樣本兩者的 t 值相等,故簡單的 r 的假設檢驗可代 替對 b 的假設檢驗|勻相關回歸可以互相解釋,稱為確定系數(shù),其可以從回歸的角度了解相關程度常用實驗設計方案的

18、特點設計方案水平特點完全隨機設 計 單因素,兩水平、多水平,不考慮混雜因素簡單方便,應用廣泛,容易進行統(tǒng)計分析,只能分析一個因素的作用,效率相對較低配對設計單因素,兩水平,考慮混雜因素能縮小受試對象間的個體差異,從而減少實 驗誤差,提咼實驗效率隨機區(qū)組設 計單因素多水平,不考慮混雜因素各隨機區(qū)組的受試對象數(shù)目相等,生物學特 點較均衡,縮小了組間差別,實驗效率較高SPSS 電腦實驗1. 單樣本 t 檢驗:1) 用 Explore 正態(tài)性檢驗:選擇 Alnalyze Descriptive statistics Explore(Dependent:測量值,plots按鈕:Normality plo

19、ts with test)2) 用 One-SampleT Test 單樣本檢測:選擇 Alnalyze CompareMeansOne-Sample T Test(右側上面的 Test 框:測量值,修改下面的 Test 框默認值(總體均數(shù))2. 配對 t 檢驗1)計算差值 d: 選擇 TransformfCompute Variable(Target Variable:d,Numeric expession:方法一,單擊運算鍵“ -” Numericexpession:法二)2)對差值 d 用 Explore 正態(tài)性檢驗:(Dependent:d,同上)3)配對 t 檢驗:選擇 Alnaly

20、zefCompare MeanfPaired-Sample T Test(Paired Variable:方法一、方法二)3. 方差齊性檢驗1) 用 Explore 正態(tài)性檢驗,Spread vs.level with levene testfUntransformed4. 獨立樣本 t 檢驗1) 選擇 AlnalyzefCompare MeanfIndependent-Samples T Test(Test 框:測量值 d,grouping:組別,Define groups:1 、2 等)1. 完全隨機設計 F 檢驗:1)選擇 Aln alyzefGen eral Lin ear Model

21、fUni variate(Dependent:測量值,Fixed Factor(s):組別,Option 視窗中 Estimated MarginalMeanfDisplay Means for:組另 ,Display: Descriptive statistics和Homogeneity testsfContinuefOK)2. 隨機區(qū)組設計 F 檢驗:1)選擇 Aln alyzefGen eral Lin ear ModelfUni variate(Dependent:測量值,Fixed Factor(s):方法、藥物;Model 視窗中選擇 CustomfModel:方法、藥物,Sum

22、of Squares:Type III,fInclude intercept inmodelfContinue;Post Hoc 視窗中,Post Hoc Test for:方法,S-N-KfContinue ;Option 視窗中 Display Means for: 組另,Display: Descriptive statisticsfContinuefOK)1. 成組設計四格表:檢驗:1)加權頻數(shù):DatafWeihgt casesfWeihgt case by(將頻數(shù)變量選入框中返回)2) 檢驗:選擇 AlnalyzefDescriptive statisticsfCrosstabsf

23、”組別fRow(s) ”以及”結果fColumn(s) ”對話框fstatisticsf_Chi-squarefContinuefOK2. 配對設計四格表 F:1 檢驗:1)加權頻數(shù):DatafWeihgt casesfWeihgt case by(將頻數(shù)變量選入框中返回)2) 檢驗: 選擇 AlnalyzefDescriptive statisticsfCrosstabsf”新法fRow(s) ”以及”舊法fColumn(s) ”fstatisticsfMcNemafContinuefOK3. RXC 表.檢驗:1)加權頻數(shù):DatafWeihgt casesfWeihgt case by(

24、將頻數(shù)變量選入框中返回)2) 檢驗:選擇 AlnalyzefDescriptive statisticsfCrosstabsf”組別fRow(s) ”以及”結果fColumn(s) ”fstatisticsfChi-squarefContinuefOK1.直線相關分析:1)選擇 AlnalyzefCorrelatefBivariatef在 Bivariate Correlations的視窗中,將進食量、增重量兩變量同時選中,從左邊源變量框中移置到由框 中fOK2.直線回歸分析:1)選擇 Al nalyzefRegessionfLin earf在 Lin ear Regessio n 的視窗中,

25、將左邊“收縮壓“變量送入右邊 Dependent 框中,左邊”年齡”變量送入右邊Independent 框中fOK單樣本 t 檢驗配對設計資料 的t 檢驗獨立樣本 t 檢 驗h = M2(叫-1)琦+ 5 廠 比+兔-2山=旳1z 111 才 t=,X,1 2|計算均差n:平方和% =盹T襯=女-竽 = % - %計算自由計算均方MS曲廠閭/v外腫MS組內(nèi)=%/伽計算 F 值計算均差平方和7盼略S零卷(Xi)2(ZX)2爼二nN二券一勇總-汎理-55冊計算自由v, = N - 1, v性理=k- 1, v乂紐二口 一1.帖謂蚤=*思-卄處理紐計算均方応處理=超處理/%和眄細=闿呦/*區(qū)如MS融加/片削計算 F 值F處理二MS處理加仏F細二組/M沁T1行X列表或眄二叫二亡T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論