




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)分析的策略在研究設計思緒指導下進行醫(yī)學科學研究,研究結(jié)果經(jīng)常以數(shù)據(jù)形式呈現(xiàn),這些數(shù)據(jù)提供了豐富的信息。然而,如何從大量的看似雜亂無章的數(shù)據(jù)中萃取和提煉有用的信息,以揭示其中隱含的內(nèi)在規(guī)律,幫助研究者進行判斷或推理,還需要對這些紛繁復雜的數(shù)據(jù)進行分析。數(shù)據(jù)分析是分析和解決變量間關(guān)系的理論與方法,所涉及變量常被分為解釋變量和反映變量,解釋變量又稱分組變量、協(xié)變量等,反映變量是表達實驗效應的變量或指標。變量的觀測值構(gòu)成數(shù)據(jù)或資料,常有計量資料、計數(shù)資料和等級資料之分。數(shù)據(jù)分析指的是對數(shù)據(jù)進行記錄分析,就是根據(jù)抽樣研究的方法,運用概率論與數(shù)理記錄的原理,對樣本信息進行分析和研究,從而對所研究的事物的記錄規(guī)律性作出概率性的估計和推斷。具體內(nèi)容涉及數(shù)據(jù)的變量變換、記錄量的選擇策略、參數(shù)估計與假設檢查方法應用策略。第一部分數(shù)據(jù)的變量變換策略許多記錄分析方法對數(shù)據(jù)有一定規(guī)定,如檢查、檢查,規(guī)定樣本獨立地來自正態(tài)總體,方差齊同;又如直線回歸分析規(guī)定自變量與應變量呈線性關(guān)系,每個相應的總體為正態(tài)分布,各個正態(tài)分布的總體方差相等,各次觀測彼此獨立。然而,仍有大量的醫(yī)學資料往往不滿足上述規(guī)定,在分析過程中對資料進行變量變換(transformationofvariable)是解決問題的途徑之一。恰當?shù)臄?shù)據(jù)變換可以一定限度上使資料滿足記錄分析方法的規(guī)定,如使資料符合正態(tài)化、方差齊同化、曲線直線化等規(guī)定。常用的變量變換方法有對數(shù)變換(transformationoflogarithm)、平方根變換(transformationofsquareroot)、平方根反正弦變換(transformationofinversesine)、倒數(shù)變換(transformationofreciprocal)、概率單位變換(transformationofprobabilityunit)、logit變換(transformationoflogit)、反雙曲正切變換(transformationofinversehyperbolictangent)、得分變換(transformationofscore)、box-cox變換(transformationofbox-cox)等。第二節(jié)記錄量的選擇策略一、概念記錄量(statistic)是由樣本觀測值計算出來的,反映樣本分布特性的指標。對反映變量特性的描述中,計量資料有集中趨勢指標與離散限度指標,計數(shù)資料與等級資料有相對數(shù)指標;對于解釋變量和反映變量間關(guān)系的描述,有互依關(guān)系指標、依存關(guān)系指標等。如何從眾多記錄量中選擇適宜的記錄量描述樣本分布特性是至關(guān)重要的。二、選擇記錄量的策略數(shù)據(jù)分析涉及眾多記錄量,基于分析目的,通常依據(jù)資料類型、資料特性、解釋變量和反映變量個數(shù)等來選擇適宜的記錄量。表9-1計量資料常用記錄量的選擇策略反映變量數(shù)資料特性不同分析目的下的常用記錄量平均水平變異限度單個反映變量單峰對稱分布,特別正態(tài)分布資料算術(shù)均數(shù)方差、標準差、變異系數(shù)*單個反映變量各種分布類型資料,但重要是偏態(tài)分布資料,分布一端或兩端無確切數(shù)值的資料中位數(shù)四分位間距、全距單個反映變量等比級數(shù)資料,經(jīng)對數(shù)變換呈對稱分布資料,特別對數(shù)正態(tài)分布資料幾何均數(shù)—多個反映變量多元正態(tài)分布均數(shù)向量協(xié)方差矩陣*重要用于度量衡單位不同或均數(shù)相差懸殊的多個變異限度的比較表9-2計數(shù)資料與等級資料常用記錄量的選擇策略資料特性重要分析目的常用記錄量二分類計數(shù)資料某現(xiàn)象發(fā)生的頻率或強度率二分類或多分類計數(shù)資料、等級資料某事物內(nèi)部各組成部分所占比重構(gòu)成比此外,相對比也是常用的派生記錄量指標,是兩個有關(guān)指標之比,旨在描述兩個指標間比例關(guān)系。這兩個有關(guān)的指標可以是基于計量資料、計數(shù)資料而計算出的記錄量,也可以是某絕對數(shù)。表9-3解釋變量與反映變量間關(guān)聯(lián)性常用記錄量的選擇策略解釋變量()個數(shù)反映變量()個數(shù)資料類型資料特性重要分析目的分析方法常用記錄量11計量資料線性、獨立、正態(tài)、等方差與的線性依存關(guān)系直線回歸分析回歸系數(shù)21計量資料線性、獨立、正態(tài)、等方差、、…與的線性依存關(guān)系多元線性回歸分析偏回歸系數(shù)21為計數(shù)資料、等級資料非線性各因素危險度大小logistic回歸分析回歸系數(shù)優(yōu)勢比21截尾變量為計數(shù)資料;時間變量為計量資料非線性各因素危險度大小Cox回歸分析回歸系數(shù)風險比11計量資料線性、獨立、二元正態(tài)、等方差相關(guān)的限度與方向直線相關(guān)分析Pearson相關(guān)系數(shù)11計量資料或等級資料不服從雙變量正態(tài)分布、總體分布類型未知、有不擬定值、雙向有序且、屬性不同的列聯(lián)表相關(guān)的限度與方向等級相關(guān)分析Spearman等級相關(guān)系數(shù)、Kendall等級相關(guān)系數(shù)11計數(shù)資料列聯(lián)表關(guān)聯(lián)限度關(guān)聯(lián)性分析Pearson列聯(lián)系數(shù)11二分類計數(shù)資料配對四格表關(guān)聯(lián)限度關(guān)聯(lián)性分析點相關(guān)系數(shù)11為計量資料,為二分類變量服從正態(tài)分布關(guān)聯(lián)限度關(guān)聯(lián)性分析點雙序列相關(guān)系數(shù)21計量資料多元正態(tài)分布多個變量同時與某一變量相關(guān)的限度多元線性相關(guān)分析復相關(guān)系數(shù)21計量資料多元正態(tài)分布其他變量固定期,某兩個變量間相關(guān)限度與方向多元線性相關(guān)分析偏相關(guān)系數(shù)22計量資料—兩組變量之間的相關(guān)限度典型相關(guān)分析典型相關(guān)系數(shù)第三節(jié)參數(shù)估計方法應用策略一、概念描述某總體特性的指標稱為參數(shù)(parameter),但在抽樣研究中,參數(shù)往往是未知的,抽樣研究的目的正是通過樣本推斷參數(shù)。參數(shù)估計(estimationofpopulationparameters)是記錄推斷重要內(nèi)容之一,分為點估計(pointestimation)與區(qū)間估計(intervalestimation)兩種形式。點估計就是用相應樣本記錄量直接作為其總體參數(shù)的估計值,區(qū)間估計是按預先給定的概率()所擬定的包含未知總體參數(shù)的一個范圍。二、常用參數(shù)估計方法應用策略數(shù)據(jù)分析中常用記錄量均是其總體參數(shù)的點估計量,如樣本均數(shù)是總體均數(shù)的點估計量,樣本率是總體率的點估計量。良好的參數(shù)點估計量必須滿足:①無偏性:記錄量的數(shù)學盼望等于被估計參數(shù);②一致性:即當樣本含量無窮大時,記錄量等于參數(shù);③有效性:方差最小估計量為有效的估計量。對于參數(shù)的區(qū)間估計,可綜合考慮分析目的、準確度與精度、資料分布特性、樣本含量及其他有關(guān)條件等來選擇具體的估計方法。重要參數(shù)的區(qū)間估計方法(雙側(cè))如下。(一)正態(tài)總體均數(shù)的可信區(qū)間1.總體標準差已知或樣本含量足夠大時,總體均數(shù)的可信區(qū)間為(9-13)或(9-14)其中,是標準正態(tài)分布水準雙側(cè)分位數(shù)。一般求其95%可信區(qū)間,=1.96.2.總體標準差未知時,總體均數(shù)的可信區(qū)間為(9-15)其中是自由度的分布水準雙側(cè)分位數(shù)。一般求其95%可信區(qū)間,查t界值表得。(二)總體幾何均數(shù)的可信區(qū)間(9-18)其中,。(三)總體率的可信區(qū)間1.若較?。ǎ?采用查表法,獲得的(95%或99%)可信區(qū)間;2.若充足大且,采用正態(tài)近似法獲得的可信區(qū)間,的可信區(qū)間為(9-26)(四)Poisson分布資料總體均數(shù)的可信區(qū)間1.若樣本計數(shù),采用查表法,獲得的(95%或99%)可信區(qū)間。2.若樣本計數(shù),采用正態(tài)近似法獲得的可信區(qū)間,的可信區(qū)間為(9-29)(五)總體回歸系數(shù)的1-可信區(qū)間(9-30)其中,為回歸系數(shù)的標準誤,(六)總體均數(shù)的可信區(qū)間運用直線回歸方程,在處的總體均數(shù)的可信區(qū)間為(9-31)其中,為剩余標準差,。(七)總體相關(guān)系數(shù)的可信區(qū)間第一步,對樣本相關(guān)系數(shù)作反雙曲正切函數(shù)變換:(9-32)或(9-33)第二步,求的可信區(qū)間(,):(9-34)第三步,對(,)作反變換,求的可信區(qū)間:(9-35)第四節(jié)假設檢查方法應用策略一、概念假設檢查(hypothesistest)是對總體的參數(shù)或分布作出某種假設,然后采用適當?shù)姆椒ǎ鶕?jù)樣本提供的信息,根據(jù)小概率原理,推斷此假設是否成立,而作出應當拒絕或不拒絕該假設的一種記錄推斷方法,分為參數(shù)法與非參數(shù)法兩種,是數(shù)據(jù)分析的重要手段。根據(jù)分析目的,有對反映變量所服從的分布進行推斷的假設檢查;亦有對解釋變量不同組別間某個(或多個)反映變量進行比較的假設檢查,如對均數(shù)、方差或均數(shù)向量、率、構(gòu)成比等的假設檢查;尚有對解釋變量與反映變量間關(guān)系進行推斷的假設檢查,如對回歸模型、回歸系數(shù)、相關(guān)系數(shù)的假設檢查等。二、常用假設檢查方法應用策略假設檢查分為參數(shù)法與非參數(shù)法,在一般情況下,若資料滿足參數(shù)法應用條件,一方面考慮參數(shù)法,不滿足時才考慮非參數(shù)法。具體假設檢查方法的擬定離不開對以下幾個問題的思考。分析目的:明確假設檢查的目的,是推斷某樣本來自何種分布?是對兩組或多組反映變量進行比較?還是對解釋變量與反映變量間關(guān)系作出推斷?設計方案:辨析設計方案,把握眾多設計方案的區(qū)別與聯(lián)系。資料類型:判斷資料類型,面對的資料是計量的,還是計數(shù)或是等級的。解釋變量(分組變量)與反映變量的個數(shù):確認解釋變量(分組變量)與反映變量的個數(shù),是單個解釋變量對單個反映變量,還是“多”對“單”,“多”對“多”……。同時,須注意解釋變量的水平數(shù)。樣本含量:考慮樣本含量的大小,是小樣本還是大樣本。應用條件:不能忽略具體的應用條件,根據(jù)應用條件,選擇對的的假設檢查方法是獲得對的、可靠結(jié)論的基本保證。常用假設檢查方法應用策略如下。(一)單個反映變量的完全隨機設計研究1.計量資料(1)單樣本分析目的:推斷某個總體均數(shù)與已知總體均數(shù)(一般為標準值、理論值或通過大量觀測所得穩(wěn)定值等)是否不等。應用條件及方法選擇:樣本含量足夠大()時,可采用單樣本檢查或單樣本檢查。樣本含量不太大,資料滿足正態(tài)性規(guī)定或通過數(shù)據(jù)變換滿足規(guī)定期,可采用單樣本檢查;樣本含量不太大且資料不滿足正態(tài)性規(guī)定期,可采用非參數(shù)檢查,如單樣本wilcoxon符號秩檢查,其目的是推斷某個總體分布位置如中位數(shù)與已知總體分布位置是否不同。(2)兩樣本分析目的:推斷兩個總體均數(shù)是否不等。應用條件及方法選擇:兩組的樣本含量均較大(和)時,可采用兩大樣本比較的檢查或兩樣本檢查;樣本含量不太大,資料滿足正態(tài)性與方差齊性規(guī)定或通過數(shù)據(jù)變換滿足規(guī)定期,可采用兩樣本檢查或完全隨機設計資料的方差分析。樣本含量不太大滿足正態(tài)性不滿足方差齊性,可采用近似(’)檢查。若不滿足正態(tài)性或/和方差齊性,采用非參數(shù)檢查,如兩樣本wilcoxon秩和檢查、Kruskal-Wallis秩和檢查,其目的是推斷兩個總體分布位置是否不同。(3)多樣本分析目的:推斷多個總體均數(shù)是否不等。應用條件及方法選擇:資料滿足正態(tài)性與方差齊性規(guī)定或通過數(shù)據(jù)變換滿足規(guī)定期,可采用完全隨機設計資料的方差分析即檢查。資料不滿足正態(tài)性但不滿足方差齊性,可采用近似(’)檢查。若滿足正態(tài)性或/和方差齊性,采用非參數(shù)檢查,如Kruskal-Wallis秩和檢查,其目的是推斷多個總體分布位置是否不同。2.計數(shù)資料(1)單樣本分析目的:推斷某個總體率與已知總體率(一般為標準值、理論值或通過大量觀測所得穩(wěn)定值等)是否不等。應用條件及方法選擇:樣本含量較大且與均不太小,如且時,可采用單樣本檢查、單樣本檢查或二項分布直接計算概率法檢查;樣本含量較小時,可采用二項分布直接計算概率法檢查;樣本含量較大,如,或很小,如或時,可采用Poisson分布直接計算概率法檢查。(2)兩樣本或多樣本分析目的:推斷兩個或多個總體率(或構(gòu)成比)是否不等。應用條件及方法選擇:對于兩樣本率比較的四格表資料,樣本總例數(shù)且時,可采用兩樣本率比較的檢查、檢查或Fisher確切概率檢查;樣本總例數(shù)且時,可采用兩樣本率比較的校正檢查、校正檢查或Fisher確切概率檢查;樣本總例數(shù)、或四格表其他假設檢查方法所得概率十分接近檢查水準時,可采用Fisher確切概率檢查。對于多樣本率或兩組(或多組)樣本構(gòu)成比比較的表資料,的格子數(shù)不超過1/5時,可采用檢查或Fisher確切概率檢查;1/5以上格子的,或有一個格子的時,可采用Fisher確切概率檢查。3.等級資料對于等級資料,重要采用秩轉(zhuǎn)換的非參數(shù)檢查。分析目的:推斷兩個(或多個)總體分布(或分布位置)是否不同。應用條件及方法選擇:兩樣本比較時,可采用wilcoxon秩和檢查或Kruskal-Wallis秩和檢查;多樣本比較時,可采用Kruskal-Wallis秩和檢查。(二)單個反映變量的配對(配伍)設計研究1.計量資料(1)兩樣本(配對設計)分析目的:推斷兩個總體均數(shù)是否不等(或差值的總體均數(shù)與0是否不等)。應用條件及方法選擇:對子數(shù)較大()時,可采用配對差值的單樣本檢查;配對差值滿足正態(tài)性規(guī)定或通過數(shù)據(jù)變換滿足規(guī)定期,可采用配對檢查或配伍組設計(隨機區(qū)組設計)資料的方差分析;對子數(shù)不太大且差值不滿足正態(tài)性規(guī)定期,可采用非參數(shù)檢查,如配對wilcoxon符號秩檢查、配伍組設計(隨機區(qū)組設計)資料的Friedman秩和檢查,其目的是推斷兩個總體分布位置是否不同。(2)多樣本(配伍組設計,隨機區(qū)組設計)分析目的:推斷多個總體均數(shù)是否不等。應用條件及方法選擇:資料滿足正態(tài)性與方差齊性規(guī)定或通過數(shù)據(jù)變換滿足規(guī)定期,可采用配伍組設計(隨機區(qū)組設計)資料的方差分析;資料不滿足正態(tài)性與方差齊性規(guī)定期,可采用非參數(shù)檢查,如Friedman秩和檢查,其目的是推斷多個總體分布位置是否不同。2.計數(shù)資料分析目的:推斷兩個總體率是否不等。應用條件及方法選擇:配對四格表資料中,不相同結(jié)果頻數(shù)為與,如,可采用配對四格表資料檢查或Fisher確切概率檢查;如,可采用校正的配對四格表資料檢查或Fisher確切概率檢查。3.等級資料對于等級資料,重要采用秩轉(zhuǎn)換的非參數(shù)檢查。分析目的:推斷兩個或多個總體分布位置是否不同。應用條件及方法選擇:配對設計,兩樣本比較時,可采用wilcoxon符號秩和檢查;配伍組設計(隨機區(qū)組設計),多樣本比較時,可采用Friedman秩和檢查。(三)單個反映變量的其他設計研究其他常見設計方案有交叉設計、拉丁方設計、正交實驗設計、嵌套設計、析因?qū)嶒炘O計、反復測量設計等,若獲取資料為計量資料,當滿足相應條件時,可分別采用該設計方案相應的單變量方差分析。(四)雙變量關(guān)聯(lián)性對于具有一個解釋變量,一個反映變量的雙變量資料,可從相關(guān)與回歸兩方面進行分析,因此有相關(guān)系數(shù)的假設檢查、整個回歸模型的假設檢查以及回歸系數(shù)的假設檢查。1.相關(guān)分析分析目的:推斷兩變量的線性相關(guān)關(guān)系是否存在(總體相關(guān)系數(shù)是否不為0)。應用條件及方法選擇:雙變量計量資料,滿足線性、獨立、二元正態(tài)與等方差條件時,對Pearson相關(guān)系數(shù)進行檢查,可采用P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CCASC 6007-2023水合肼、ADC發(fā)泡劑行業(yè)清潔生產(chǎn)評價指標體系
- T/CCAAS 001-2023“黨建+企業(yè)文化管理”評價標準
- T/CATCM 026-2023中藥液體廢棄物循環(huán)利用指導原則
- T/CASWSS 005-2023社區(qū)老年中醫(yī)健康管理服務中心人員配置規(guī)范
- T/CAQI 25-2017新風凈化系統(tǒng)施工質(zhì)量驗收規(guī)范
- T/CAQI 204-2021紅外非接觸式人體表面溫度快速篩查系統(tǒng)
- T/CAQI 140-2020便攜式甲醛檢測儀
- 飛行英語面試題及答案
- 教練實踐考試題及答案
- 烘焙服務考試題及答案
- 2025至2030年中國智能學習機行業(yè)投資前景及策略咨詢研究報告
- (高清版)DG∕TJ 08-7-2021 建筑工程交通設計及停車庫(場)設置標準
- 教育咨詢保密協(xié)議書
- 無房無車離婚協(xié)議書
- 南師附中高三數(shù)學備忘錄及答案詳解
- 2025-2030年中國甲巰咪唑片行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025年安徽國控資產(chǎn)管理有限公司第二季度社會招聘5人筆試參考題庫附帶答案詳解
- 2025年安全知識競賽題庫及答案(共200題)
- 2024年湖北省中考地理生物試卷(含答案)
- 工學結(jié)合一體化課程教學設計的編寫(課堂PPT)
- 電氣裝置安裝工程接地裝置施工及驗收規(guī)范——50169-2006
評論
0/150
提交評論