科研統(tǒng)計(jì)分析的原理與步驟(“數(shù)據(jù)”文檔)共33張_第1頁
科研統(tǒng)計(jì)分析的原理與步驟(“數(shù)據(jù)”文檔)共33張_第2頁
科研統(tǒng)計(jì)分析的原理與步驟(“數(shù)據(jù)”文檔)共33張_第3頁
科研統(tǒng)計(jì)分析的原理與步驟(“數(shù)據(jù)”文檔)共33張_第4頁
科研統(tǒng)計(jì)分析的原理與步驟(“數(shù)據(jù)”文檔)共33張_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

科研統(tǒng)計(jì)分析的原那么與步驟劉啟貴科研設(shè)計(jì)在研討問題確立后,研討者按研討目的而進(jìn)展科研設(shè)計(jì),選擇和確定詳細(xì)的研討方法,科研設(shè)計(jì)也是科學(xué)研討中詳細(xì)內(nèi)容和方法的想象及方案安排,從而獲得有意義的資料和結(jié)果。研討設(shè)計(jì)的主要內(nèi)容有:科研設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)其特點(diǎn)有人為的干涉,即經(jīng)過施加一個(gè)或多個(gè)要素,經(jīng)過觀實(shí)驗(yàn)察看評價(jià)這些要素那個(gè)起作用。調(diào)查設(shè)計(jì)其特點(diǎn)無人為的干涉,即用設(shè)計(jì)好的調(diào)查表,去了解現(xiàn)實(shí)的情況,分析相關(guān)要素的關(guān)系。研討問題的目的在于認(rèn)識(shí)客觀規(guī)律。由于生物的變異性大,個(gè)體差別普遍存在,所以研討資料只需經(jīng)過統(tǒng)計(jì)學(xué)方法來進(jìn)展分析才干找出規(guī)律性的答案,得到有意義的結(jié)論。便于分析是指每項(xiàng)研討最好錄成一個(gè)數(shù)據(jù)文件,錄入的格式最好滿足各種統(tǒng)計(jì)分析的需求,這樣才干保證分析數(shù)據(jù)時(shí)的高效和全面。當(dāng)資料是正態(tài)分布時(shí):研討兩者在變化時(shí)的關(guān)聯(lián)或趨勢用相關(guān)系數(shù)r,假設(shè)問數(shù)量上的函數(shù)關(guān)系用普通線性回歸。在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間的多重共線性和殘差分布的正態(tài)性。第一個(gè)層面:看屬于三種資料類型中的哪在進(jìn)展統(tǒng)計(jì)分析前,原始數(shù)據(jù)需錄入計(jì)算機(jī)。數(shù)據(jù)庫文件,如dBASE、FoxBASE、Lotus、EPIinfo、Excel文件。無因變量的多變量分析欲將變量或察看單位劃分為性質(zhì)相近的k類,可選用聚類分析。假設(shè)因變量Y為分類變量〔二分類或多分類〕,且以判別分類為主要目的,自變量近似滿足多元正態(tài)分布,可選用選用判別分析。假設(shè)因變量Y為分類變量〔二分類或多分類〕,且以判別分類為主要目的,自變量近似滿足多元正態(tài)分布,可選用選用判別分析。┋┋┋例如,假設(shè)某一數(shù)據(jù)中某病例的身高變量為“1755〞cm,且原始記錄亦如此,又無法再找到該病例時(shí),顯然這是一個(gè)錯(cuò)誤的記錄,只能刪除。統(tǒng)計(jì)學(xué)分析醫(yī)學(xué)數(shù)據(jù)的統(tǒng)計(jì)處置涉及到醫(yī)學(xué)專業(yè)知識(shí)、統(tǒng)計(jì)專業(yè)知識(shí)、處置數(shù)據(jù)的閱歷和技巧等,是一項(xiàng)綜合的任務(wù)。在數(shù)據(jù)處置過程中,原始數(shù)據(jù)的采集和錄入,數(shù)據(jù)的管理,恰當(dāng)?shù)倪x取統(tǒng)計(jì)方法,熟練運(yùn)用統(tǒng)計(jì)軟件等,都是必需注重的關(guān)鍵環(huán)節(jié)。例1:冠心病病人編脂肪攝體重家族總膽號(hào)入量指數(shù)史固醇非冠心病人編脂肪攝體重家族總膽號(hào)入量指數(shù)史固醇1低2高3中┋┋30高26.527.024.5┋23.4有7.88有9.16無5.67┋┋有6.831低2中3中┋┋30高24.123.524.6┋25.2無5.68有3.21無3.15┋┋無3.06或如下方式:編脂肪攝體重家族總膽冠心病號(hào)入量指數(shù)史固醇否1低2高3中┋┋30高1低2中3中┋┋30高26.527.024.5┋23.424.123.524.6┋25.2有7.881有9.161無5.671┋┋┋有6.831無5.680有3.210無3.150┋┋┋無3.060例2:WBC前后體溫前后病情前后陰陽性前后12.5610.34┋9.528.478.567.34┋5.526.4738.537.9┋36.839.236.5.37.0┋35.936.2ⅢⅣ

ⅡⅣⅡⅠ

Ⅰ-+-

++_+

__例3WBC治療前治療后1天治療后3天治療后7天12.5610.34┋9.528.478.567.34┋7.526.476.566.34┋7.527.475.567.34┋6.526.40原始資料的搜集和處置經(jīng)過各種丈量、問卷、調(diào)查和察看等方法從研討對象處直接搜集到的科研資料,稱之為原始資料,也叫第一手資料,記錄必需可靠,不可自行更改并應(yīng)完好保管。在原始資料整理后再進(jìn)一步分析資料的價(jià)值和意義。原始資料的搜集和處置通常研討中得到的資料可分為計(jì)量資料〔定量資料〕和計(jì)數(shù)資料〔定性資料〕,介于其中的為等級資料〔半定量資料〕。統(tǒng)計(jì)學(xué)分析定量資料和定性資料時(shí)選用的檢驗(yàn)方法和計(jì)算公式都不同。分析整理研討資料多用計(jì)算的方法,如用百分率〔%〕、均數(shù)、規(guī)范差、規(guī)范誤,還可用統(tǒng)計(jì)圖和表格來歸納研討結(jié)果。原始資料的搜集和處置資料的要求完好、準(zhǔn)確、及時(shí)原始數(shù)據(jù)的記錄方式醫(yī)學(xué)研討的原始數(shù)據(jù)常列成類似下表的二維構(gòu)造,即行與列構(gòu)造的數(shù)據(jù)集方式。在表中,每一行稱為一個(gè)記錄〔record〕,或一個(gè)察看單位〔case〕;每一列稱為一個(gè)變量〔variable〕,用以表示變量、工程或察看目的等。原始數(shù)據(jù)錄入在進(jìn)展統(tǒng)計(jì)分析前,原始數(shù)據(jù)需錄入計(jì)算機(jī)。錄人的文件類型大致有:數(shù)據(jù)庫文件,如dBASE、FoxBASE、Lotus、EPIinfo、Excel文件。文本文件〔如word文件、WPS文件等〕等,統(tǒng)計(jì)運(yùn)用軟件的相應(yīng)文件,如SPSS數(shù)據(jù)文件、SAS數(shù)據(jù)文件、STATA數(shù)據(jù)文件等。目前,上述文件類型絕大多數(shù)都可以相互轉(zhuǎn)換。假設(shè)將m個(gè)察看單位聚為k類,那么選目的〔R型〕聚類方法一種;統(tǒng)計(jì)學(xué)分析定量資料和定性資料時(shí)選用的檢驗(yàn)方法和計(jì)算公式都不同。因變量Y是延續(xù)性正態(tài)分布,用多重線性回歸或多重線性逐漸回歸。在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間的多重共線性和殘差分布的正態(tài)性。編脂肪攝體重家族總膽統(tǒng)計(jì)方法前提條件的檢驗(yàn)便于分析是指每項(xiàng)研討最好錄成一個(gè)數(shù)據(jù)文件,錄入的格式最好滿足各種統(tǒng)計(jì)分析的需求,這樣才干保證分析數(shù)據(jù)時(shí)的高效和全面。研討問題的目的在于認(rèn)識(shí)客觀規(guī)律。假設(shè)因變量Y為生存時(shí)間,并含有截尾數(shù)據(jù),自變量只需一個(gè)處置要素,可選用Kaplan-Meier法做生存分析。文本文件〔如word文件、WPS文件等〕等,統(tǒng)計(jì)運(yùn)用軟件的相應(yīng)文件,如SPSS數(shù)據(jù)文件、SAS數(shù)據(jù)文件、STATA數(shù)據(jù)文件等。統(tǒng)計(jì)軟件普通都有判分別群數(shù)據(jù)的方法。研討問題的目的在于認(rèn)識(shí)客觀規(guī)律。無因變量的多變量分析欲將變量或察看單位劃分為性質(zhì)相近的k類,可選用聚類分析。假設(shè)確認(rèn)數(shù)據(jù)有邏輯錯(cuò)誤,又無法糾正,可直接刪除該數(shù)據(jù)。在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間的多重共線性和殘差分布的正態(tài)性。原始數(shù)據(jù)錄入錄人數(shù)據(jù)時(shí),應(yīng)遵照便于錄入,便于核對,便于轉(zhuǎn)換,便于分析的原那么。1.便于錄入是指盡能夠地減少錄入任務(wù)量2.便于核對是指一定要設(shè)有標(biāo)識(shí)變量,以方便數(shù)據(jù)核對3.便于轉(zhuǎn)換是指錄入數(shù)據(jù)時(shí)要思索不同軟件對字節(jié)和字符的要求4.便于分析是指每項(xiàng)研討最好錄成一個(gè)數(shù)據(jù)文件,錄入的格式最好滿足各種統(tǒng)計(jì)分析的需求,這樣才干保證分析數(shù)據(jù)時(shí)的高效和全面。數(shù)據(jù)處置中的幾個(gè)問題數(shù)據(jù)核對數(shù)據(jù)錄入后,首先須對數(shù)據(jù)進(jìn)展核對,以確保錄入數(shù)據(jù)的準(zhǔn)確性和真實(shí)性。核對準(zhǔn)確性可分兩步進(jìn)展。第一步邏輯檢查,經(jīng)過運(yùn)轉(zhuǎn)統(tǒng)計(jì)軟件中的根本統(tǒng)計(jì)量過程,列出每個(gè)變量的最大值和最小值,假設(shè)某變量的最大值或最小值不符合邏輯,那么數(shù)據(jù)有誤。數(shù)據(jù)處置中的幾個(gè)問題第二步數(shù)據(jù)核對,將原始數(shù)據(jù)與錄入的數(shù)據(jù)一一核對,錯(cuò)者更正。有時(shí),為慎重起見,采用雙份錄入的方式,然后用程序作一一比較,不一致者一定是錄錯(cuò)的數(shù)據(jù)。數(shù)據(jù)核對的另一項(xiàng)義務(wù)是對數(shù)據(jù)的真實(shí)性作出初步判別數(shù)據(jù)處置中的幾個(gè)問題離群數(shù)據(jù)的處置當(dāng)個(gè)別數(shù)據(jù)與群體數(shù)據(jù)嚴(yán)重偏離時(shí),被稱為離群數(shù)據(jù)〔outlier〕或極端數(shù)據(jù)〔extremevalue〕。統(tǒng)計(jì)軟件普通都有判分別群數(shù)據(jù)的方法。判分別群數(shù)據(jù)有多種方法,最常用的方法是采用箱式圖來斷定.數(shù)據(jù)處置中的幾個(gè)問題假設(shè)有離群數(shù)據(jù)出現(xiàn),可分為兩種情況處置。1.假設(shè)確認(rèn)數(shù)據(jù)有邏輯錯(cuò)誤,又無法糾正,可直接刪除該數(shù)據(jù)。例如,假設(shè)某一數(shù)據(jù)中某病例的身高變量為“1755〞cm,且原始記錄亦如此,又無法再找到該病例時(shí),顯然這是一個(gè)錯(cuò)誤的記錄,只能刪除。2.假設(shè)數(shù)據(jù)并無明顯的邏輯錯(cuò)誤,可將該數(shù)據(jù)剔除前后各做一次分析,假設(shè)結(jié)果不矛盾,那么不剔除;假設(shè)結(jié)果矛盾,并需求剔除,必需給以充分合理的解釋,例如用何種方法確定偏離數(shù)據(jù),該數(shù)據(jù)在實(shí)驗(yàn)中何種干擾下產(chǎn)生等數(shù)據(jù)處置中的幾個(gè)問題統(tǒng)計(jì)方法前提條件的檢驗(yàn)運(yùn)用參數(shù)方法進(jìn)展假設(shè)檢驗(yàn)往往要求數(shù)據(jù)滿足某些前提條件,如兩個(gè)獨(dú)立樣本比較t檢驗(yàn)或多個(gè)獨(dú)立樣本比較的方差分析,均要求方差齊性,因此需求做方差齊性檢驗(yàn)。假設(shè)要用正態(tài)分布法估計(jì)參考值范圍,首先要檢驗(yàn)資料能否服從正態(tài)分布。在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間的多重共線性和殘差分布的正態(tài)性??蒲匈Y料的分析研討問題的目的在于認(rèn)識(shí)客觀規(guī)律。實(shí)驗(yàn)只在少數(shù)受試者身上〔樣本〕進(jìn)展,而結(jié)論卻要推至研討對象的全體〔總體〕。由于生物的變異性大,個(gè)體差別普遍存在,所以研討資料只需經(jīng)過統(tǒng)計(jì)學(xué)方法來進(jìn)展分析才干找出規(guī)律性的答案,得到有意義的結(jié)論。選擇統(tǒng)計(jì)方法的思緒數(shù)據(jù)處置中,正確選擇統(tǒng)計(jì)方法至關(guān)重要。選擇統(tǒng)計(jì)方法可以沿著以下思緒進(jìn)展:第一個(gè)層面:看屬于三種資料類型中的哪一種;第二個(gè)層面:看單要素還是多要素;第三個(gè)層面:看單樣本、兩樣本或多樣本;第四個(gè)層面:看能否是配對或配伍設(shè)計(jì);第五個(gè)層面:看能否滿足檢驗(yàn)方法所需的前提條件;分析目的比較差別:比較兩組或多組均值、率或中位數(shù)有無差別〔單要素單目的〕。研討相關(guān)與回歸:每兩個(gè)變量間的變化能否有關(guān)系,其數(shù)量上的函數(shù)方式如何〔兩個(gè)目的或多個(gè)目的之間關(guān)系〕。多要素分析:研討多個(gè)要素對一個(gè)變量的影響。計(jì)量資料或等級資料比較差別t檢驗(yàn)t‘檢驗(yàn)F檢驗(yàn)配對t檢驗(yàn)配伍F檢驗(yàn)秩和檢驗(yàn)偏態(tài)分布或等級資料正態(tài)分布頻數(shù)表5點(diǎn)法最小值P25MP75最大值正態(tài)分布等級資料偏態(tài)分布統(tǒng)計(jì)推斷統(tǒng)計(jì)描畫計(jì)量資料或等級資料計(jì)數(shù)或分類資料比較差別樣本與總體率的比較u樣本率與構(gòu)成的比較χ2配對差別性比較χ2趨勢性χ2檢驗(yàn)率構(gòu)成比相對比(OR值或RR值)統(tǒng)計(jì)推斷統(tǒng)計(jì)描畫計(jì)數(shù)資料相關(guān)與回歸當(dāng)資料是正態(tài)分布時(shí):研討兩者在變化時(shí)的關(guān)聯(lián)或趨勢用相關(guān)系數(shù)r,假設(shè)問數(shù)量上的函數(shù)關(guān)系用普通線性回歸。當(dāng)資料不是正態(tài)分布時(shí):研討兩者在變化時(shí)的關(guān)聯(lián)或趨勢用等級相關(guān)rs,假設(shè)問數(shù)量上的函數(shù)關(guān)系用秩回歸。相關(guān)與回歸曲線回歸分析分析兩變量的回歸關(guān)系時(shí),假設(shè)兩變量呈曲線趨勢,可按曲線類型選擇指數(shù)曲線、多項(xiàng)式曲線、生長曲線、Logistic曲線等。也可選用非線性回歸分析方法。假設(shè)因變量Y為生存時(shí)間,并含有截尾數(shù)據(jù),自變量只需一個(gè)處置要素,可選用Kaplan-Meier法做生存分析。多變量分析多變量資料大致可規(guī)結(jié)為有無因變量兩種類型。因變量Y是延續(xù)性正態(tài)分布,用多重線性回歸或多重線性逐漸回歸。因變量Y是兩分類的(發(fā)生與不發(fā)生),且以分析危險(xiǎn)要素為主要目的,用Logistic回歸分析。假設(shè)因變量Y為分類變量〔二分類或多分類〕,且以判別分類為主要目的,自變量近似滿足多元正態(tài)分布,可選用選用判別分析。因變量Y是時(shí)間變量(隨訪資料),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論