醫(yī)學(xué)統(tǒng)計學(xué)與SPSS電腦實驗 課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)與SPSS電腦實驗 課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)與SPSS電腦實驗 課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)與SPSS電腦實驗 課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)與SPSS電腦實驗 課件_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計學(xué)

與SPSS電腦實驗2021/5/71單位:河北醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)教研室授課教師:唐龍妹聯(lián)系電話:2021/5/72理論:本科知識回顧實驗設(shè)計方差分析秩和檢驗卡方檢驗雙變量回歸與相關(guān)統(tǒng)計圖表高級統(tǒng)計方法概述SPSS及實習:數(shù)據(jù)管理統(tǒng)計描述及t檢驗方差分析秩和檢驗卡方檢驗雙變量回歸與相關(guān)統(tǒng)計圖表案例綜合分析2021/5/73本科統(tǒng)計學(xué)知識回顧2021/5/74

統(tǒng)計學(xué)(Statistics)是一門研究數(shù)據(jù)的收集、整理、分析、表達和解釋的科學(xué)。

將統(tǒng)計學(xué)應(yīng)用于醫(yī)學(xué)研究領(lǐng)域形成了衛(wèi)生統(tǒng)計學(xué)(HealthStatistics)和醫(yī)學(xué)統(tǒng)計學(xué)(MedicalStatistics),衛(wèi)生統(tǒng)計學(xué)偏重于醫(yī)療衛(wèi)生的社會性,醫(yī)學(xué)統(tǒng)計學(xué)偏重于醫(yī)學(xué)研究的臨床方面,兩者之間無截然的界限,其主要內(nèi)容是相同的。2021/5/75第一節(jié)

醫(yī)學(xué)統(tǒng)計學(xué)的基本概念2021/5/76總體與樣本變量與資料誤差概率2021/5/77一、總體與樣本

(populationandsample)2021/5/781.總體:根據(jù)研究目的確定的性質(zhì)相同觀察單位的全體。確切的說是,全部同質(zhì)觀察單位某項觀察值的集合。2.樣本:從總體中隨機抽取的部分觀察單位,其實測值的集合構(gòu)成樣本。樣本是總體中有代表性的一部分。2021/5/79二、變量與資料

(variableanddata)

在確定總體之后,研究者對每個觀察單位的某項特征進行測量和觀察,這種特征稱為變量。變量的測得值或觀察值稱為變量值。變量值構(gòu)成資料。2021/5/7109、人的價值,在招收誘惑的一瞬間被決定。2023/2/32023/2/3Friday,February3,202310、低頭要有勇氣,抬頭要有低氣。2023/2/32023/2/32023/2/32/3/20234:54:05PM11、人總是珍惜為得到。2023/2/32023/2/32023/2/3Feb-2303-Feb-2312、人亂于心,不寬余請。2023/2/32023/2/32023/2/3Friday,February3,202313、生氣是拿別人做錯的事來懲罰自己。2023/2/32023/2/32023/2/32023/2/32/3/202314、抱最大的希望,作最大的努力。03二月20232023/2/32023/2/32023/2/315、一個人炫耀什么,說明他內(nèi)心缺少什么。。二月232023/2/32023/2/32023/2/32/3/202316、業(yè)余生活要有意義,不要越軌。2023/2/32023/2/303February202317、一個人即使已登上頂峰,也仍要自強不息。2023/2/32023/2/32023/2/32023/2/32021/5/711編號(ID)性別血型體重(kg)療效張1男A66無效李2男O78有效王3女AB57顯效趙4男B69有效……………2021/5/712按變量屬性可將資料分為三種:計量資料(measurementdata)計數(shù)資料(enumerationcountdata)等級資料(rankedordinaldata)2021/5/713過失誤差:指實驗過程中由于偶然失誤造成的誤差。

隨機誤差:由于隨機因素造成的誤差。

系統(tǒng)誤差:也是實驗過程中產(chǎn)生的誤差,但它的值或者恒定不變,或者遵循一定的變化規(guī)律,其產(chǎn)生的原因往往是可知的或可掌握的。三、誤差(error)誤差:測量值和真值之間的差值。2021/5/714

隨機抽樣誤差:因存在個體差異,由于隨機抽樣引起的統(tǒng)計量與參數(shù)之間或者統(tǒng)計量與統(tǒng)計量之間的差異。

樣本均數(shù)的標準差稱為均數(shù)的標準誤,是用來反映抽樣誤差大小的指標。2021/5/715四、頻率與概率

(relativefrequencyandprobability)2021/5/716概率:描述某事件發(fā)生可能性大小的數(shù),用P表示。概率的取值范圍:[0,1]。小概率事件:當某事件發(fā)生的概率很小時,稱之為小概率事件。一般取0.05或0.01為小概率事件的標準。小概率事件實際不可能性原理:如果一個事件是小概率事件,在一次試驗中我們當作是不可能發(fā)生的。2021/5/717第二節(jié)

統(tǒng)計工作的基本步驟設(shè)計(design)收集資料(collectionofdata)整理資料(sortingofdata)分析資料(analysisofdata)

——統(tǒng)計描述

——統(tǒng)計推斷(參數(shù)估計和假設(shè)檢驗)2021/5/718第三節(jié)

計量資料的統(tǒng)計描述——集中趨勢和離散趨勢2021/5/719常用集中趨勢指標統(tǒng)計指標定義表示符號適用條件算術(shù)均數(shù)各觀察值之和除以觀察值的個數(shù)總體:μ樣本:對稱分布,特別是正態(tài)或者近似正態(tài)分布幾何均數(shù)n個觀察值乘積的n次方根G等比級數(shù)資料或?qū)?shù)正態(tài)分布資料中位數(shù)將全部觀察值從小到大排列,居中位置對應(yīng)的數(shù)值M各種資料均適用,特別是偏態(tài)分布、資料的分布不明確或者資料的一端或兩端無確切數(shù)值2021/5/720分布類型

對稱分布:集中位置在中間,左右兩側(cè)頻數(shù)大體對稱

偏態(tài)分布:集中位置偏向一側(cè),頻數(shù)分布不對稱

正偏態(tài):集中位置偏向左側(cè)

負偏態(tài):集中位置偏向右側(cè)2021/5/721

正態(tài)分布是最常見、最重要的一種連續(xù)型概率分布,其形態(tài)為:中間高,兩端低,左右對稱,略呈鐘型。2021/5/722①正態(tài)分布始終在橫軸上方,X=μ處曲線達到最高點②正態(tài)分布以X=μ為對稱軸,左右對稱③正態(tài)分布的兩個參數(shù):位置參數(shù)μ和形狀參數(shù)σ

表示方法X~N(μ,σ2)④正態(tài)曲線下面積的分布規(guī)律:正態(tài)曲線下的總面積為1(100%)(μ-σ,μ+σ)間的面積為68.27%

(μ-1.645σ,μ+1.645σ)間的面積為90%

(μ-1.96σ,μ+1.96σ)間的面積為95%

(μ-2.58σ,μ+2.58σ)間的面積為99%正態(tài)分布的特征2021/5/723正態(tài)分布的應(yīng)用

——醫(yī)學(xué)參考值范圍正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。對數(shù)正態(tài)分布法:適用于對數(shù)正態(tài)分布資料百分位數(shù)法:常用于偏態(tài)分布資料2021/5/724常用集中趨勢指標統(tǒng)計指標定義表示符號適用條件算術(shù)均數(shù)各觀察值之和除以觀察值的個數(shù)總體:μ樣本:對稱分布,特別是正態(tài)或者近似正態(tài)分布幾何均數(shù)n個觀察值乘積的n次方根G等比級數(shù)資料或?qū)?shù)正態(tài)分布資料中位數(shù)將全部觀察值從小到大排列,居中位置對應(yīng)的數(shù)值M各種資料均適用,特別是偏態(tài)分布、資料的分布不明確或者資料的一端或兩端無確切數(shù)值2021/5/725標準正態(tài)分布:μ=0,σ=1的正態(tài)分布對數(shù)正態(tài)分布:

X(X1,X2,…,XN)不服從正態(tài)分布,但對X取對數(shù)后Y=lgX,Y(Y1,Y2,…,YN)服從正態(tài)分布,則稱X服從對數(shù)正態(tài)分布。對數(shù)正態(tài)分布是一種正偏態(tài)分布。2021/5/726常用描述離散趨勢的指標統(tǒng)計指標表示符號用途及缺點全距R各分布類型資料,但僅涉及到最大值和最小值四分位數(shù)間距QR各分布類型資料,特別是偏態(tài)分布資料,但僅是中間50%觀察值的范圍方差總體:σ2樣本:s2對稱分布資料,特別是正態(tài)分布資料,但單位是原觀察值單位的平方標準差總體:σ樣本:s對稱分布資料,特別是正態(tài)分布資料變異系數(shù)CV比較度量單位不同或均數(shù)相差懸殊資料的離散趨勢2021/5/727正態(tài)分布資料:均數(shù)和標準差偏態(tài)分布資料:中位數(shù)和四分位數(shù)間距

M(QR)2021/5/728第四節(jié)

計量資料的統(tǒng)計推斷——總體均數(shù)的估計與假設(shè)檢驗2021/5/729一、t分布

t分布(t-distribution)也是一種連續(xù)性隨機變量的分布類型。最早由英國統(tǒng)計學(xué)家Gosset以“Student”的筆名發(fā)表,所以又稱Studentt分布(Student’st-distribution),主要用于總體均數(shù)的區(qū)間估計和t檢驗等。2021/5/7301、t分布是單峰分布,以0為中心,左右對稱。2、t分布的圖形不是一條曲線,而是一簇曲線,其形狀與自由度有關(guān)。自由度越小,t值越分散,曲線的峰部越矮,尾部翹得越高。隨著自由度逐漸增大,t分布曲線逐漸逼近標準正態(tài)分布曲線,當自由度為∞時,t分布曲線與標準正態(tài)分布曲線重合。t界值單側(cè)概率對應(yīng)的界值表示為:雙側(cè)概率對應(yīng)的界值表示為:2021/5/731二、總體均數(shù)的估計

參數(shù)估計是統(tǒng)計推斷的一個重要方面。所謂參數(shù)估計是指用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))。1、參數(shù)估計的方法:

點估計:用樣本統(tǒng)計量直接作為總體參數(shù)的估計值

區(qū)間估計:按預(yù)先指定的概率(1-α)確定包含未知總體參數(shù)的范圍。預(yù)先給定的概率用1-α表示,稱為置信度或可信度(confidencelevel),常取95%,99%。2021/5/7322、總體均數(shù)區(qū)間估計的方法①σ已知μ的95%的可信區(qū)間:②σ未知μ的95%的可信區(qū)間:③σ未知,但n足夠大,一般n≥60μ的95%的可信區(qū)間:2021/5/733三、t檢驗

t檢驗是計量資料假設(shè)檢驗中最簡單、最常用的方法。所謂假設(shè)檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。在假設(shè)H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷,拒絕H0還是不拒絕H0。2021/5/734

假設(shè)檢驗的基本思想:先假設(shè)差別由抽樣造成,即總體間本無差異,在此假設(shè)成立的前提下作抽樣研究,如果該次抽樣屬小概率事件,則樣本信息不支持原假設(shè)的成立,因而拒絕它,反之樣本信息支持原假設(shè)的成立,不拒絕原假設(shè)。2021/5/7351、假設(shè)檢驗的一般步驟①建立假設(shè),確定檢驗水準檢驗假設(shè)(H0)和備擇假設(shè)(H1)

確定檢驗水準(α),②計算統(tǒng)計量

計算方法要受資料類型、設(shè)計方案、統(tǒng)計推斷目的、資料的分布類型、樣本容量的多少等因素決定③確定P值,做出推斷結(jié)論一般:統(tǒng)計量≥界值時,P≤α,拒絕H0,接受H1

統(tǒng)計量<界值時,P>α,不拒絕H02021/5/7362、t檢驗的應(yīng)用條件:t檢驗理論上要求樣本來自正態(tài)總體,兩小樣均數(shù)比較時,還要求兩樣本對應(yīng)的總體方差相等。2021/5/737①單樣本t檢驗(樣本均數(shù)與已知總體均數(shù)比較的t檢驗):樣本來自正態(tài)總體②配對t檢驗(配對實驗設(shè)計的t檢驗):每個對子的差值來自正態(tài)總體③

兩樣本t檢驗(完全隨機設(shè)計兩樣本均數(shù)比較的t檢驗):兩個樣本均來自正態(tài)總體且總體方差相等2021/5/738第五節(jié)

正態(tài)性檢驗和兩樣本方差齊性檢驗2021/5/739一、正態(tài)性檢驗(1)P-P圖(概率圖):以實際的累積頻率(X)與理論累計頻率(Y)作圖。(2)Q-Q圖(分位數(shù)圖):以實際分位數(shù)(X)與理論分位數(shù)(Y)作圖。

若兩圖的散點都在一條直線上,可認為資料服從正態(tài)分布1、圖示法2021/5/740圖100個樣本均數(shù)的P-P圖2021/5/741圖100個樣本均數(shù)的Q-Q圖2021/5/742(1)對偏度和峰度各用一個指標評定——矩法效率最高2、計算法(2)用一個指標綜合評定——W檢驗法、W’’檢驗法和D檢驗法W檢驗法和W’’檢驗:適用于樣本含量少于100的資料D檢驗法:適用于樣本容量10-2000的資料2021/5/743

矩法要對偏度和峰度分別檢驗。偏度指分布不對稱的程度和方向,用偏度系數(shù)衡量,樣本偏度系數(shù)用g1表示,總體偏度系數(shù)用γ1表示;峰度指分布與正態(tài)曲線相比的冒尖程度或扁平程度,用峰度系數(shù)衡量,樣本峰度系數(shù)用g2表示,總體峰度系數(shù)用γ2表示。2021/5/744正態(tài)性檢驗的H0應(yīng)表示為:資料服從正態(tài)分布,所以:當P>α時,可認為資料滿足正態(tài)分布條件2021/5/745二、兩樣本的方差齊性檢驗F檢驗:要求資料服從正態(tài)分布。Levene檢驗:不依賴總體分布的具體形式,而且可以用于多個樣本的方差齊性檢驗。方差齊性檢驗的H0為:總體方差相等,所以:當P>α時,可認為資料滿足方差齊性條件2021/5/746第六節(jié)

假設(shè)檢驗中的兩類錯誤2021/5/747Ⅰ型錯誤:拒絕了實際上成立的H0,也稱棄真錯誤,概率大小由研究者根據(jù)研究目的確定,用α表示(預(yù)先規(guī)定的允許犯Ⅰ型錯誤概率的最大值)。Ⅱ型錯誤:“接受”了實際上不成立的H0,也稱取偽錯誤,其概率大小用β表示,β只取單側(cè),大小一般未知,在已知兩總體差值、α和n時,利用公式才能算出。2021/5/748以單樣本t檢驗(單側(cè))說明:H0:μ=μ0H1:μ<μ0α=0.05Ⅰ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論