




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章定量資料的基本統(tǒng)計(jì)方法張菊英復(fù)習(xí)總體與樣本、抽樣誤差小概率事件復(fù)習(xí)資料的兩種類型
數(shù)值變量資料分類資料問題:數(shù)值變量關(guān)注測(cè)定值的大小統(tǒng)計(jì)分析統(tǒng)計(jì)描述:是用統(tǒng)計(jì)圖(表)、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。統(tǒng)計(jì)推斷:用樣本信息推斷總體特征。定量資料的統(tǒng)計(jì)描述
集中趨勢(shì)的統(tǒng)計(jì)描述定量資料的頻數(shù)表離散程度的統(tǒng)計(jì)描述
定量資料的頻數(shù)表在什么情況下需編頻數(shù)表?離散型計(jì)量資料的頻數(shù)表以變量取值為標(biāo)志分組,并列出各組的頻數(shù)
例2.1表2.1某年某地區(qū)434名少數(shù)民族已婚婦女
現(xiàn)有子女?dāng)?shù)的頻數(shù)分布連續(xù)性變量的頻數(shù)表的編制
求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示定組段和組距(classinterval)列出頻數(shù)表
定組段和組距根據(jù)全距的大小和樣本含量的多少確定“組段”數(shù)各組段的起點(diǎn)和終點(diǎn)分別稱為下限和上限,某組段的組中值為該組段的(下限+上限)/2。相鄰兩組段的下限之差稱組距,常用全距的1/10取整做組距第一組段應(yīng)包括全部觀察值中的最小值,最末組段應(yīng)包括全部觀察值中的最大值并且同時(shí)寫出其下限與上限。頻數(shù)分布的特征
集中趨勢(shì)(centraltendency)
一組數(shù)據(jù)向某一個(gè)位置聚集或集中的傾向離散趨勢(shì)(dispersiontendency)
一組數(shù)據(jù)的分散性頻數(shù)分布的類型
對(duì)稱分布:對(duì)稱分布偏態(tài)分布:
正偏態(tài)分布負(fù)偏態(tài)分布頻數(shù)表的用途揭示資料的分布類型,以便于選用相應(yīng)的統(tǒng)計(jì)分析方法;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理;便于發(fā)現(xiàn)某些特大或特小的可疑值。集中趨勢(shì)的統(tǒng)計(jì)描述描述一組同質(zhì)觀察值的平均水平或中心位置的指標(biāo)有均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)現(xiàn)有2.1,2.2,2.3等3個(gè)觀察值,求其均數(shù)
1XX++LL均數(shù)(mean)
適用條件:對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布的定量資料。符號(hào):表示樣本均數(shù),希臘字母表示總體均數(shù)。計(jì)算方法:直接法:加權(quán)法(weightingmethod):例2.3120名5歲女孩身高均數(shù)均數(shù)的特性均數(shù)的應(yīng)用幾何均數(shù)(geometricmean)適用條件:某些呈正偏態(tài)分布,但數(shù)據(jù)經(jīng)過對(duì)數(shù)變換后呈正態(tài)分布的資料,也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。符號(hào):用G表示計(jì)算方法:直接法:或加權(quán)法(weightingmethod):例2.4例2.5幾何均數(shù)注意事項(xiàng)中位數(shù)(median)適用條件:偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料符號(hào):P50
或M計(jì)算方法:直接法:n為奇數(shù)時(shí):n為偶數(shù)時(shí):頻數(shù)表法(weightingmethod):
頻數(shù)表法計(jì)算Px表2.41503名中年知識(shí)分子SCL-90總分
中位數(shù)的應(yīng)用注意事項(xiàng)中位數(shù)可用于各種分布的資料。對(duì)于正態(tài)分布資料,中位數(shù)等于均數(shù);對(duì)于對(duì)數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù)。中位數(shù)不受極端值的影響,因此,實(shí)際工作中主要用于偏態(tài)分布資料、兩端無確切值或分布不明確的資料。三組同性別、同年齡兒童的體重(kg)如下:甲組2628303234乙組2427303336丙組2629303134離散程度的統(tǒng)計(jì)描述離散度指標(biāo)反映一組同質(zhì)觀察值的變異度;常用的指標(biāo)有全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù);值越大,表示資料的變異程度越大。全距(range,簡(jiǎn)記為R)涵義:亦稱極差,為一組同質(zhì)觀察值中最大值與最小值之差。它反映了個(gè)體差異的范圍,全距大,說明變異度大;反之,全距小,說明變異度小。計(jì)算:適用條件:常由于描述單峰對(duì)稱分布小樣本資料的變異程度或由于初步了解資料的變異程度。不足之處:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時(shí)不宜用全距比較。四分位數(shù)間距(quartile,簡(jiǎn)記為Q)涵義:為上四分位數(shù)Qu(即)與下四分位數(shù)QL(即)之差。其間包括了一組觀察值的一半,故四分位數(shù)間距可看成是中間50%觀察值的極差。百分位數(shù)的計(jì)算
四分位數(shù)的計(jì)算適用條件常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。優(yōu)缺點(diǎn):四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。例2.9某醫(yī)學(xué)院用自編生存質(zhì)量量表測(cè)得三組同年齡、同性別中年知識(shí)分子的軀體功能維度得分資料如下:
甲組88910111212
乙組56810121415
丙組12510151819
方差(variance)為了全面考慮每個(gè)觀察值的變異情況,克服全距和四分位數(shù)間距的缺點(diǎn),引入了“方差”自由度隨機(jī)變量能夠自由取值的個(gè)數(shù)符號(hào)為標(biāo)準(zhǔn)差因方差的度量單位是原度量單位的平方,故將方差開方,恢復(fù)成原度量單位,得總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差S
總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的計(jì)算直接法加權(quán)法例2.15方差和標(biāo)準(zhǔn)差的應(yīng)用條件正態(tài)或近似正態(tài)分布
變異系數(shù)(coefficientofvariation)
簡(jiǎn)記為CV適用:常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。計(jì)算公式描述數(shù)值變量分布特征的內(nèi)容分布范圍集中趨勢(shì),集中位置離散趨勢(shì),離散程度是否對(duì)稱描述數(shù)值變量的指標(biāo)的正確選擇正態(tài)或近似正態(tài)分布的資料均數(shù)和標(biāo)準(zhǔn)差偏態(tài)分布的資料中位數(shù)和四分位數(shù)間距等比級(jí)數(shù)或?qū)?shù)正態(tài)分布的資料幾何均數(shù)正態(tài)分布及其應(yīng)用正態(tài)分布的概念和特征
正態(tài)曲線下面積的分布規(guī)律
正態(tài)分布的應(yīng)用
正態(tài)分布的概念概念:正態(tài)分布是高峰位于中央(均數(shù)所在處)、兩側(cè)逐漸降低且左右對(duì)稱、不與橫軸相交的鐘型光滑曲線,也叫高斯分布。正態(tài)分布的圖形標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)
向左平移個(gè)單位后再縮小倍,即按式進(jìn)行變量代換得到標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示正態(tài)分布的特征正態(tài)曲線在橫軸上方均數(shù)處最高正態(tài)分布以均數(shù)為中心,左右對(duì)稱正態(tài)分布有兩個(gè)參數(shù),即均數(shù)與標(biāo)準(zhǔn)差正態(tài)曲線在1處各有一個(gè)拐點(diǎn)正態(tài)曲線下的面積分布有一定的規(guī)律
查附表1時(shí)注意事項(xiàng)曲線下橫軸上的總面積為100%或1。表中曲線下面積為-∞到u的面積。當(dāng)分布不是標(biāo)準(zhǔn)正態(tài)分布,但已知,和X時(shí),先按式求得u值,再查表求得曲線下某區(qū)間的面積。正態(tài)曲線下面積的分布規(guī)律采用“定積分法”可求出正態(tài)分布曲線下-∞到X之間的面積以及標(biāo)準(zhǔn)正態(tài)變量-∞到u的面積統(tǒng)計(jì)學(xué)家按標(biāo)準(zhǔn)正態(tài)分布的累積概率分布函數(shù)(u)編制了附表1,標(biāo)準(zhǔn)正態(tài)分布曲線下的面積常用的三個(gè)區(qū)間
1.645區(qū)間面積占總面積(或總觀察例數(shù))的90%
1.96區(qū)間面積占總面積(或總觀察例數(shù))的95%
2.58區(qū)間面積占總面積(或總觀察例數(shù))的99%正態(tài)分布的應(yīng)用估計(jì)頻數(shù)分布制定醫(yī)學(xué)參考值范圍質(zhì)量控制正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)制定醫(yī)學(xué)參考值范圍也稱醫(yī)學(xué)正常值范圍它是指所謂“正常人”的解剖、生理、生化等指標(biāo)的波動(dòng)范圍大多數(shù)“正常人”“正常人”所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。計(jì)算醫(yī)學(xué)參考值范圍常用的方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側(cè)界值:?jiǎn)蝹?cè)上界:;單側(cè)下界:對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料雙側(cè)界值:百分位數(shù)法:常用于偏態(tài)分布資料雙側(cè)界值:和;單側(cè)上界:,如尿鉛、發(fā)汞;或單側(cè)下界:,如肺活量。例2.21某地調(diào)查正常成年男子200人的紅細(xì)胞數(shù)得均數(shù)=55.26×1012/L,標(biāo)準(zhǔn)差S=0.38×1012/L,試估計(jì)該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍
因紅細(xì)胞數(shù)過多或過少均屬異常,故取雙側(cè)。該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍為
下限:-1.96S
=55.26-1.96×0.38=54.52(/L)
上限:+1.96S
=55.26+1.96×0.38=56.00(/L)
例2.22某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù)=4.2L,標(biāo)準(zhǔn)差S=0.7L,試估計(jì)該地健康成年男性第一秒肺通氣量的95%參考值范圍。
因第一秒肺通氣量僅過低屬異常,故按取單側(cè)下限。該地健康成年男性第一秒肺通氣量的95%參考值范圍為:
下限:
即該地健康成年男性第一秒肺通氣量的95%參考值范圍為不低于3.05L。制定正常值范圍時(shí)注意事項(xiàng)要確定一批樣本含量足夠大的“正常人”;選定同質(zhì)正常人作為研究對(duì)象控制檢測(cè)誤差需根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值;根據(jù)研究目的和實(shí)用要求選定適當(dāng)?shù)陌俜纸缰?,?0%,90%,95%,和99%,常用95%;根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)挠?jì)算方法作業(yè)1.11.31.4總體均數(shù)的估計(jì)均數(shù)的抽樣誤差t分布總體均數(shù)的估計(jì)均數(shù)的抽樣誤差為什么進(jìn)行抽樣?概念:抽樣引起的總體參數(shù)與樣本統(tǒng)計(jì)量之間的差異稱為抽樣誤差(samplingerror)。均數(shù)的抽樣誤差:抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。從總體N(4.83,0.522)中抽出100個(gè)樣本的、S、t值與的95%的可信區(qū)間
100個(gè)樣本均數(shù)的均數(shù)為4.828,與總體均數(shù)4.83接近;樣本均數(shù)的標(biāo)準(zhǔn)差為0.18。
樣本均數(shù)抽樣誤差樣本1
樣本2
樣本k總體數(shù)理統(tǒng)計(jì)的中心極限定理從正態(tài)分布N(,2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布;即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;樣本均數(shù)的總體均數(shù)仍為,樣本均數(shù)的標(biāo)準(zhǔn)差為。標(biāo)準(zhǔn)誤(standarderror)樣本均數(shù)的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤,是說明均數(shù)抽樣誤差大小的指標(biāo),大,抽樣誤差大;反之,小,抽樣誤差小。標(biāo)準(zhǔn)誤的計(jì)算:標(biāo)準(zhǔn)誤的估計(jì)值:影響標(biāo)準(zhǔn)誤大小的因素
的大小與成正比與樣本含量n的平方根成反比t分布t分布的由來t分布的特征t分布曲線下的面積t分布的由來變量變換總體
樣本均數(shù)
中心極限定理標(biāo)準(zhǔn)正態(tài)分布
變量變換未知
從總體N(4.83,0.522)中抽出100個(gè)樣本的、S、t值與的95%的可信區(qū)間
圖3.2自由度分別為1、5、∞的t分布
自由度隨機(jī)變量能夠自由取值的個(gè)數(shù)
=n-限制條件的個(gè)數(shù)t分布的特征t分布是一簇單峰分布曲線。t分布以0為中心,左右對(duì)稱且均勻下降。其形態(tài)變化與自由度的大小有關(guān)。
自由度逐漸增大時(shí),t分布逐漸逼近u分布;當(dāng)=∞時(shí),t分布即為u分布。
t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對(duì)稱由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個(gè)常量,而是隨自由度的大小而變化附表2,t分布表的特點(diǎn)附表2的橫標(biāo)目為自由度,縱標(biāo)目為概率P,表中數(shù)值為其相應(yīng)的t界值,記作t,
。附表2只列出正值,若計(jì)算的t值為負(fù)值時(shí),可用其絕對(duì)值查表。附表2右上附圖的陰影部分表示t,以外尾部面積的概率。單側(cè)t0.05,30=1.697其通式為單側(cè):P(t≤-t,)=或P(t≥t,)=
雙側(cè):P(t≤-t/2,)+P(t≥t/2,)=圖中非陰影部分面積的概率為,
P(-t/2,<t<t/2,)=1-總體均數(shù)的估計(jì)用樣本指標(biāo)估計(jì)總體指標(biāo)稱為參數(shù)估計(jì),是統(tǒng)計(jì)推斷的一個(gè)重要方面??傮w均數(shù)估計(jì)的兩種方法點(diǎn)估計(jì):是直接用統(tǒng)計(jì)量估計(jì)總體參數(shù).
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 場(chǎng)地借用合作協(xié)議合同
- 場(chǎng)調(diào)研服務(wù)費(fèi)合同
- 《大分銷策略分析》課件
- 《小波變換》課件:探索信號(hào)處理的秘密
- 中級(jí)經(jīng)濟(jì)師《人力資源管理》練習(xí)試題
- 《消防安全管理與應(yīng)急措施》課件
- 化學(xué)探索與創(chuàng)新
- 商用汽車買賣銷售合同范本
- 加工廠框架合同范本
- 借名蓋房合同范例
- (正式版)JBT 14449-2024 起重機(jī)械焊接工藝評(píng)定
- 廣東省深圳市2023-2024學(xué)年六年級(jí)下學(xué)期期末語文試題
- 旋耕機(jī)傳動(dòng)系統(tǒng)設(shè)計(jì)
- YJ-T 27-2024 應(yīng)急指揮通信保障能力建設(shè)規(guī)范
- 往年專業(yè)知識(shí)(水利水電)相關(guān)題目及答案
- 乳突根治護(hù)理查房
- 駱駝祥子選擇題100道及答案
- 2024年株洲師范高等??茖W(xué)校高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 審計(jì)學(xué)知識(shí)點(diǎn)歸納總結(jié)
- 2024釔-90微球選擇性內(nèi)放射治療肝臟惡性腫瘤規(guī)范化操作專家共識(shí)
- 2024年中郵保險(xiǎn)公司招聘筆試參考題庫含答案解析
評(píng)論
0/150
提交評(píng)論