第四講 數(shù)值變量資料的統(tǒng)計推斷 06-03-6_第1頁
第四講 數(shù)值變量資料的統(tǒng)計推斷 06-03-6_第2頁
第四講 數(shù)值變量資料的統(tǒng)計推斷 06-03-6_第3頁
第四講 數(shù)值變量資料的統(tǒng)計推斷 06-03-6_第4頁
第四講 數(shù)值變量資料的統(tǒng)計推斷 06-03-6_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四講數(shù)值變量資料的統(tǒng)計推斷10/15/20231統(tǒng)計推斷Statisticalinference

是用樣本信息推論總體特征的過程。(一)參數(shù)估計(二)假設(shè)檢驗10/15/20232一、參數(shù)估計(一)點估計(二)區(qū)間估計(置信區(qū)間)10/15/20233二、假設(shè)檢驗又稱顯著性檢驗,是指由樣本均數(shù)間存在的差別對樣本所代表的總體均數(shù)間是否存在著差別所做出判斷的分析推斷方法及過程。10/15/20234

樣本均數(shù)與總體均數(shù)之間的差異或樣本均數(shù)之間的差異,稱為均數(shù)的抽樣誤差(samplingerrorofmean)。

均數(shù)的標(biāo)準(zhǔn)誤()是描述均數(shù)的抽樣誤差大小的統(tǒng)計指標(biāo)。一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤10/15/20235統(tǒng)計理論表明:

1.從正態(tài)總體中隨機(jī)抽取例數(shù)為n,樣本均數(shù)也服從正態(tài)分布;2.從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)或近似正態(tài)的總體中抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)為μ,標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤的計算公式為:

10/15/20236

由于在實際抽樣計算中,σ常屬未知,而通常僅用一個樣本的標(biāo)準(zhǔn)差S作為σ的估計值,其計算公式為:

均數(shù)標(biāo)準(zhǔn)誤的用途:

1.可用來衡量樣本均數(shù)的可靠性。2.結(jié)合樣本均數(shù)和正態(tài)分布曲線下的面積分布規(guī)律,可用與估計總體均數(shù)的置信區(qū)間。3.可用于均數(shù)的假設(shè)檢驗。4.可作實驗室的質(zhì)量控制

10/15/20237

二、t分布

采用變換,則將一般的正態(tài)分布N(μ,σ2)變換為標(biāo)準(zhǔn)正態(tài)分布N(0,1),u叫作標(biāo)準(zhǔn)正態(tài)變量。正態(tài)分布N(μ,),同樣可對正態(tài)變量采用u變換,,將N(μ,)變換成標(biāo)準(zhǔn)正態(tài)分布N(0,1),即U分布。10/15/20238在實際工作中,往往是用來估計的,這時對正態(tài)變量采用的不是u變換,而是t變換,即:

10/15/20239

t分布是一簇對稱于0的單峰分布曲線。自由度(實際上是樣本含量n-1)越小,曲線越扁平,隨著自由度的增大,t分布曲線逐漸逼近標(biāo)準(zhǔn)正態(tài)曲線。

t分布主要用于總體均數(shù)的區(qū)間估計和

t

檢驗。10/15/202310三、總體均數(shù)的估計(參數(shù)估計)

參數(shù)估計有兩種方法:

點估計和區(qū)間估計

1.點估計(pointestimation)以樣本統(tǒng)計量直接估計總體參數(shù)。未考慮抽樣誤差的存在。即:

μ

2.區(qū)間估計(intervalestimation)以預(yù)先給定的概率估計總體參數(shù)在哪個范圍內(nèi)的估計方法稱為區(qū)間估計。10/15/202311(1)σ已知時,按正態(tài)分布原理,用公式估計總體均數(shù)的95%的置信區(qū)間。(2)σ未知、且樣本例數(shù)較小時,按t分布原理,估計總體均數(shù)的95%置信區(qū)間。

(3)σ未知,但樣本例數(shù)n足夠大時,按正態(tài)分布原理,估計總體均數(shù)95%置信區(qū)間。10/15/202312區(qū)間估計(置信區(qū)間)例9-13(P289)健康男子20人,即n=20ν=n-1收縮壓均數(shù)為:

標(biāo)準(zhǔn)差為:

代入公式:

10/15/202313以14歲130例女孩計算指標(biāo):

10/15/202314四、假設(shè)檢驗的基本步驟

1.建立檢驗假設(shè):無效假設(shè)H0

備擇假設(shè)H1

2.確定檢驗水準(zhǔn):

α=0.053.選定檢驗方法和計算檢驗統(tǒng)計量4.根據(jù)自由度確定P值5.判定統(tǒng)計結(jié)果,定專業(yè)結(jié)論10/15/202315

第四節(jié)t檢驗和u檢驗

t

檢驗(t-test)的應(yīng)用條件:當(dāng)樣本例數(shù)較?。╪<30),樣本來自呈正態(tài)分布的總體,總體標(biāo)準(zhǔn)差未知。在做兩個樣本均數(shù)比較時,還要求兩樣本相應(yīng)的總體方差相等()。

一、樣本均數(shù)與總體均數(shù)的比較

樣本均數(shù)與總體均數(shù)比較的目的是推斷樣本所代表的未知總體均數(shù)μ與已知的總體均數(shù)μ0是否有差別。10/15/202316例9-15

P291建立檢驗假設(shè):定檢驗水準(zhǔn):計算t值

4.定P值,判定結(jié)果:

t<t0.05∴P

>0.05,差別無顯著性

在的水準(zhǔn)上,接受H0,該法測得均數(shù)與真值相同

10/15/202317二、配對資料的比較

配對設(shè)計的均數(shù)的假設(shè)檢驗有三種情況:

1.自身比較;

2.同一樣品用兩種方法檢驗的結(jié)果;3.對成對設(shè)計的兩個受試對象分別給予兩種處理,目的都是推斷兩種處理的效果有無差別。統(tǒng)計量的計算公式為:

10/15/202318例問該藥是否對高血壓患者治療前后舒張壓

是否有影響?1.建立檢驗假設(shè),定檢驗水準(zhǔn):2.計算t值3.定P值:4.判定定結(jié)果:t>t0.01,73.99∴P<0.01,

差別有高度顯著性在的水準(zhǔn)上,拒絕H0,接受H1,差別有高度顯著性,該藥有影響。10/15/202319三、

兩個小樣本均數(shù)的比較

10/15/202320

表用兩種不同蛋白質(zhì)含量飼料喂養(yǎng)大鼠后體重增加的克數(shù)

高蛋白組1341461041191241611078311312997123

低蛋白組7011810185107132941.建立檢驗假設(shè),定檢驗水準(zhǔn):α=0.05

2.計算t值:10/15/2023213.定P值:

t=1.894.定結(jié)果:在α=0.05的水準(zhǔn)上,接受H0,t<t0.05,172.11,∴P>0.05,差別無顯著性,不能認(rèn)為兩種飼料對大白鼠有影響。

10/15/202322

U檢驗(U-test)應(yīng)用條件:當(dāng)樣本例數(shù)較大(n>30),樣本來自呈正態(tài)分布的總體,總體標(biāo)準(zhǔn)差未知。在做兩個樣本均數(shù)比較時,要求兩樣本相應(yīng)的總體方差相等(),變量為獨立的隨機(jī)樣本。10/15/202323一、大樣本均數(shù)與總體均數(shù)的比較

例題:已知一般正常成年男子脈搏均數(shù)74次/分,現(xiàn)測得某山區(qū)100名正常成年男子脈搏65.26次/分,標(biāo)準(zhǔn)差為7.2次/分,問:山區(qū)正常成年男子脈搏均數(shù)是否比一般正常成年男子脈搏跳動得較慢?已知:(1)總體均數(shù):μ=74次/分;(2)樣本均數(shù):=65.26次/分;(3)樣本均數(shù)的標(biāo)準(zhǔn)差:S=7.2次/分n=10010/15/202324分析計算大樣本10/15/202325建立檢驗假設(shè):2.定檢驗水準(zhǔn):3.計算u值:

4.定P值,判定結(jié)果:

u=12.14>u0.01∴P<0.01,差別有高度顯著性

在的水準(zhǔn)上,拒絕H0,

接受H1,山區(qū)正常成年男子脈搏均數(shù)是比一般正常成年男子脈搏跳動得較慢。

10/15/202326

2.兩個大樣本均數(shù)的比較10/15/202327例題9-17

男女新生兒甘油三酯濃度測定值如下:男嬰n1=175女嬰n2=167(一)建立檢驗假設(shè)(二)定α水準(zhǔn)(三)選方法,求檢驗統(tǒng)計量(四)定P值,判定結(jié)果10/15/202328在α=0.05的水準(zhǔn)上,接受H1,U<U0.051.96,∴P>0.05,差別無顯著性,男女新生兒甘油三酯濃度相同。10/15/202329四、假設(shè)檢驗應(yīng)注意的問題

1.資料必須合乎隨機(jī)化抽樣原則2.選用的假設(shè)檢驗方法應(yīng)符合其基本應(yīng)用條件3.實際差別大小與統(tǒng)計意義的區(qū)別4.進(jìn)行假設(shè)檢驗時對差異有無顯著性或有無統(tǒng)計意義的判斷不能絕對化5.假設(shè)檢驗的單側(cè)檢驗與雙側(cè)檢驗的選擇10/15/202330

方差分析(F-檢驗)

方差分析(analysisofvariance,ANOVA

)能用于兩個或兩個以上樣本均數(shù)的比較,還可分析兩個或多個研究因素的交互作用以及回歸方程的線性假設(shè)檢驗。

應(yīng)用的條件是:

1.各樣本的每個變量值是相互獨立的隨機(jī)變量2.各樣本都來自呈正態(tài)分布的總體3.各個總體方差齊10/15/202331一、方差分析的基本思想

把全部觀察值之間的變異----總變異,按設(shè)計和需要分為兩個(組間、組內(nèi)-誤差)變異或多個變異部分,其自由度也分解為相應(yīng)的部分。計算變異間的比值(F值),若F值接近于1,可認(rèn)為處理因素?zé)o作用;若F值遠(yuǎn)大于1,且大于或等于F界值表中的某界值時,可認(rèn)為處理因素有作用。10/15/202332變異分割10/15/202333二、單因素的方差分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論