數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第1頁
數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第2頁
數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第3頁
數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第4頁
數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿現(xiàn)在是1頁\一共有42頁\編輯于星期五(優(yōu)選)第二節(jié)數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷現(xiàn)在是2頁\一共有42頁\編輯于星期五學(xué)習(xí)目標1.說出抽樣誤差的概念2.記住標準誤計算公式并能說出公式的含義3.描述t分布的特征及應(yīng)用4.說出參數(shù)估計的含義及方法5.描述均數(shù)檢驗t檢驗和u檢驗的方法現(xiàn)在是3頁\一共有42頁\編輯于星期五總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

統(tǒng)計推斷如:總體均數(shù)μ

總體標準差σ

總體率π如:樣本均數(shù)樣本標準差S

樣本率P

內(nèi)容:參數(shù)估計(estimationofparameters)

包括:點估計與區(qū)間估計2.假設(shè)檢驗(testofhypothesis)統(tǒng)計推斷statisticalinference現(xiàn)在是4頁\一共有42頁\編輯于星期五一均數(shù)的抽樣誤差

抽樣誤差(samplingerror):由于個體差異導(dǎo)致的樣本統(tǒng)計量之間或與總體參數(shù)間的差別。

從某正態(tài)分布總體中,隨機抽取樣本含量n=100的樣本,每次抽樣獲得其均數(shù)分別為,,,,他們之間及與總體均數(shù)μ總是不相等。這種差異就是抽樣誤差。

現(xiàn)在是5頁\一共有42頁\編輯于星期五1.抽樣試驗

從正態(tài)分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n=5,并計算其均數(shù)與標準差;重復(fù)抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標準差,并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實驗;比較計算結(jié)果。現(xiàn)在是6頁\一共有42頁\編輯于星期五抽樣試驗(n=5)現(xiàn)在是7頁\一共有42頁\編輯于星期五抽樣試驗(n=10)現(xiàn)在是8頁\一共有42頁\編輯于星期五抽樣試驗(n=30)現(xiàn)在是9頁\一共有42頁\編輯于星期五1000份樣本抽樣計算結(jié)果總體的均數(shù)總體標準差s均數(shù)的均數(shù)均數(shù)標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913現(xiàn)在是10頁\一共有42頁\編輯于星期五3個抽樣實驗結(jié)果圖示現(xiàn)在是11頁\一共有42頁\編輯于星期五抽樣實驗小結(jié)

均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。

均數(shù)的標準差即標準誤與總體標準差相差一個常數(shù)的倍數(shù),即

樣本均數(shù)的標準誤(StandardError)=樣本標準差/

從正態(tài)總體N(μ,σ2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(μ,σ2/n)

?,F(xiàn)在是12頁\一共有42頁\編輯于星期五2.中心極限定理(centrallimittheorem)①即使從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄?,F(xiàn)在是13頁\一共有42頁\編輯于星期五隨機變量XN(m,s2)標準正態(tài)分布N(0,12)u變換均數(shù)標準正態(tài)分布N(0,12)Studentt分布自由度:n-1二t分布現(xiàn)在是14頁\一共有42頁\編輯于星期五t分布曲線

t分布有如下特征:①是以0為中心隨自由度而變化的一簇左右對稱的曲線

②單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱③與正態(tài)分布相比,曲線最高處較矮,自由度越小,兩尾部翹得越高(見綠線)④隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標準正態(tài)分布。現(xiàn)在是15頁\一共有42頁\編輯于星期五t分布曲線

t分布有如下特征:①自由度相同時,t越大,

p值越?、趐值相同時,自由度越大,

t值越?、踭值相同時,自由度越大

p值越小t1t2(t1>t2,p1<p2)(n1>n2,t1<t2)(n1>n2,p1<p2)t1t2t現(xiàn)在是16頁\一共有42頁\編輯于星期五t分布曲線下面積單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,9=2.262

=單側(cè)t0.025,9單側(cè)t0.01,9=2.821雙側(cè)t0.01/2,9=3.250

=單側(cè)t0.005,9雙側(cè)t0.05/2,∞=1.96

=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.640.013.2502.8210.005現(xiàn)在是17頁\一共有42頁\編輯于星期五三總體均數(shù)的估計

1.總體均數(shù)的估計

(1).總體均數(shù)的點估計(pointestimation)與區(qū)間估計

(2).總體均數(shù)的可信區(qū)間(confidenceinterval,CI)(3).大樣本總體均數(shù)的可信區(qū)間2.可信區(qū)間的解釋現(xiàn)在是18頁\一共有42頁\編輯于星期五1.總體均數(shù)的估計

(1).總體均數(shù)的點估計與區(qū)間估計參數(shù)的估計點估計:由樣本統(tǒng)計量直接估計總體參數(shù)區(qū)間估計:在一定可信度(1-α)下,同時考慮抽樣誤差現(xiàn)在是19頁\一共有42頁\編輯于星期五

區(qū)間的可信度(如95%或99%)是重復(fù)抽樣(如1000次)時,樣本(如n=5)區(qū)間包含總體參數(shù)(μ)的百分數(shù)。常用(1-α)表示,α值一般取0.05或0.01。)或(;或?qū)懗?,可信區(qū)間為(XXXXXStXStXStXStXStXnananananama,2/,2/,2/,2/,2/)1(+<<-±+--(2).總體均數(shù)的可信區(qū)間(CI)現(xiàn)在是20頁\一共有42頁\編輯于星期五

(2).總體均數(shù)的可信區(qū)間現(xiàn)在是21頁\一共有42頁\編輯于星期五(3).大樣本總體均數(shù)的可信區(qū)間

現(xiàn)在是22頁\一共有42頁\編輯于星期五2.可信區(qū)間的解釋

95%可信區(qū)間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個可信區(qū)間,得100個可信區(qū)間,平均有95個可信區(qū)間包括μ(估計正確),只有5個可信區(qū)間不包括μ(估計錯誤)。95%可信區(qū)間

99%可信區(qū)間公式區(qū)間范圍窄寬估計錯誤的概率大(0.05)小(0.01)XXStXStXnn,2/05.0,2/05.0,+-現(xiàn)在是23頁\一共有42頁\編輯于星期五

可信區(qū)間與參考值范圍的比較現(xiàn)在是24頁\一共有42頁\編輯于星期五四均數(shù)的假設(shè)檢驗1.樣本均數(shù)與總體均數(shù)的比較2.配對資料的比較3.兩樣本均數(shù)的比較4.大樣本均數(shù)比較的u檢驗5.假設(shè)檢驗的步驟及有關(guān)概念現(xiàn)在是25頁\一共有42頁\編輯于星期五1.樣本均數(shù)與總體均數(shù)的比較

推斷樣本所代表的未知總體均數(shù)μ與已知總體均數(shù)μ0有無差別。已知總體均數(shù)μ0一般為理論值、標準值或經(jīng)大量觀察所得的穩(wěn)定值。統(tǒng)計量t的計算公式:現(xiàn)在是26頁\一共有42頁\編輯于星期五實例現(xiàn)在是27頁\一共有42頁\編輯于星期五現(xiàn)在是28頁\一共有42頁\編輯于星期五根據(jù)專業(yè)知識確定單、雙側(cè)檢驗現(xiàn)在是29頁\一共有42頁\編輯于星期五2.配對資料的比較

兩種情況:1.隨機配對設(shè)計(randomizedpaireddesign)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,每對中的兩個個體隨機分配給兩種處理(如處理組與對照組);2.或者同一受試對象作兩次不同的處理(自身對照)。

優(yōu)點:配對設(shè)計減少了個體差異。

特點:資料成對,每對數(shù)據(jù)不可拆分。現(xiàn)在是30頁\一共有42頁\編輯于星期五2.配對資料的比較—方法現(xiàn)在是31頁\一共有42頁\編輯于星期五例:

兩法測定12份尿鉛含量的結(jié)果樣品號尿鉛含量(μmol.L-1)簡便法常規(guī)法差值(d)

1

2.41

2.80-0.390.1521

2

2.90

3.04-0.140.0196

3

2.75

1.88

0.870.7569

4

3.23

3.43-0.200.0400

5

3.67

3.81-0.140.0196

6

4.49

4.00

0.490.2401

7

5.16

4.44

0.720.5184

8

5.45

5.41

0.040.0016

9

2.06

1.24

0.820.672410

1.64

1.83-0.190.036111

1.06

1.45-0.390.152112

0.77

0.92-0.150.0225合計----

1.342.6314現(xiàn)在是32頁\一共有42頁\編輯于星期五兩法測定結(jié)果的比較現(xiàn)在是33頁\一共有42頁\編輯于星期五3.兩樣本均數(shù)的比較

完全隨機設(shè)計(completelyrandomdesign):把受試對象完全隨機分為兩組,分別給予不同處理,然后比較獨立的兩組樣本均數(shù)。各組對象數(shù)不必嚴格相同。

目的:比較兩總體均數(shù)是否相同。

條件:假定資料來自正態(tài)總體,σ12=σ22現(xiàn)在是34頁\一共有42頁\編輯于星期五實例現(xiàn)在是35頁\一共有42頁\編輯于星期五4.大樣本均數(shù)比較的u檢驗

兩樣本均數(shù)比較時當每組樣本量大于30(或50)時,可采用u檢驗;但只是近似方法。優(yōu)點:簡單,u界值與自由度無關(guān),

u0.05=1.96,u0.01=2.58現(xiàn)在是36頁\一共有42頁\編輯于星期五5.假設(shè)檢驗的步驟及有關(guān)概念總體間差異:1.個體差異,抽樣誤差所致;

2.總體間固有差異判斷差別屬于哪一種情況的統(tǒng)計學(xué)檢驗,就是假設(shè)檢驗(testofhypothesis)。

t檢驗是最常用的一種假設(shè)檢驗之一。小概率思想:P<0.05(或P<0.01)是小概率事件。在一次試驗中基本上不會發(fā)生。P≤α(0.05)樣本差別有統(tǒng)計學(xué)意義;P>α(0.05)樣本差別無統(tǒng)計學(xué)意義現(xiàn)在是37頁\一共有42頁\編輯于星期五1、建立假設(shè)與確定檢驗水準(α)

H0:μ1=μ2無效假設(shè)(nullhypothesis)

H1:μ1≠μ2備擇假設(shè)(alternativehypothesis)

檢驗水準(levelofatest):α=0.05(雙側(cè))2、選定方法和計算統(tǒng)計量:根據(jù)統(tǒng)計推斷目的、設(shè)計、資料組數(shù)、樣本含量、等選擇方法。如兩組小樣本比較用t檢驗、大樣本比較u檢驗、方差齊性檢驗用F檢驗。3、確定P值,作出判斷

P≤α(0.05)樣本差別有統(tǒng)計學(xué)意義;

P>α(0.05)樣本差別無統(tǒng)計學(xué)意義

假設(shè)檢驗的步驟

現(xiàn)在是38頁\一共有42頁\編輯于星期五

Ⅰ型錯誤和Ⅱ型錯誤由樣本推斷的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論