數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿

上傳人：基*** IP屬地：廣東上傳時間：2023-05-16 格式：PPT 頁數(shù)：42 大?。?4.27MB 積分：15 舉報 版權(quán)申訴

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第2頁

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第3頁

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第4頁

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿_第5頁

已閱讀5頁，還剩37頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿目前一頁\總數(shù)四十二頁\編于十四點（優(yōu)選）第二節(jié)數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷目前二頁\總數(shù)四十二頁\編于十四點學(xué)習(xí)目標(biāo)1.說出抽樣誤差的概念2.記住標(biāo)準(zhǔn)誤計算公式并能說出公式的含義3.描述t分布的特征及應(yīng)用4.說出參數(shù)估計的含義及方法5.描述均數(shù)檢驗t檢驗和u檢驗的方法目前三頁\總數(shù)四十二頁\編于十四點總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

統(tǒng)計推斷如：總體均數(shù)μ

總體標(biāo)準(zhǔn)差σ

總體率π如：樣本均數(shù)樣本標(biāo)準(zhǔn)差S

樣本率P

內(nèi)容：參數(shù)估計(estimationofparameters)

包括：點估計與區(qū)間估計2.假設(shè)檢驗(testofhypothesis)統(tǒng)計推斷statisticalinference目前四頁\總數(shù)四十二頁\編于十四點一均數(shù)的抽樣誤差

抽樣誤差(samplingerror)：由于個體差異導(dǎo)致的樣本統(tǒng)計量之間或與總體參數(shù)間的差別。

從某正態(tài)分布總體中，隨機抽取樣本含量n＝100的樣本，每次抽樣獲得其均數(shù)分別為，，，，他們之間及與總體均數(shù)μ總是不相等。這種差異就是抽樣誤差。

目前五頁\總數(shù)四十二頁\編于十四點1.抽樣試驗

從正態(tài)分布總體N(5.00，0.502)中，每次隨機抽取樣本含量n＝5，并計算其均數(shù)與標(biāo)準(zhǔn)差；重復(fù)抽取1000次，獲得1000份樣本；計算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差，并對1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n＝10、樣本含量n＝30的抽樣實驗；比較計算結(jié)果。目前六頁\總數(shù)四十二頁\編于十四點抽樣試驗(n=5)目前七頁\總數(shù)四十二頁\編于十四點抽樣試驗(n=10)目前八頁\總數(shù)四十二頁\編于十四點抽樣試驗(n=30)目前九頁\總數(shù)四十二頁\編于十四點1000份樣本抽樣計算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913目前十頁\總數(shù)四十二頁\編于十四點3個抽樣實驗結(jié)果圖示目前十一頁\總數(shù)四十二頁\編于十四點抽樣實驗小結(jié)

均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。

均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差相差一個常數(shù)的倍數(shù)，即

樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)=樣本標(biāo)準(zhǔn)差/

從正態(tài)總體N(μ,σ2)中抽取樣本，獲得均數(shù)的分布仍近似呈正態(tài)分布N(μ,σ2/n)

。目前十二頁\總數(shù)四十二頁\編于十四點2.中心極限定理(centrallimittheorem)①即使從非正態(tài)總體中抽取樣本，所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。目前十三頁\總數(shù)四十二頁\編于十四點隨機變量XN(m，s2)標(biāo)準(zhǔn)正態(tài)分布N(0，12)u變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0，12)Studentt分布自由度：n-1二t分布目前十四頁\總數(shù)四十二頁\編于十四點t分布曲線

t分布有如下特征：①是以0為中心隨自由度而變化的一簇左右對稱的曲線

②單峰分布，曲線在t＝0處最高，并以t＝0為中心左右對稱③與正態(tài)分布相比，曲線最高處較矮，自由度越小，兩尾部翹得越高(見綠線)④隨自由度增大，曲線逐漸接近正態(tài)分布；分布的極限為標(biāo)準(zhǔn)正態(tài)分布。目前十五頁\總數(shù)四十二頁\編于十四點t分布曲線

t分布有如下特征：①自由度相同時，t越大，

p值越?、趐值相同時，自由度越大，

t值越小③t值相同時，自由度越大

p值越小t1t2(t1>t2,p1<p2)(n1>n2,t1<t2)(n1>n2,p1<p2)t1t2t目前十六頁\總數(shù)四十二頁\編于十四點t分布曲線下面積單側(cè)t0.05，9＝1.833雙側(cè)t0.05/2，9＝2.262

＝單側(cè)t0.025，9單側(cè)t0.01，9＝2.821雙側(cè)t0.01/2，9＝3.250

＝單側(cè)t0.005，9雙側(cè)t0.05/2，∞＝1.96

＝單側(cè)t0.025，∞單側(cè)t0.05，∞＝1.640.013.2502.8210.005目前十七頁\總數(shù)四十二頁\編于十四點三總體均數(shù)的估計

1.總體均數(shù)的估計

(1).總體均數(shù)的點估計(pointestimation)與區(qū)間估計

(2).總體均數(shù)的可信區(qū)間(confidenceinterval，CI)(3).大樣本總體均數(shù)的可信區(qū)間2.可信區(qū)間的解釋目前十八頁\總數(shù)四十二頁\編于十四點1.總體均數(shù)的估計

(1).總體均數(shù)的點估計與區(qū)間估計參數(shù)的估計點估計：由樣本統(tǒng)計量直接估計總體參數(shù)區(qū)間估計：在一定可信度(1-α)下，同時考慮抽樣誤差目前十九頁\總數(shù)四十二頁\編于十四點

區(qū)間的可信度(如95％或99％)是重復(fù)抽樣(如1000次)時，樣本(如n=5)區(qū)間包含總體參數(shù)(μ)的百分?jǐn)?shù)。常用(1-α)表示，α值一般取0.05或0.01。)或(；或?qū)懗?，可信區(qū)間為(XXXXXStXStXStXStXStXnananananama,2/,2/,2/,2/,2/)1(+<<-±+--(2).總體均數(shù)的可信區(qū)間(CI)目前二十頁\總數(shù)四十二頁\編于十四點

(2).總體均數(shù)的可信區(qū)間目前二十一頁\總數(shù)四十二頁\編于十四點(3).大樣本總體均數(shù)的可信區(qū)間

目前二十二頁\總數(shù)四十二頁\編于十四點2.可信區(qū)間的解釋

95％可信區(qū)間：從總體中作隨機抽樣，作100次抽樣，每個樣本可算得一個可信區(qū)間，得100個可信區(qū)間，平均有95個可信區(qū)間包括μ(估計正確)，只有5個可信區(qū)間不包括μ(估計錯誤)。95％可信區(qū)間

99％可信區(qū)間公式區(qū)間范圍窄寬估計錯誤的概率大(0.05)小(0.01)XXStXStXnn,2/05.0,2/05.0,+-目前二十三頁\總數(shù)四十二頁\編于十四點

可信區(qū)間與參考值范圍的比較目前二十四頁\總數(shù)四十二頁\編于十四點四均數(shù)的假設(shè)檢驗1.樣本均數(shù)與總體均數(shù)的比較2.配對資料的比較3.兩樣本均數(shù)的比較4.大樣本均數(shù)比較的u檢驗5.假設(shè)檢驗的步驟及有關(guān)概念目前二十五頁\總數(shù)四十二頁\編于十四點1.樣本均數(shù)與總體均數(shù)的比較

推斷樣本所代表的未知總體均數(shù)μ與已知總體均數(shù)μ0有無差別。已知總體均數(shù)μ0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。統(tǒng)計量t的計算公式：目前二十六頁\總數(shù)四十二頁\編于十四點實例目前二十七頁\總數(shù)四十二頁\編于十四點目前二十八頁\總數(shù)四十二頁\編于十四點根據(jù)專業(yè)知識確定單、雙側(cè)檢驗?zāi)壳岸彭揬總數(shù)四十二頁\編于十四點2.配對資料的比較

兩種情況：1.隨機配對設(shè)計(randomizedpaireddesign)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子，每對中的兩個個體隨機分配給兩種處理(如處理組與對照組)；2.或者同一受試對象作兩次不同的處理(自身對照)。

優(yōu)點：配對設(shè)計減少了個體差異。

特點：資料成對，每對數(shù)據(jù)不可拆分。目前三十頁\總數(shù)四十二頁\編于十四點2.配對資料的比較—方法目前三十一頁\總數(shù)四十二頁\編于十四點例：

兩法測定12份尿鉛含量的結(jié)果樣品號尿鉛含量(μmol.L－1)簡便法常規(guī)法差值(d)

2.41

2.80-0.390.1521

2.90

3.04-0.140.0196

2.75

1.88

0.870.7569

3.23

3.43-0.200.0400

3.67

3.81-0.140.0196

4.49

4.00

0.490.2401

5.16

4.44

0.720.5184

5.45

5.41

0.040.0016

2.06

1.24

0.820.672410

1.64

1.83-0.190.036111

1.06

1.45-0.390.152112

0.77

0.92-0.150.0225合計----

1.342.6314目前三十二頁\總數(shù)四十二頁\編于十四點兩法測定結(jié)果的比較目前三十三頁\總數(shù)四十二頁\編于十四點3.兩樣本均數(shù)的比較

完全隨機設(shè)計(completelyrandomdesign)：把受試對象完全隨機分為兩組，分別給予不同處理，然后比較獨立的兩組樣本均數(shù)。各組對象數(shù)不必嚴(yán)格相同。

目的：比較兩總體均數(shù)是否相同。

條件：假定資料來自正態(tài)總體，σ12=σ22目前三十四頁\總數(shù)四十二頁\編于十四點實例目前三十五頁\總數(shù)四十二頁\編于十四點4.大樣本均數(shù)比較的u檢驗

兩樣本均數(shù)比較時當(dāng)每組樣本量大于30(或50)時，可采用u檢驗；但只是近似方法。優(yōu)點：簡單，u界值與自由度無關(guān)，

u0.05＝1.96，u0.01＝2.58目前三十六頁\總數(shù)四十二頁\編于十四點5.假設(shè)檢驗的步驟及有關(guān)概念總體間差異：1.個體差異，抽樣誤差所致；

2.總體間固有差異判斷差別屬于哪一種情況的統(tǒng)計學(xué)檢驗，就是假設(shè)檢驗(testofhypothesis)。

t檢驗是最常用的一種假設(shè)檢驗之一。小概率思想:P<0.05(或P<0.01)是小概率事件。在一次試驗中基本上不會發(fā)生。P≤α(0.05)樣本差別有統(tǒng)計學(xué)意義；P>α(0.05)樣本差別無統(tǒng)計學(xué)意義目前三十七頁\總數(shù)四十二頁\編于十四點1、建立假設(shè)與確定檢驗水準(zhǔn)(α)

H0:μ1＝μ2無效假設(shè)(nullhypothesis)

H1:μ1≠μ2備擇假設(shè)(alternativehypothesis)

檢驗水準(zhǔn)(levelofatest)：α=0.05(雙側(cè))2、選定方法和計算統(tǒng)計量：根據(jù)統(tǒng)計推斷目的、設(shè)計、資料組數(shù)、樣本含量、等選擇方法。如兩組小樣本比較用t檢驗、大樣本比較u檢驗、方差齊性檢驗用F檢驗。3、確定P值，作出判斷

P≤α(0.05)樣本差別有統(tǒng)計學(xué)意義；

P>α(0.05)樣本差別無統(tǒng)計學(xué)意義

假設(shè)檢驗的步驟

目前三十八頁\總數(shù)四十二頁\編于十四點

Ⅰ型錯誤和Ⅱ型錯誤由樣本推斷的結(jié)果真實結(jié)果拒絕H0不拒絕H0

H0成立Ⅰ型錯誤a推斷正確(1－a

)

H0不成立推斷正確(1－b)Ⅱ型錯誤b

(1－b)即把握度(powerofatest):兩總體確有差別，被檢出有差別的能力(1－a)即可信度(confidencelevel):重復(fù)抽樣時，樣本區(qū)間包含總體參數(shù)(m)的百分?jǐn)?shù)目前三十九頁\總數(shù)四十二頁\編于十四點

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿

文檔簡介

溫馨提示

最新文檔

評論

數(shù)值變量資料的統(tǒng)計分析統(tǒng)計推斷演示文稿

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔