研-統(tǒng)計(jì)3抽樣誤差t分布ppt課件_第1頁(yè)
研-統(tǒng)計(jì)3抽樣誤差t分布ppt課件_第2頁(yè)
研-統(tǒng)計(jì)3抽樣誤差t分布ppt課件_第3頁(yè)
研-統(tǒng)計(jì)3抽樣誤差t分布ppt課件_第4頁(yè)
研-統(tǒng)計(jì)3抽樣誤差t分布ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、概念: 頻數(shù)分布以均數(shù)為中心,左右兩側(cè)根本對(duì)稱(chēng),接近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠(yuǎn),頻數(shù)愈少,構(gòu)成一個(gè)中間多,兩側(cè)逐漸減少的對(duì)稱(chēng)分布。是一種延續(xù)型分布。又稱(chēng)高斯分布。高斯(Johann Carl Friedrich Gauss,生于1777年4月30日于不倫瑞克,卒于1855年2月23日于哥廷根,德國(guó)著名數(shù)學(xué)家、天文學(xué)家、大地丈量學(xué)家、物理學(xué)家。被以為是最重要的數(shù)學(xué)家,并有數(shù)學(xué)王子的佳譽(yù)。 正態(tài)分布(normal distribution).正態(tài)分布用N(, )表示,其位置與均數(shù)有關(guān),外形與規(guī)范差有關(guān)。醫(yī)學(xué)景象許多呈正態(tài)分布,或近似正態(tài)分布:如正常人的生理,生化目的變量,等.從直方圖到正態(tài)曲線(xiàn)的

2、過(guò)渡.對(duì)稱(chēng)分布正右偏分布負(fù)左偏分布幾種常見(jiàn)的頻數(shù)分布.正態(tài)分布之所以重要, 三個(gè)主要緣由:1. 正態(tài)分布在分析上較易處置。2. 正態(tài)分布之概率密度函數(shù)p.d.f.,probability density function的圖形為鐘形曲線(xiàn)(bell-shaped curve), 對(duì)稱(chēng), 很適宜當(dāng)做不少事件之機(jī)率方式。3. 正態(tài)分布可當(dāng)做不少大樣本的近似分布。 .正態(tài)分布的密度函數(shù):式中為均數(shù);為規(guī)范差;為圓周率;為自然對(duì)數(shù)的底,即2.71828。以上均為常數(shù),僅x為變量。.規(guī)范正態(tài)分布:為了運(yùn)用方便,常將式進(jìn)展變量變換,即:u變換. 所得到的新變量u的分布即為規(guī)范正態(tài)分布。u的含義:變量到均數(shù)間

3、的間隔相當(dāng)于規(guī)范差的倍數(shù)。.規(guī)范正態(tài)分布的概率密度函數(shù):.u變換后,=0,=1,使原來(lái)的正態(tài)分布變換為規(guī)范正態(tài)分布standard normal distribution亦稱(chēng)u分布。規(guī)范正態(tài)分布 N(0,1).正態(tài)分布的特征和分布規(guī)律: 1曲線(xiàn)在x軸的上方,與x軸不相交,當(dāng)x=時(shí),曲線(xiàn)位于最高點(diǎn)。 f(u=0)=0.39892曲線(xiàn)關(guān)于直線(xiàn)x=左右對(duì)稱(chēng)。3正態(tài)分布有兩個(gè)參數(shù):均數(shù),規(guī)范差;規(guī)范正態(tài)的參數(shù)分別為:0, 14正態(tài)分布的面積分布有一定規(guī)律。.正態(tài)曲線(xiàn)下面積的分布規(guī)律正態(tài)曲線(xiàn)下,橫軸上一定區(qū)間的面積,等于該區(qū)間的頻數(shù)發(fā)生的概率即一切隨機(jī)事件發(fā)生的概率。面積可用積分求得。F(x)為正態(tài)變量

4、X 的累積分布函數(shù),反映正態(tài)曲線(xiàn)下,自- 到x的面積,即左側(cè)累積面積。 .統(tǒng)計(jì)學(xué)家曾經(jīng)按 編成了附表,規(guī)范正態(tài)分布曲線(xiàn)下的面積。運(yùn)用時(shí)留意:1當(dāng)總體 , 知時(shí),先計(jì)算u值,再用u值查表,得出所求區(qū)間面積占總面積的比例。假設(shè)未知,常分別用樣本均數(shù)和樣本規(guī)范差來(lái)估計(jì)。2曲線(xiàn)下對(duì)稱(chēng)于0的區(qū)間,面積相等。如:區(qū)間- ,-2.58與區(qū)間2.58, 的面積相等。3曲線(xiàn)下橫軸上的總面積為100% 或?yàn)?。根據(jù)后兩個(gè)特征,可計(jì)算右側(cè)累積面積。.正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布面積(或概率) -1_ +1 -1_+168.27%1.96_+1.96-1.96_+1.9695.00% 2.58_+2.58-2.58_+2.5

5、899.00%正態(tài)分布和規(guī)范正態(tài)分布曲線(xiàn)下面積分布規(guī)律.-1,1,68.27%-1.96,1.96,95%-2.58,2.58,99%雙側(cè)概率.單側(cè)概率.正態(tài)曲線(xiàn)下面積的分布規(guī)律的運(yùn)用:一、確定醫(yī)學(xué)參考值范圍意義:是正常人目的測(cè)定值的動(dòng)搖范圍,可用于劃分正常,或異常。步驟:1、抽樣 2、控制丈量誤差 3、取單側(cè)或雙側(cè) 4、選定適宜的百分界限 5、資料正態(tài)性檢驗(yàn) 6、進(jìn)展參考值估計(jì)常用方法:正態(tài)分布法,對(duì)數(shù)正態(tài)分布法,百分位數(shù)法.95%正常值范圍的估計(jì)適用對(duì)象雙側(cè)界限單側(cè)上界單側(cè)下界正態(tài)分布法正態(tài)、近似正態(tài)對(duì)數(shù)正態(tài)法對(duì)數(shù)正態(tài)、近似正態(tài)百分位數(shù)法偏態(tài).正常值范圍的上下限單側(cè)下限單側(cè)上限.雙側(cè)界限.

6、例:用正態(tài)分布法求血糖值95%的參考值范圍。解:1、求樣本的均數(shù)4.653、規(guī)范差0.401。2、按照雙側(cè)95%范圍,確定參考值范圍為:3、將樣本的均數(shù)、規(guī)范差數(shù)值代入計(jì)算,得出范圍。 .對(duì)數(shù)正態(tài)分布(log normal distribution):很多醫(yī)學(xué)資料呈偏態(tài)分布,經(jīng)過(guò)對(duì)數(shù)變換用原始數(shù)據(jù)的對(duì)數(shù)值lgx替代x)后,服從正態(tài)分布,就說(shuō) x服從對(duì)數(shù)正態(tài)分布。如:環(huán)境中假設(shè)干有害物質(zhì)的濃度,食品中有些農(nóng)藥的殘留量,某些臨床檢驗(yàn)結(jié)果,某些疾病的埋伏期,醫(yī)院病人的住院天數(shù),都呈偏態(tài)分布。但對(duì)數(shù)轉(zhuǎn)換后,為正態(tài)分布。按照正態(tài)分布規(guī)律處置。.例題某市某年調(diào)查200例正常人血鉛含量ug/100g,雙硫腙

7、分光比色法,試估計(jì)血鉛值的95%上限。資料服從對(duì)數(shù)正態(tài)分布,求血鉛對(duì)數(shù)值的均數(shù),規(guī)范差。.二、確定概率分布:例:某市2000年110名7歲男童身高,知均數(shù) =119.95厘米,規(guī)范差S=4.72厘米,估計(jì):該地7歲男童身高在110厘米以下者占該地7歲男童總數(shù)的百分?jǐn)?shù)。按:求u值,查表:找到-2.1,上方找到0.01,二者相交處為0.0174,概率為0.0174=1.74%,即該地7歲男童身高在110厘米以下者,估計(jì)占1.74%,不到2%。.三、質(zhì)量控制:實(shí)驗(yàn)中,常以 作為上下警戒值,以 作為上下控制值。正態(tài)分布是很多統(tǒng)計(jì)方法的實(shí)際根底 .均數(shù)的抽樣誤差,t分布,參數(shù)估計(jì)Sampling err

8、or of mean,t-distribution,parameters estimation .一、均數(shù)的抽樣誤差和規(guī)范誤均數(shù)的抽樣誤差sampling error of mean 由于總體中存在個(gè)體變異,抽樣研討中所抽取的樣本,只包含總體中一部分個(gè)體,因此樣本均數(shù)或率往往不等于總體均數(shù)或率,樣本均數(shù)之間也互不相等,這種由抽樣引起的差別稱(chēng)為均數(shù)的抽樣誤差的表達(dá)。即:.如何估計(jì)抽樣誤差? 規(guī)范誤 standard error,SE以樣本均數(shù)為例:SE 越大,均數(shù)的抽樣誤差越大,樣本均數(shù)與總體均數(shù)間的差別越大。.當(dāng)樣本例數(shù)一定時(shí),樣本均數(shù)的規(guī)范誤與原始數(shù)據(jù)的規(guī)范差成正比;當(dāng)規(guī)范差一定時(shí),規(guī)范誤與

9、樣本含量 n 的平方根成反比。添加樣本含量可以減小抽樣誤差。與規(guī)范差的區(qū)別:規(guī)范差:表示普通個(gè)體值的離散程度;規(guī)范誤:特別闡明統(tǒng)計(jì)量的離散程度。.規(guī)范誤的運(yùn)用1、用來(lái)衡量抽樣誤差的大小: 規(guī)范誤越小,樣本均數(shù)與總體均數(shù)越接近,樣本均數(shù)的可信度越高;2、結(jié)合規(guī)范正態(tài)分布與 t 分布曲線(xiàn)下的面積規(guī)律,估計(jì)總體均數(shù)的置信區(qū)間。3、用于假設(shè)檢驗(yàn)。.假定2003年汕頭市15歲女學(xué)生的身高服從均數(shù)155.4cm、規(guī)范差5.3cm的正態(tài)分布。用計(jì)算機(jī)做抽樣模擬實(shí)驗(yàn),從N(155.4, 5.32)的總體中,每次抽出10個(gè)數(shù)字樣本含量為10,組成一個(gè)樣本,求出樣本均數(shù) 、樣本規(guī)范差 S。 再求得此100個(gè)樣本均

10、數(shù)的均數(shù)、樣本均數(shù)的規(guī)范差。抽樣分布.樣本均數(shù)的規(guī)范差是什么?.規(guī)范誤.100個(gè)樣本均數(shù)構(gòu)成一個(gè)新的分布,也是正態(tài)分布。即使原分布為偏態(tài)分布,當(dāng)樣本含量足夠大時(shí),新分布也近似正態(tài)分布。新分布的集中趨勢(shì)用均數(shù)的均數(shù)來(lái)表示,離散趨勢(shì)用規(guī)范誤表示N( , ) 。各樣本均數(shù)的均數(shù)等于總體均數(shù)。.正態(tài)總體中抽樣樣本量5正態(tài)總體中抽樣樣本量10正態(tài)總體中抽樣樣本量30抽樣時(shí)樣本量大小決議了樣本均數(shù)分布的外形,當(dāng)樣本量足夠大時(shí),均數(shù)分布趨向正態(tài)分布。.二、t 分布t-distribution).還記得嗎?.u轉(zhuǎn)換將正態(tài)分布轉(zhuǎn)換為規(guī)范正態(tài), N(0, 1)。同理:將樣本均數(shù)的分布也可以轉(zhuǎn)換為規(guī)范正態(tài)分布 。即

11、:.實(shí)踐任務(wù)中,總體規(guī)范差往往未知,常用S替代 計(jì)算規(guī)范誤,因此:為了和u分布區(qū)別,就變?yōu)椋?.均數(shù)的分布也是這樣假設(shè)我們采用另一個(gè)正態(tài)變量:于是,均數(shù)的分布變成了規(guī)范正態(tài)分布: .但是,條件發(fā)生了變化我們通常用替代 然而, 隨著樣本量的變化而變化,所以,我們稱(chēng)之為 t-分布,雖然它是正態(tài)分布,但只需當(dāng)樣本量自在度無(wú)窮大的時(shí)候,它才是規(guī)范正態(tài)分布,此時(shí),u=t.t分布曲線(xiàn)t分布是一簇對(duì)稱(chēng)于0的單峰分布曲線(xiàn)。自在度越小相當(dāng)于規(guī)范差大,曲線(xiàn)的中間越低,兩邊越高;隨自在度增大, t分布曲線(xiàn)逐漸逼近于規(guī)范正態(tài)分布曲線(xiàn)。當(dāng)自在度無(wú)窮大時(shí), t分布就是規(guī)范正態(tài)分布曲線(xiàn)。每一條t分布曲線(xiàn),都對(duì)應(yīng)于相應(yīng)的自在

12、度。t分布模擬實(shí)驗(yàn).t分布曲線(xiàn)下的面積規(guī)律與規(guī)范正態(tài)曲線(xiàn)下的面積規(guī)律類(lèi)似:在某一個(gè)自在度下,兩側(cè)外部總面積為5%的界限的t值稱(chēng)為t0.05/2(),把兩側(cè)外部總面積為1%的界限的t值稱(chēng)為t0.01/2()。因此,中部占95%面積的t值范圍:t0.05/2()- t0.05/2(),中部占99%面積的t值范圍:- t0.01/2()- t0.01/2()。.當(dāng)自在度確定時(shí),占一定面積的t界限值,可以查表得出。例如:查當(dāng)自在度=20,兩側(cè)概率之和為0.05時(shí),對(duì)應(yīng)的t值:t0.05/220=2.086,單側(cè)概率為0.05時(shí),對(duì)應(yīng)的t值:t0.0520=1.725,.普通, t 0.05/2v1.9

13、6 ,t 0.01/2v 2.58自在度越小,曲線(xiàn)越低平,t 比1.96,2.58大的多;自在度變大,t接近于1.96,2.58;自在度無(wú)窮大,t=1.96,2.58.運(yùn)用t值表留意:同一自在度下, P越小,t值越大;P值一樣時(shí),自在度越大,t越?。划?dāng)自在度無(wú)窮大時(shí),t值與u值相等。這也是u分布與t分布的區(qū)別。.t分布的主要運(yùn)用:總體均數(shù)置信區(qū)間估計(jì);t檢驗(yàn);.三、總體均數(shù)置信區(qū)間的估計(jì)統(tǒng)計(jì)推斷:參數(shù)估計(jì),假設(shè)檢驗(yàn)參數(shù)估計(jì):點(diǎn)估計(jì)point estimation):用樣本統(tǒng)計(jì)量作為對(duì)總體參數(shù)的估計(jì)值() 。比如均數(shù)的估計(jì)。區(qū)間估計(jì)(interval estimation):根據(jù)選定的置信度估計(jì)總體均數(shù)所在的區(qū)間a 50)足夠大也可參考u分布進(jìn)展95%置信區(qū)間:99%置信區(qū)間:.3、總體規(guī)范差未知,樣本例數(shù)較小按t分布原理,根據(jù)自在度,查出某個(gè)概率相應(yīng)的t界值,中部占95%面積的t值范圍:- t0.05/2()_ t0.05/2(),占99%面積的t值范圍:- t0.01/2()_ t0.01/2()進(jìn)展估計(jì)。.由于:95%的樣本滿(mǎn)足:95%置信區(qū)間:99%置信區(qū)間:.95%置信區(qū)間的意義:實(shí)際上,用一次抽樣所得的樣本均數(shù)估計(jì)總體均數(shù),犯錯(cuò)誤的概率為5%.或進(jìn)展100次

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論