![應用統(tǒng)計復習概況課件_第1頁](http://file4.renrendoc.com/view/42e029870ac4998d4d251cdb5d7b5915/42e029870ac4998d4d251cdb5d7b59151.gif)
![應用統(tǒng)計復習概況課件_第2頁](http://file4.renrendoc.com/view/42e029870ac4998d4d251cdb5d7b5915/42e029870ac4998d4d251cdb5d7b59152.gif)
![應用統(tǒng)計復習概況課件_第3頁](http://file4.renrendoc.com/view/42e029870ac4998d4d251cdb5d7b5915/42e029870ac4998d4d251cdb5d7b59153.gif)
![應用統(tǒng)計復習概況課件_第4頁](http://file4.renrendoc.com/view/42e029870ac4998d4d251cdb5d7b5915/42e029870ac4998d4d251cdb5d7b59154.gif)
![應用統(tǒng)計復習概況課件_第5頁](http://file4.renrendoc.com/view/42e029870ac4998d4d251cdb5d7b5915/42e029870ac4998d4d251cdb5d7b59155.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
復習2013年6月9日注:該PPT中紅色標注的內容為重點復習內容(必須掌握)10/27/20221注:該PPT中紅色標注的內容為重點復習內容(必須掌握)10/試題和分布填空題 20% 5題單選題 14% 7題計算題 48%4題根據輸出結果回答問題18%1題分組數據平均數、中位數和眾數
單總體均值區(qū)間估計假設檢驗2題(單總體和兩個總體各1題)一元回歸分析綜合題1題10/27/20222試題和分布填空題 20% 5題10/21第1章和第2章不考第3章重點:1.幾何平均數(p.49)2.分組數據的平均數、中位數、眾數計算(p.42-45)3.算術平均數、中位數和眾數間的關系(p.45)4.p.33偏態(tài)曲線10/27/20223第1章和第2章不考10/21/20223
(1)簡單算術平均數算術平均數的計算
n—總體單位總數;xi—第i個單位的標志值。
xi
—第i組的代表值(組中值或該組變量值);
fi—第i組的頻數。(2)加權算術平均數
10/27/20224(1)簡單算術平均數算術平均數的計算n幾何平均數當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數據,要求每時期的平均發(fā)展速度時,就需要使用幾何平均數。幾何平均數是n個數連乘積的n次方根。1.簡單幾何平均數
2.加權幾何平均數fi—各比率出現(xiàn)的頻數
10/27/20225幾何平均數當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數據例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。解一:解二:年平均增長率=1.0688-1=6.88%
10/27/20226例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增復習題某公司原料成本隨時間增長的情況如下,1992年的原料成本為200萬元,1995年的原料成本為244.2萬元,則3年中該公司原料成本的年平均增長率為()。(保留小數點后2位)。199219931994199510/27/20227復習題某公司原料成本隨時間增長的情況如下,1992年的原料成50%decrease100%increase算術平均數:幾何平均數:10/27/2022850%decrease100位置平均數是根據總體標志值所處的特殊位置確定的一類平均指標。包括中位數和眾數兩種。(一)中位數(Median)——將總體各單位標志值按由小到大的順序排列后處于中間位置的標志值稱為中位數,記為Me。中位數是一種位置平均數,不受極端數據的影響。當統(tǒng)計資料中含有異常的或極端的數據時,中位數比算術平均數更具有代表性。比如有5筆付款:9元,10元,10元,11元,60元付款的均值為20元,顯然這并不是一個很好的代表值,而中位數Me
=10元則更能代表平均每筆的付款數。二.位置平均數10/27/20229位置平均數是根據總體標志值所處的特殊位置確定的一類平均指標。分組數據中位數的確定對于分組數據的統(tǒng)計資料,中位數要用插值法來估算。
(1)計算各組的累計頻數;
(2)確定中位數所在的組——是累計頻數首次包含中位數位次Σf/2的組。其中:L—中位數所在組的下限;
Sm-1—中位數所在組前一組的累計頻數;
fm—中位數所在組的頻數;
d—中位數所在組的組距。
10/27/202210分組數據中位數的確定對于分組數據的統(tǒng)計資料,中位數要用插(二)眾數(Mode)——是總體中出現(xiàn)次數最多的標志值,記為M
0。眾數明確反映了數據分布的集中趨勢,也是一種位置平均數,不受極端數據的影響。但并非所有數據集合都有眾數,也可能存在多個眾數。在某些情況下,眾數是一個較好的代表值。例如在服裝行業(yè)中,生產商、批發(fā)商和零售商在進行生產和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數家庭的收入狀況時,也要用到眾數。
10/27/202211(二)眾數(Mode)——是總體中出現(xiàn)次數最多的標志值,記為未分組數據眾數的確定在數據量很大的時候,可以使用Excel統(tǒng)計函數中的MODE函數返回眾數。格式:MODE(<區(qū)域或數組1>,<區(qū)域或數組2>,…)功能:返回所有參數中數據的眾數。
01234567891011121314Mode=910/27/202212未分組數據眾數的確定在數據量很大的時候,可以使用Excel分組數據眾數的確定對于分組數據的統(tǒng)計資料,眾數也要用插值法來估算。(1)確定眾數所在的組對于等距分組,眾數組是頻數最高的組;(2)使用以下插值公式計算其中:L—眾數組的下限Δ1—眾數組與前一組的頻數之差Δ2—眾數組與后一組的頻數之差d—眾數組的組距Δ1Δ2眾數Ld10/27/202213分組數據眾數的確定對于分組數據的統(tǒng)計資料,眾數也要用插值法來三.算術平均數和位置平均數間的關系1.頻數分布呈完全對稱的單峰分布,算術平均數、中位數和眾數三者相同0xf(Me,M0)0xfMeM00xfMeM02.頻數分布為右偏態(tài)時,眾數小于中位數,算術平均數大于中位數3.頻數分布為左偏態(tài)時,眾數大于中位數,算術平均數小于中位數10/27/202214三.算術平均數和位置平均數間的關系1.頻數分布呈完全對稱的單復習例(必看)補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數、中位數和眾數,并判斷分布的形狀。10/27/202215復習例(必看)補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求
答案Σf/2=143/2=71.5,中位數所在“100~150”的組,眾數組為“100~150”的組,10/27/202216Σf/2=143/2=71.5,中位數所在“10第四章(2-5分)條件概率乘法公式全概率公式貝葉斯公式事件獨立性10/27/202217第四章(2-5分)10/21/202217某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的占80%,死亡年齡不低于80歲的占20%。問:該地區(qū)現(xiàn)年60歲的人能活到80歲的概率是多少?10/27/202218某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的占80%,死亡年齡不低于80歲的占20%。問:該地區(qū)現(xiàn)年60歲的人能活到80歲的概率是多少?解:設A={壽命60},B={壽命80},求P(B|A)。BA,∴P(AB)=P(B)ABP(AB)=P(B)P(B|A)=P(AB)/P(A)=P(B)/P(A)=0.2/0.8=0.2510/27/202219某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的復習重點1.貝葉斯公式10/27/202220復習重點10/21/202220貝葉斯(Bayes)公式若A1,A2,A3,…,An為樣本空間S的一個完備事件組,則對任一事件B,(P(B)>0),有i=1,2,…,n(*)貝葉斯公式在風險型決策中有非常重要的應用,詳見本章最后的案例。10/27/202221貝葉斯(Bayes)公式若A1,A2,A3,…,An為樣本貝葉斯公式的簡單應用某產品由甲、乙、丙三個班組生產,甲、乙、丙班的產量分別占全部產量的50%、30%和20%;次品率分別為2%、3%和1%?,F(xiàn)任取1件進行檢驗,求:(1)抽到的是甲班生產,且是次品的概率;(2)抽到次品的概率;(3)若抽到的是次品,求該次品是丙班生產的概率。10/27/202222貝葉斯公式的簡單應用某產品由甲、乙、丙三個班組生產,甲、乙、解:記A1,A2,A3,分別為抽到的產品是甲班、乙班、丙班生產的,B={抽到的是次品}。(1)由概率的乘法公式,P(A1B)=P(A1)P(B|A1)=0.50×0.02=0.01(2)由全概率公式
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=0.5╳0.02+0.3╳0.03+0.2╳0.01=0.021(3)由Bayes公式10/27/202223解:記A1,A2,A3,分別為抽到的產品是甲班、乙班、丙班生案例3解答統(tǒng)計資料表明,某地癌癥發(fā)病率為千分之五,現(xiàn)該地區(qū)正進行癌癥普查。普查試驗的結果為陰性或陽性。以往的臨床資料表明,癌癥患者試驗反應為陽性的概率是0.95,健康人試驗反應呈陽性的概率是0.04。問:(1)當某人試驗反應為陽性時他確患癌癥的概率;(2)試驗反應為陰性者患癌癥的概率。10/27/202224案例3解答統(tǒng)計資料表明,某地癌癥發(fā)病率為千分之五,現(xiàn)該地區(qū)記:A1={癌癥患者},A2={健康人},
B1={反應陽性},B2={反應陰性}由題意可知,P(A1)=0.005,P(A2)=0.995,P(B1|A1)=0.95,P(B2|A1)=0.05,P(B1|A2)=0.04,P(B2|A2)=0.96,由全概率公式:P(B1)=P(A1)P(B1|A1)+P(A2)P(B1|A2)=0.005×0.95+0.995×0.004=0.04455
P(B2)=1-P(B1)=1-0.04455=0.95545。
由Bayes公式可得即普查試驗反應為陽性者確患癌癥的概率是10.66%,而反應為陰性者患癌癥的概率為萬分之2.6。10/27/202225記:A1={癌癥患者},A2={健康人},
B1=第5章抽樣與抽樣分布復習重點:1.抽樣方法特點和關系(選擇題)2.抽樣分布3.會查標準正態(tài)分布表、t分布表,卡方,F分布表10/27/202226第5章抽樣與抽樣分布復習重點:10/21/202226抽樣方法抽樣方法關系到抽樣調查的成本費用和抽樣誤差的大小,應根據調查的目的、和調查對象的特點采取不同的抽樣方法。主要有以下幾種抽樣方法。
10/27/202227抽樣方法抽樣方法關系到抽樣調查的成本費用和抽樣誤差的大小,應(simplerandomsampling)——也稱純隨機抽樣,指不對總體作任何處理,直接按隨機原則抽取調查單位的抽樣方式。簡單隨機樣本(I.I.D)簡單隨機抽樣最能體現(xiàn)抽樣的隨機原則,抽樣誤差的計算就是以簡單隨機抽樣為基礎的。局限性:當總體單位數很大時,就難以實現(xiàn)簡單隨機抽樣,且抽樣誤差較大。1.簡單隨機抽樣10/27/202228(simplerandomsampling)1.簡單隨機(1).分層隨機抽樣(stratifiedsampling)——也稱類型抽樣,是將總體按某一主要標志進行分類(分組),分別從各類型組中隨機抽取一部分調查單位共同組成樣本。三種方法:(1)等數分配法(2)等比分配法(3)最優(yōu)分配法。2.其他抽樣方法例如,對企業(yè)進行調查時將企業(yè)劃分為特大型企業(yè)、大型企業(yè)、中型企業(yè)和小型企業(yè)四個類型組。對家庭收入進行調查時將居民家庭分為高收入、中等收入、低收入三個類型組等。10/27/202229(1).分層隨機抽樣(stratifiedsampling(2).機械抽樣(systematicsampling)也稱等距抽樣或系統(tǒng)抽樣,其步驟如下:
(1)按某一標志值的大小將總體單位進行排隊并順序編號;(2)根據確定的抽樣比例確定抽樣間距;(3)隨機確定第一個樣本單位;(4)按順序從總體中等間距地抽取其余樣本單位。
系統(tǒng)抽樣的隨機性主要體現(xiàn)在第一個樣本單位的抽取上,因此一定要保證抽取第一個樣本單位的隨機性。2.其他抽樣方法(續(xù))10/27/202230(2).機械抽樣(systematicsampling)(3).整群抽樣(Clustersampling)人們就將總體的各單位按一定的標志或要求,分成若干群,然后以群為單位,隨機抽取幾個群,對被抽中的群進行全部調查,這就是整群抽樣。如對人口普查資料進行復查,就采用整群抽樣的方式。當群中的元素差異性大時,整群抽樣得到的結果比較好。在理想狀態(tài)下,每一群是整個總體小范圍內的代表。分層抽樣:層間差異盡可能大,層內差異盡可能小整群抽樣:群間差異盡可能小,群內差異盡可能大2.其他抽樣方法(續(xù))10/27/202231(3).整群抽樣(Clustersampling)人們就(2)代表性誤差——指由于隨機樣本內部結構與總體結構之間存在差異而引起的樣本指標與總體指標之間的差異。代表性誤差又可分為兩類:①系統(tǒng)性誤差——指由于違反抽樣的隨機原則而產生的誤差。②隨機誤差——也稱抽樣誤差,指由于隨機抽樣本身導致的現(xiàn)樣本內部結構與總體結構不一致而產生的誤差。在抽樣調查中隨機誤差是不可避免的。如全部產品中有2%的次品,隨機抽取100件,其中恰好有2件次品的可能性是很少的。
統(tǒng)計誤差和抽樣誤差(續(xù))10/27/202232(2)代表性誤差——指由于隨機樣本內部結構與總體結構之間存在影響抽樣誤差的主要因素(1)總體標準差越大,樣本結構就越難以接近總體結構,誤差也就越大。(2)樣本容量
越大,樣本結構就越接近總體結構,樣本對總體的代表性就越高,抽樣誤差就越小。(3)抽樣方法不同抽樣的方法,將直接影響樣本內部結構與總體結構之間的差異。如分層抽樣就可以使樣本結構更接近于總體結構,因而其抽樣誤差是所有抽樣方法中最小的。(4)抽樣方式不重復抽樣可以使樣本內部結構更接近總體結構。因此不重復抽樣的抽樣誤差小于重復抽樣。
10/27/202233影響抽樣誤差的主要因素(1)總體標準差抽樣分布(1)均值的抽樣分布(2)比例的抽樣分布10/27/202234抽樣分布(1)均值的抽樣分布10/21/202234第六章置信區(qū)間估計1.允許誤差d2.區(qū)間估計(單總體方差未知時的均值估計)3.樣本容量的確定(均值和比例)10/27/202235第六章置信區(qū)間估計1.允許誤差d10/21/202235μPσ2σ
2已知σ
2未知雙側雙側雙側雙側單側上限單側上限單側下限單側下限第六章置信區(qū)間估計10/27/202236μPσ2σ2已知σ2未知雙側雙側雙側雙側單側上限單側上限設某種元件的壽命X~N(,2),其中,
2未知,現(xiàn)隨機測得10個元件的壽命如下(小時)1502,1453,1367,1108,16501213,1208,1480,1550,1700試求元件平均壽命
的95%置信區(qū)間。復習題10/27/202237設某種元件的壽命X~N(,2),其中,2未故所求
的95%置信區(qū)間為解:已知/2=0.025,=1423.1,S=196.5,=1-0.95=0.05,n=10,查表得t0.025(9)=2.2622可用Excel的【工具】→“數據分析”→“描述統(tǒng)計”需要注意:只給出d值求解正態(tài)總體均值
的置信區(qū)間。10/27/202238故所求的95%置信區(qū)間為解:已知復習題某車床加工的缸套外徑尺寸X~N(
μ,σ
2),下面是隨機測得的10個加工后的缸套外徑尺寸(mm),
90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99求(,)
求μ的置信度為95%的置信區(qū)間;10/27/202239復習題某車床加工的缸套外徑尺寸X~N(μ,σ2總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差d的條件下,由可得其中總體標準差或樣本標準差也是未知的,通??梢韵韧ㄟ^小規(guī)模抽樣作出估計。由于使用的是近似公式,可知實際采用的最低樣本容量應比計算結果稍大。
10/27/202240總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差d總體比例區(qū)間估計時樣本容量的確定國外民意調查機構在進行民意調查時,通常要求在95%的置信度下將調查的允許誤差(即置信區(qū)間的d值)控制在3%以內。⑴問為滿足該調查精度要求,需要多大的樣本?⑵如果要求置信度達到99%,調查誤差仍為3%,此時至少需要多大的樣本?
10/27/202241總體比例區(qū)間估計時樣本容量的確定國外民意調查機構在進行民意調案例思考題解答(1)本案例中,當沒有關于總體均值P先驗值和估計時,要用P=0.5確定樣本容量,這樣產生最大可能的樣本容量及成本最高的抽樣故需要的樣本容量為
10/27/202242案例思考題解答(1)本案例中,當沒有關于總體均值P先驗值和估案例思考題解答(2)如果要求置信度達到99%,則Z/2=Z0.005=2.575,
10/27/202243案例思考題解答(2)如果要求置信度達到99%,則Z/2=Z第6章作業(yè)題(尤其2,6必須掌握)10/27/20224410/21/202244第7章單個總體的假設檢驗復習重點:1.兩類錯誤及其關系(重點:選擇題)2.單總體假設檢驗必須掌握內容:sigma未知情況下,總體均值假設檢驗
10/27/202245第7章單個總體的假設檢驗復習重點:10/21/20224設t為檢驗原假設H0所用的統(tǒng)計量,t(n-1)為檢驗的臨界值,由顯著性水平
的定義(右邊檢驗)
P{t>t(n-1)|H0為真}=可知檢驗中可能出現(xiàn)以下兩類判斷錯誤:四.檢驗中可能犯的兩類錯誤第一類錯誤——當H0為真時拒絕H0的錯誤,即“棄真”錯誤,犯此類錯誤的概率為。第二類錯誤——當H0不真時接受H0的錯誤,即“取偽”錯誤,記犯該類錯誤的概率為,即P{t≤t(n-1)|H0不真}=由于H0不真時與H0為真時,統(tǒng)計量t的分布是不同的,故β≠1-。
10/27/202246設t為檢驗原假設H0所用的統(tǒng)計量,t(n-1)為檢由圖可知,減少會增大,反之也然。在樣本容量n不變時,不可能同時減小犯兩類錯誤的概率。應著重控制犯哪類錯誤的概率,這應由問題的實際背景決定。當第一類錯誤造成的損失大時,就應控制犯第一類錯誤的概率(通常取0.05,0.01等);反之,當第二類錯誤造成的損失大時,就應控制犯第二類錯誤的概率。要同時減小須犯兩類錯誤的概率,必須增大樣本容量n。
x0H0:μ=μ0t(n-1)H1:μ=μ1β四.檢驗中可能犯的兩類錯誤(續(xù))10/27/202247由圖可知,減少會增大,反之也然。x0H0:μ=μ0單個總體均值的檢驗當樣本容量足夠大時,t值可以用Z值近似確定10/27/202248單個總體均值的檢驗當樣本容量足夠大時,t值可以用Z值近似確定案例1.檢驗新工藝的效果某廠生產的一種鋼絲抗拉強度服從均值為10560(kg/cm2)的正態(tài)分布,現(xiàn)采用新工藝生產了一種新鋼絲,隨機抽取10根測得抗拉強度為:10512,10623,10668,10554,1077610707,10557,10581,10666,10670問在顯著性水平=0.05下,新鋼絲的平均抗拉強度比原鋼絲是否有顯著提高?
10/27/202249案例1.檢驗新工藝的效果某廠生產的一種鋼絲抗拉強度服從均值案例1解答:說明新工藝對提高鋼絲繩的抗拉強度是有顯著效果的。
本案例為右邊檢驗問題,設新鋼絲的平均抗拉強度為,
2未知,故使用t檢驗。由題意,H0:=0,H1:>0由所給樣本數據,可求得:S=81,n=10,=0.05,t0.05(9)=1.8331∵t=2.7875故拒絕H0,即在水平=0.05下,
顯著高于0。>t(n-1)=
t0.05(9)=1.833110/27/202250案例1解答:說明新工藝對提高鋼絲繩的抗拉強度是有在案例1中,若取
=0.01,問結論如何?【解】∵t0.01(9)=2.8214,t=2.7875<t0.01(9)=2.8214故不能拒絕H0。即在水平=0.01下,新鋼絲平均抗拉強度并無顯著提高。通常,在
=0.05下拒絕H0,則稱檢驗結果為一般顯著的;若在=0.01下拒絕H0,則稱檢驗結果為高度顯著的;若在=0.001下拒絕H0,則稱檢驗結果為極高度顯著的。10/27/202251在案例1中,若取=0.01,問結論如何?【解】∵練習一臺自動包裝奶粉的包裝機,其額定標準為每袋凈重0.5kg。某天開工時,隨機抽取了10袋產品,稱得其凈重為:0.497,0.506,0.509,0.508,0.4970.510,0.506,0.495,0.502,0.507(1)在水平
=0.20下,檢驗該天包裝機的重量設定是否正確?(,S=0.00554)(2)在本題的檢驗問題中,為什么要將
取得較大?10/27/202252練習一臺自動包裝奶粉的包裝機,其額定標準為每袋凈重第8章兩個總體的假設檢驗P137-138重點兩個獨立正態(tài)總體均值的檢驗分三種情況1.方差1和方差2都已知(Z檢驗)2.兩總體方差相等但未知(t檢驗)3.兩樣本容量足夠大,方差1和方差2不等且未知10/27/202253第8章兩個總體的假設檢驗P137-138重點10/2110/27/20225410/21/202254一般認為男女考生具有同樣的TOEFL能力。如關于TOEFL考試,某一年,抽得A群體300人,B群體400人,其成績總體分布如下表,這些數據是否支持結論:給定一個A群體總體和一個B群體總體,B群體的TOEFL會明顯高于A群體嗎?(在顯著性水平為0.05下進行檢驗)10/27/202255一般認為男女考生具有同樣的TOEFL能力。如關于TOEFL考練習某校分別從經常參加體育鍛煉和不經常參加體育鍛煉的學生中各隨機選出50人,測得平均身高分別為174.34和172.42厘米。統(tǒng)計資料表明,兩類學生的身高均服從正態(tài)分布,其標準差分別為6.00和7.11厘米。試問:該校經常參加體育鍛煉的學生是否比不經常參加體育鍛煉學生的平均身高要高一些?(取顯著性水平為0.05)10/27/202256練習某校分別從經常參加體育鍛煉和不經常參加體育鍛煉的學生中各(1)要驗證某工藝改進前后產品的某質量指標是否是同方差的,應選______;若檢驗結果不能拒絕原假設,則檢驗該工藝的改進對提高該質量指標是否有效,應選______;(2)要分析同一組10個病人,每人分別服用甲、乙兩種安眠藥作對比,分析這兩種安眠藥的療效間是否有顯著差異,應選______;(3)要對某品牌轎車的平均無故障行駛里程數進行區(qū)間估計,應選_____;要比較4種不同廣告方式對產品銷售量的影響,應選_____某產品可使用4種配料和3種加工工藝,要確定配料與工藝間的最佳組合,應選______;要分析某商品的價格彈性系數,應選_____A.方差分析:單因素方差分析,B.方差分析:可重復雙因素分析C.方差分析:無重復雙因素分析,D.描述統(tǒng)計,E.F-檢驗:雙樣本方差F.回歸,G.t-檢驗:平均值的成對二樣本分析,H.t-檢驗:雙樣本等方差假設It-檢驗:雙樣本異方差假設,J.Z-檢驗:雙樣本平均差檢驗
10/27/202257(1)要驗證某工藝改進前后產品的某質量指標是否是同方差的,應作用:分析多種因素,或同一因素下不同水平,以及各種不同因素之間的交互作用,對測試結果影響的顯著程度重點:考慮交互效應的雙因素方差分析表第9章方差分析10/27/202258作用:分析多種因素,或同一因素下不同水平,以及各種不同因素之若
F>F0.001(a-1,N-a),稱因素A的作用極高度顯著;若
F>F0.01(a-1,N-a),稱因素A的作用高度顯著;若F0.01(a-1,N-a)>F>F0.05(a-1,N-a),稱因素A的作用一般顯著;若F<F0.05(a-1,N-a),則認為因素A的作用不顯著。
單因素方差分析10/27/202259若F>F0.001(a-1,N-a),稱因素A的某大型連鎖超市為研究各種促銷方式的效果,選擇下屬4個門店,分別采用不同促銷方式,對包裝食品各進行了4個月的試驗。試驗結果如下:超市管理部門希望了解:⑴不同促銷方式對銷售量是否有顯著影響?⑵哪種促銷方式的效果最好?
【案例1】哪種促銷方式效果最好?10/27/202260某大型連鎖超市為研究各種促銷方式的效果,選擇下屬4個門店,分可用Excel的【工具】→“數據分析”→“方差分析:單因素方差分析”求解單因素方差分析問題。
案例1的方差分析表
其中:P-value——P值,為檢驗中達到的顯著性水平,其含義與t檢驗中“P(T<=t)單尾”相同。Fcrit——在水平(默認0.05)下拒絕域的臨界值F?!逷-value=0.00014<0.001故不同的促銷方式對商品銷售額有極高度顯著影響。
案例1分析10/27/202261可用Excel的【工具】→“數據分析”→“方差分析:單因進一步的分析對各i的t檢驗結果如下(=0.05):
12
4
(廣告宣傳)1(有獎銷售)2(買一送一)4
*
*
(特價銷售)3
*
*
*
由Excel或SPSS軟件的運行輸出結果還可得:10/27/202262進一步的分析對各i的t檢驗結果如下(=0.0無交互作用的雙因素方差分析在無交互作用的雙因素方差分析中,要檢驗的原假設有以下兩個:
H01:1=2=···=a=0
H02:β1=β2=···=βb
=0若拒絕H01,說明因素A的作用顯著;若拒絕H02,說明因素B的作用顯著。
10/27/202263無交互作用的雙因素方差分析在無交互作用的雙因素方差分析中,要
無交互作用的雙因素方差分析表10/27/202264無交互作用的雙因素方差分析表10/21/考慮交互作用時的雙因素試驗
重點,一定要掌握H01:1=2=···=a
=0H02:1=2=···=b
=0H03:()ij=0;對一切i,j10/27/202265考慮交互作用時的雙因素試驗
重點,一定要掌握H01:1=10/27/20226610/21/202266給出一個雙因子試驗如下方差分析表,填入缺失(以“?”表示)的結果,并說明因子A和B所具有的水平數,和每個水平組合下進行重復試驗的次數。并在的顯著性水平下,判斷因素A、B和交互效應的效應是否顯著。(已知F0.05(2,30)=3.32,F(xiàn)0.05(8,30)=2.27,F(xiàn)0.05(4,30)=2.69)10/27/202267給出一個雙因子試驗如下方差分析表,填入缺失(以“?”表示)的10/27/20226810/21/202268在某種金屬材料的生產過程中,對熱處理溫度(B)與時間(A)各取兩個水平,對產品強度具有交互作用的方差分析部分結果如下(且設各水平搭配下強度的總體服從正態(tài)分布且方差相同)問處理溫度、時間以及這兩者的交互作用對產品強度是否有顯著的影響(alpha=0.05)10/27/202269在某種金屬材料的生產過程中,對熱處理溫度(B)與時間(A)各線性回歸作用:分析兩個變量之間或多個變量之間的因果關系或相關關系基本假設:隨機誤差項與自變量項獨立對因變量進行解釋(因此可以對總的偏差平方和進行分解),隨機誤差獨立、正態(tài)同方差分布基本思想:最小二乘法及其原理10/27/202270線性回歸作用:分析兩個變量之間或多個變量之間的因果關系或相關分別是參數
0和1的最小方差無偏估計??梢宰C明,以上兩式說明,的方差分別為:2.在滿足經典假設的條件下1.回歸系數的估計精度不僅與σ2及樣本容量N有關,而且與各xi
取值的分散程度有關。在給定樣本容量下,xi
的取值越分散,則估計的方差就越小,反之估計的精確就差。10/27/202271分別是參數0和1的最小方差無偏估計??梢砸匀谥覟閱挝?,某種食品在某年各月的家庭平均月消費量Y(kg)與其價格X(元/kg)間的調查數據如下,試分析該食品家庭平均月消費量與價格間的關系。10/27/202272以三口之家為單位,某種食品在某年各月的家庭平均月消費量Y“SignificanceF”為達到的顯著性水平,含義與P-value相同?!逽ignificanceF=0.00032<0.001故回歸方程是極高度顯著的。
方差分析表故所求回歸方程為:說明該食品價格每上漲一元,0.34kg,kg為該食品的最大月平均消費量。10/27/202273“SignificanceF”為達到的顯著性水平,含義與Excel結果說明補充RSquare為判定系數修正判定系數標準誤差10/27/202274Excel結果說明補充RSquare為判定系數10/21
需要繼續(xù)研究的問題1.以90%的可信度預測當價格為5.6元/kg時,該食品的家庭平均月消費量。
2.該食品的生產商和供應商希望該食品的家庭月平均消費量能以90%的把握達到2.5kg以上,應將價格控制在什么水平之下?
10/27/202275需要繼續(xù)研究的問題1.以90%的可信度預測當可以證明,預測和控制1.預測——就是對解釋變量X的某一給定值x0,求被解釋變量Y的取值y0的類似于區(qū)間估計問題。對任一給定的x0,由回歸方程可得y0的回歸值(點估計):
y0的置信度為1-
的預測區(qū)間為置信度為1-
的預測區(qū)間,10/27/202276可以證明,預測和控制1.預測——就是對解釋變量X的某一關于預測的精度x0oy允許誤差d的公式說明,預測區(qū)間的大小(預測精度)不僅與、樣本容量N及各xi
取值的分散程度有關,而且和x0有關。當x0靠近時,d就較小,反之,x0離越遠,d就越大。∴d是x0的函數d=d(x0)。
10/27/202277關于預測的精度x0oy允許誤差d的公式說明,預測區(qū)間的大預測區(qū)間的近似計算當樣本容量N足夠大時,或中方括號內的部分就近似于1。因此d可以使用以下近似公式計算:其中就是回歸方程的標準誤差。
10/27/202278預測區(qū)間的近似計算當樣本容量N足夠大時,或中方括由所得回歸方程由Excel或SPSS的輸出結果,可解得當x0=5.6時,案例1的預測問題分析可得標準誤差為d≈t0.05(10)×0.4007=1.8125×0.4007=0.73故當價格為5.6/kg時,該食品的家庭月平均消費量的90%置信預測區(qū)間為:
10/27/202279由所得回歸方程由Excel或SPSS的輸出結果,可2.控制控制問題在質量管理及其他經濟管理領域中有著非常廣泛的應用,它是預測的反問題。即當要求以1-
的概率將Y的值控制在某一范圍(y1,y2)內時,應將解釋變量X的值控制在哪一范圍內的問題。也即要確定X的兩個值x1,x2,當x1<X<x2時,在1-
的置信度下可使y1<Y<y2即滿足
P{
y1<Y<y2|x1<X<x2}=1-
10/27/2022802.控制控制問題在質量管理及其他經濟管理領域中有著非常廣泛的xy0控制問題示意圖由圖可知,X的取值范圍應是以下不等式組的解。x0yx1x2y2y1x2x1y1y210/27/202281xy0控制問題示意圖由圖可知,X的取值范圍應是以下不等式組即可以通過解以下方程組來解出x1,x2
或:若解出的x1>x2,則說明無法實現(xiàn)所要求的控制目標,也即Y的控制范圍不能過小(與,N及xi的分散程度等都有關)。10/27/202282即可以通過解以下方程組來解出x1,x2或:若解出的x1當樣本容量N足夠大時,x0yx1x2y2y1x0yx1x2y2y1控制范圍的近似求解10/27/202283當樣本容量N足夠大時,x0yx1x2y2y1x0要求以90%的概率使該食品的家庭月平均消費量達到2.5kg以上,應將價格控制在什么水平之下?xyx22.5本例中,可得
d≈t0.1(10)×0.4007=0.55由4.52-0.34x-0.55>2.5可解得:x<4.32故應將該食品價格控制在4.32元/kg之下。注意,對于單側控制控制要求分析顯然,這是一個單側控制問題。即要確定x2的值,使10/27/202284要求以90%的概率使該食品的家庭月平均消費量達到2.重點,一定要掌握:一元線性回歸模型、EXCEL解讀、預測和控制(允許誤差d的應用)10/27/202285重點,一定要掌握:10/21/202285Excel結果說明補充RSquare為判定系數修正判定系數標準誤差10/27/202286Excel結果說明補充RSquare為判定系數10/21以三口之家為單位,某種食品在某年各月的家庭平均月消費量Y(kg)與其價格X(元/kg)間的調查10組數據。為了考察家庭平均月消費量Y(kg)與其價格X(元/kg)間的關系,估計了一個平均月消費量Y(kg)與其價格X(元/kg)的一元線性回歸模型,經計算,月消費量Y的離差平方和SS=8,模型的擬合優(yōu)度RSquare=0.8,截距的估計值為6.7,標準差為0.434275;價格X回歸系數的估計值為-0.5,標準差為0.063583。編制一個方差分析表,并依據方差分析的結果在10%的顯著性水平下檢驗回歸方程的顯著性;估計回歸方程(隨機擾動項)的標準差;在10%的顯著性水平下,利用t檢驗檢驗價格X回歸系數的統(tǒng)計顯著性(備擇假設為其系數不為零)
10/27/202287以三口之家為單位,某種食品在某年各月的家庭平均月消費量Y10/27/20228810/21/202288(1)寫出線性回歸方程,并說明變量X與Y之間的線性相關是否顯著,并說明理由;(2)填寫上表方差分析部分帶“?”標示單元格的值(非整數值保留小數點后3位)(3)求當該食品價格為5.4元/千克時,家庭月平均消費量的置信度為90%的預測區(qū)間(精確到小數點后3位)(4)如果銷售商希望該食品的家庭月平均消費量能以95%的概率達到3千克以上,問應將價格控制在什么水平之下?10/27/202289(1)寫出線性回歸方程,并說明變量X與Y之間的線性相關是否顯Thanks&GoodLuck10/27/202290Thanks&GoodLuck10/21/20229復習2013年6月9日注:該PPT中紅色標注的內容為重點復習內容(必須掌握)10/27/202291注:該PPT中紅色標注的內容為重點復習內容(必須掌握)10/試題和分布填空題 20% 5題單選題 14% 7題計算題 48%4題根據輸出結果回答問題18%1題分組數據平均數、中位數和眾數
單總體均值區(qū)間估計假設檢驗2題(單總體和兩個總體各1題)一元回歸分析綜合題1題10/27/202292試題和分布填空題 20% 5題10/21第1章和第2章不考第3章重點:1.幾何平均數(p.49)2.分組數據的平均數、中位數、眾數計算(p.42-45)3.算術平均數、中位數和眾數間的關系(p.45)4.p.33偏態(tài)曲線10/27/202293第1章和第2章不考10/21/20223
(1)簡單算術平均數算術平均數的計算
n—總體單位總數;xi—第i個單位的標志值。
xi
—第i組的代表值(組中值或該組變量值);
fi—第i組的頻數。(2)加權算術平均數
10/27/202294(1)簡單算術平均數算術平均數的計算n幾何平均數當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數據,要求每時期的平均發(fā)展速度時,就需要使用幾何平均數。幾何平均數是n個數連乘積的n次方根。1.簡單幾何平均數
2.加權幾何平均數fi—各比率出現(xiàn)的頻數
10/27/202295幾何平均數當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數據例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。解一:解二:年平均增長率=1.0688-1=6.88%
10/27/202296例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增復習題某公司原料成本隨時間增長的情況如下,1992年的原料成本為200萬元,1995年的原料成本為244.2萬元,則3年中該公司原料成本的年平均增長率為()。(保留小數點后2位)。199219931994199510/27/202297復習題某公司原料成本隨時間增長的情況如下,1992年的原料成50%decrease100%increase算術平均數:幾何平均數:10/27/20229850%decrease100位置平均數是根據總體標志值所處的特殊位置確定的一類平均指標。包括中位數和眾數兩種。(一)中位數(Median)——將總體各單位標志值按由小到大的順序排列后處于中間位置的標志值稱為中位數,記為Me。中位數是一種位置平均數,不受極端數據的影響。當統(tǒng)計資料中含有異常的或極端的數據時,中位數比算術平均數更具有代表性。比如有5筆付款:9元,10元,10元,11元,60元付款的均值為20元,顯然這并不是一個很好的代表值,而中位數Me
=10元則更能代表平均每筆的付款數。二.位置平均數10/27/202299位置平均數是根據總體標志值所處的特殊位置確定的一類平均指標。分組數據中位數的確定對于分組數據的統(tǒng)計資料,中位數要用插值法來估算。
(1)計算各組的累計頻數;
(2)確定中位數所在的組——是累計頻數首次包含中位數位次Σf/2的組。其中:L—中位數所在組的下限;
Sm-1—中位數所在組前一組的累計頻數;
fm—中位數所在組的頻數;
d—中位數所在組的組距。
10/27/2022100分組數據中位數的確定對于分組數據的統(tǒng)計資料,中位數要用插(二)眾數(Mode)——是總體中出現(xiàn)次數最多的標志值,記為M
0。眾數明確反映了數據分布的集中趨勢,也是一種位置平均數,不受極端數據的影響。但并非所有數據集合都有眾數,也可能存在多個眾數。在某些情況下,眾數是一個較好的代表值。例如在服裝行業(yè)中,生產商、批發(fā)商和零售商在進行生產和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數家庭的收入狀況時,也要用到眾數。
10/27/2022101(二)眾數(Mode)——是總體中出現(xiàn)次數最多的標志值,記為未分組數據眾數的確定在數據量很大的時候,可以使用Excel統(tǒng)計函數中的MODE函數返回眾數。格式:MODE(<區(qū)域或數組1>,<區(qū)域或數組2>,…)功能:返回所有參數中數據的眾數。
01234567891011121314Mode=910/27/2022102未分組數據眾數的確定在數據量很大的時候,可以使用Excel分組數據眾數的確定對于分組數據的統(tǒng)計資料,眾數也要用插值法來估算。(1)確定眾數所在的組對于等距分組,眾數組是頻數最高的組;(2)使用以下插值公式計算其中:L—眾數組的下限Δ1—眾數組與前一組的頻數之差Δ2—眾數組與后一組的頻數之差d—眾數組的組距Δ1Δ2眾數Ld10/27/2022103分組數據眾數的確定對于分組數據的統(tǒng)計資料,眾數也要用插值法來三.算術平均數和位置平均數間的關系1.頻數分布呈完全對稱的單峰分布,算術平均數、中位數和眾數三者相同0xf(Me,M0)0xfMeM00xfMeM02.頻數分布為右偏態(tài)時,眾數小于中位數,算術平均數大于中位數3.頻數分布為左偏態(tài)時,眾數大于中位數,算術平均數小于中位數10/27/2022104三.算術平均數和位置平均數間的關系1.頻數分布呈完全對稱的單復習例(必看)補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數、中位數和眾數,并判斷分布的形狀。10/27/2022105復習例(必看)補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求
答案Σf/2=143/2=71.5,中位數所在“100~150”的組,眾數組為“100~150”的組,10/27/2022106Σf/2=143/2=71.5,中位數所在“10第四章(2-5分)條件概率乘法公式全概率公式貝葉斯公式事件獨立性10/27/2022107第四章(2-5分)10/21/202217某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的占80%,死亡年齡不低于80歲的占20%。問:該地區(qū)現(xiàn)年60歲的人能活到80歲的概率是多少?10/27/2022108某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的占80%,死亡年齡不低于80歲的占20%。問:該地區(qū)現(xiàn)年60歲的人能活到80歲的概率是多少?解:設A={壽命60},B={壽命80},求P(B|A)。BA,∴P(AB)=P(B)ABP(AB)=P(B)P(B|A)=P(AB)/P(A)=P(B)/P(A)=0.2/0.8=0.2510/27/2022109某地區(qū)死亡人口統(tǒng)計資料表明,該地區(qū)人口死亡年齡不低于60歲的復習重點1.貝葉斯公式10/27/2022110復習重點10/21/202220貝葉斯(Bayes)公式若A1,A2,A3,…,An為樣本空間S的一個完備事件組,則對任一事件B,(P(B)>0),有i=1,2,…,n(*)貝葉斯公式在風險型決策中有非常重要的應用,詳見本章最后的案例。10/27/2022111貝葉斯(Bayes)公式若A1,A2,A3,…,An為樣本貝葉斯公式的簡單應用某產品由甲、乙、丙三個班組生產,甲、乙、丙班的產量分別占全部產量的50%、30%和20%;次品率分別為2%、3%和1%?,F(xiàn)任取1件進行檢驗,求:(1)抽到的是甲班生產,且是次品的概率;(2)抽到次品的概率;(3)若抽到的是次品,求該次品是丙班生產的概率。10/27/2022112貝葉斯公式的簡單應用某產品由甲、乙、丙三個班組生產,甲、乙、解:記A1,A2,A3,分別為抽到的產品是甲班、乙班、丙班生產的,B={抽到的是次品}。(1)由概率的乘法公式,P(A1B)=P(A1)P(B|A1)=0.50×0.02=0.01(2)由全概率公式
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=0.5╳0.02+0.3╳0.03+0.2╳0.01=0.021(3)由Bayes公式10/27/2022113解:記A1,A2,A3,分別為抽到的產品是甲班、乙班、丙班生案例3解答統(tǒng)計資料表明,某地癌癥發(fā)病率為千分之五,現(xiàn)該地區(qū)正進行癌癥普查。普查試驗的結果為陰性或陽性。以往的臨床資料表明,癌癥患者試驗反應為陽性的概率是0.95,健康人試驗反應呈陽性的概率是0.04。問:(1)當某人試驗反應為陽性時他確患癌癥的概率;(2)試驗反應為陰性者患癌癥的概率。10/27/2022114案例3解答統(tǒng)計資料表明,某地癌癥發(fā)病率為千分之五,現(xiàn)該地區(qū)記:A1={癌癥患者},A2={健康人},
B1={反應陽性},B2={反應陰性}由題意可知,P(A1)=0.005,P(A2)=0.995,P(B1|A1)=0.95,P(B2|A1)=0.05,P(B1|A2)=0.04,P(B2|A2)=0.96,由全概率公式:P(B1)=P(A1)P(B1|A1)+P(A2)P(B1|A2)=0.005×0.95+0.995×0.004=0.04455
P(B2)=1-P(B1)=1-0.04455=0.95545。
由Bayes公式可得即普查試驗反應為陽性者確患癌癥的概率是10.66%,而反應為陰性者患癌癥的概率為萬分之2.6。10/27/2022115記:A1={癌癥患者},A2={健康人},
B1=第5章抽樣與抽樣分布復習重點:1.抽樣方法特點和關系(選擇題)2.抽樣分布3.會查標準正態(tài)分布表、t分布表,卡方,F分布表10/27/2022116第5章抽樣與抽樣分布復習重點:10/21/202226抽樣方法抽樣方法關系到抽樣調查的成本費用和抽樣誤差的大小,應根據調查的目的、和調查對象的特點采取不同的抽樣方法。主要有以下幾種抽樣方法。
10/27/2022117抽樣方法抽樣方法關系到抽樣調查的成本費用和抽樣誤差的大小,應(simplerandomsampling)——也稱純隨機抽樣,指不對總體作任何處理,直接按隨機原則抽取調查單位的抽樣方式。簡單隨機樣本(I.I.D)簡單隨機抽樣最能體現(xiàn)抽樣的隨機原則,抽樣誤差的計算就是以簡單隨機抽樣為基礎的。局限性:當總體單位數很大時,就難以實現(xiàn)簡單隨機抽樣,且抽樣誤差較大。1.簡單隨機抽樣10/27/2022118(simplerandomsampling)1.簡單隨機(1).分層隨機抽樣(stratifiedsampling)——也稱類型抽樣,是將總體按某一主要標志進行分類(分組),分別從各類型組中隨機抽取一部分調查單位共同組成樣本。三種方法:(1)等數分配法(2)等比分配法(3)最優(yōu)分配法。2.其他抽樣方法例如,對企業(yè)進行調查時將企業(yè)劃分為特大型企業(yè)、大型企業(yè)、中型企業(yè)和小型企業(yè)四個類型組。對家庭收入進行調查時將居民家庭分為高收入、中等收入、低收入三個類型組等。10/27/2022119(1).分層隨機抽樣(stratifiedsampling(2).機械抽樣(systematicsampling)也稱等距抽樣或系統(tǒng)抽樣,其步驟如下:
(1)按某一標志值的大小將總體單位進行排隊并順序編號;(2)根據確定的抽樣比例確定抽樣間距;(3)隨機確定第一個樣本單位;(4)按順序從總體中等間距地抽取其余樣本單位。
系統(tǒng)抽樣的隨機性主要體現(xiàn)在第一個樣本單位的抽取上,因此一定要保證抽取第一個樣本單位的隨機性。2.其他抽樣方法(續(xù))10/27/2022120(2).機械抽樣(systematicsampling)(3).整群抽樣(Clustersampling)人們就將總體的各單位按一定的標志或要求,分成若干群,然后以群為單位,隨機抽取幾個群,對被抽中的群進行全部調查,這就是整群抽樣。如對人口普查資料進行復查,就采用整群抽樣的方式。當群中的元素差異性大時,整群抽樣得到的結果比較好。在理想狀態(tài)下,每一群是整個總體小范圍內的代表。分層抽樣:層間差異盡可能大,層內差異盡可能小整群抽樣:群間差異盡可能小,群內差異盡可能大2.其他抽樣方法(續(xù))10/27/2022121(3).整群抽樣(Clustersampling)人們就(2)代表性誤差——指由于隨機樣本內部結構與總體結構之間存在差異而引起的樣本指標與總體指標之間的差異。代表性誤差又可分為兩類:①系統(tǒng)性誤差——指由于違反抽樣的隨機原則而產生的誤差。②隨機誤差——也稱抽樣誤差,指由于隨機抽樣本身導致的現(xiàn)樣本內部結構與總體結構不一致而產生的誤差。在抽樣調查中隨機誤差是不可避免的。如全部產品中有2%的次品,隨機抽取100件,其中恰好有2件次品的可能性是很少的。
統(tǒng)計誤差和抽樣誤差(續(xù))10/27/2022122(2)代表性誤差——指由于隨機樣本內部結構與總體結構之間存在影響抽樣誤差的主要因素(1)總體標準差越大,樣本結構就越難以接近總體結構,誤差也就越大。(2)樣本容量
越大,樣本結構就越接近總體結構,樣本對總體的代表性就越高,抽樣誤差就越小。(3)抽樣方法不同抽樣的方法,將直接影響樣本內部結構與總體結構之間的差異。如分層抽樣就可以使樣本結構更接近于總體結構,因而其抽樣誤差是所有抽樣方法中最小的。(4)抽樣方式不重復抽樣可以使樣本內部結構更接近總體結構。因此不重復抽樣的抽樣誤差小于重復抽樣。
10/27/2022123影響抽樣誤差的主要因素(1)總體標準差抽樣分布(1)均值的抽樣分布(2)比例的抽樣分布10/27/2022124抽樣分布(1)均值的抽樣分布10/21/202234第六章置信區(qū)間估計1.允許誤差d2.區(qū)間估計(單總體方差未知時的均值估計)3.樣本容量的確定(均值和比例)10/27/2022125第六章置信區(qū)間估計1.允許誤差d10/21/202235μPσ2σ
2已知σ
2未知雙側雙側雙側雙側單側上限單側上限單側下限單側下限第六章置信區(qū)間估計10/27/2022126μPσ2σ2已知σ2未知雙側雙側雙側雙側單側上限單側上限設某種元件的壽命X~N(,2),其中,
2未知,現(xiàn)隨機測得10個元件的壽命如下(小時)1502,1453,1367,1108,16501213,1208,1480,1550,1700試求元件平均壽命
的95%置信區(qū)間。復習題10/27/2022127設某種元件的壽命X~N(,2),其中,2未故所求
的95%置信區(qū)間為解:已知/2=0.025,=1423.1,S=196.5,=1-0.95=0.05,n=10,查表得t0.025(9)=2.2622可用Excel的【工具】→“數據分析”→“描述統(tǒng)計”需要注意:只給出d值求解正態(tài)總體均值
的置信區(qū)間。10/27/2022128故所求的95%置信區(qū)間為解:已知復習題某車床加工的缸套外徑尺寸X~N(
μ,σ
2),下面是隨機測得的10個加工后的缸套外徑尺寸(mm),
90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99求(,)
求μ的置信度為95%的置信區(qū)間;10/27/2022129復習題某車床加工的缸套外徑尺寸X~N(μ,σ2總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差d的條件下,由可得其中總體標準差或樣本標準差也是未知的,通??梢韵韧ㄟ^小規(guī)模抽樣作出估計。由于使用的是近似公式,可知實際采用的最低樣本容量應比計算結果稍大。
10/27/2022130總體均值區(qū)間估計時樣本容量的確定在給定置信度和允許誤差d總體比例區(qū)間估計時樣本容量的確定國外民意調查機構在進行民意調查時,通常要求在95%的置信度下將調查的允許誤差(即置信區(qū)間的d值)控制在3%以內。⑴問為滿足該調查精度要求,需要多大的樣本?⑵如果要求置信度達到99%,調查誤差仍為3%,此時至少需要多大的樣本?
10/27/2022131總體比例區(qū)間估計時樣本容量的確定國外民意調查機構在進行民意調案例思考題解答(1)本案例中,當沒有關于總體均值P先驗值和估計時,要用P=0.5確定樣本容量,這樣產生最大可能的樣本容量及成本最高的抽樣故需要的樣本容量為
10/27/2022132案例思考題解答(1)本案例中,當沒有關于總體均值P先驗值和估案例思考題解答(2)如果要求置信度達到99%,則Z/2=Z0.005=2.575,
10/27/2022133案例思考題解答(2)如果要求置信度達到99%,則Z/2=Z第6章作業(yè)題(尤其2,6必須掌握)10/27/202213410/21/202244第7章單個總體的假設檢驗復習重點:1.兩類錯誤及其關系(重點:選擇題)2.單總體假設檢驗必須掌握內容:sigma未知情況下,總體均值假設檢驗
10/27/2022135第7章單個總體的假設檢驗復習重點:10/21/20224設t為檢驗原假設H0所用的統(tǒng)計量,t(n-1)為檢驗的臨界值,由顯著性水平
的定義(右邊檢驗)
P{t>t(n-1)|H0為真}=可知檢驗中可能出現(xiàn)以下兩類判斷錯誤:四.檢驗中可能犯的兩類錯誤第一類錯誤——當H0為真時拒絕H0的錯誤,即“棄真”錯誤,犯此類錯誤的概率為。第二類錯誤——當H0不真時接受H0的錯誤,即“取偽”錯誤,記犯該類錯誤的概率為,即P{t≤t(n-1)|H0不真}=由于H0不真時與H0為真時,統(tǒng)計量t的分布是不同的,故β≠1-。
10/27/2022136設t為檢驗原假設H0所用的統(tǒng)計量,t(n-1)為檢由圖可知,減少會增大,反之也然。在樣本容量n不變時,不可能同時減小犯兩類錯誤的概率。應著重控制犯哪類錯誤的概率,這應由問題的實際背景決定。當第一類錯誤造成的損失大時,就應控制犯第一類錯誤的概率(通常取0.05,0.01等);反之,當第二類錯誤造成的損失大時,就應控制犯第二類錯誤的概率。要同時減小須犯兩類錯誤的概率,必須增大樣本容量n。
x0H0:μ=μ0t(n-1)H1:μ=μ1β四.檢驗中可能犯的兩類錯誤(續(xù))10/27/2022137由圖可知,減少會增大,反之也然。x0H0:μ=μ0單個總體均值的檢驗當樣本容量足夠大時,t值可以用Z值近似確定10/27/2022138單個總體均值的檢驗當樣本容量足夠大時,t值可以用Z值近似確定案例1.檢驗新工藝的效果某廠生產的一種鋼絲抗拉強度服從均值為10560(kg/cm2)的正態(tài)分布,現(xiàn)采用新工藝生產了一種新鋼絲,隨機抽取10根測得抗拉強度為:10512,10623,10668,10554,1077610707,10557,10581,10666,10670問在顯著性水平=0.05下,新鋼絲的平均抗拉強度比原鋼絲是否有顯著提高?
10/27/2022139案例1.檢驗新工藝的效果某廠生產的一種鋼絲抗拉強度服從均值案例1解答:說明新工藝對提高鋼絲繩的抗拉強度是有顯著效果的。
本案例為右邊檢驗問題,設新鋼絲的平均抗拉強度為,
2未知,故使用t檢驗。由題意,H0:=0,H1:>0由所給樣本數據,可求得:S=81,n=10,=0.05,t0.05(9)=1.8331∵t=2.7875故拒絕H0,即在水平=0.05下,
顯著高于0。>t(n-1)=
t0.05(9)=1.833110/27/2022140案例1解答:說明新工藝對提高鋼絲繩的抗拉強度是有在案例1中,若取
=0.01,問結論如何?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數學八年級上冊15.4.1《提公因式法因式分解》聽評課記錄
- 人教版七年級地理上冊:4.2《世界的語言和宗教》聽課評課記錄1
- 八年級歷史上聽課評課記錄《第一單元第1課鴉片戰(zhàn)爭》聽課評課記錄
- 用維修基金維修電梯主機軸承合同
- 生態(tài)項目投資合作協(xié)議書(2篇)
- 人教版數學八年級上冊聽評課記錄15.2.1《分式的乘除》
- 部編版八年級道德與法治下冊第五課《我國基本制度》第3課時《基本政治制度》聽課評課記錄
- 北師大版數學一年級上冊第一單元《生活中的數 第3課時 玩具》聽評課記錄
- 北師大版數學五年級上冊《軸對稱再認識(一)》聽評課記錄2
- 冀教版數學七年級下冊《數學活動 拼圖與分解因式》聽評課記錄
- 初中數學教學“教-學-評”一體化研究
- 2012年安徽高考理綜試卷及答案-文檔
- 《游戲界面設計專題實踐》課件-知識點5:圖標繪制準備與繪制步驟
- 自動扶梯安裝過程記錄
- MOOC 材料科學基礎-西安交通大學 中國大學慕課答案
- 智慧供熱管理系統(tǒng)方案可行性研究報告
- 帕金森病的言語康復治療
- 中國城市居民的健康意識和生活方式調研分析報告
- 上海星巴克員工手冊
- 貓狗創(chuàng)業(yè)計劃書
- 復產復工試題含答案
評論
0/150
提交評論