應(yīng)用統(tǒng)計學(xué)前言_第1頁
應(yīng)用統(tǒng)計學(xué)前言_第2頁
應(yīng)用統(tǒng)計學(xué)前言_第3頁
應(yīng)用統(tǒng)計學(xué)前言_第4頁
應(yīng)用統(tǒng)計學(xué)前言_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于應(yīng)用統(tǒng)計學(xué)前言第一頁,共七十一頁,2022年,8月28日要求先修課程:

高等數(shù)學(xué)、統(tǒng)計學(xué)原理、概率論與數(shù)理統(tǒng)計教材:《多元統(tǒng)計分析與SPSS應(yīng)用》.汪冬華編著.

參考書:《實用多元統(tǒng)計分析》方開泰編著.華東師范大學(xué)出版社,1989年9月《應(yīng)用多元分析》王學(xué)民著.上海財經(jīng)大學(xué)出版社,1999年《實用多元統(tǒng)計分析》王學(xué)仁,王松桂著.上??萍汲霭嫔?,1990年《SPSS11統(tǒng)計分析教程》張文彤著.希望電子出版社,2002年第二頁,共七十一頁,2022年,8月28日概率論與數(shù)理統(tǒng)計的區(qū)別概率論的特點:先從一個數(shù)學(xué)模型出發(fā),比如已知隨機(jī)變量的分布,然后去研究它的性質(zhì)、特點和規(guī)律性;數(shù)理統(tǒng)計的特點:觀測隨機(jī)現(xiàn)象所得到的數(shù)據(jù),利用這些資料選擇或檢驗數(shù)學(xué)模型,并對所考察的問題作出推斷或預(yù)測,即靠抽驗得到的數(shù)據(jù)來推斷整體的情況,主要任務(wù)是統(tǒng)計推斷,包括:參數(shù)估計和假設(shè)檢驗。第三頁,共七十一頁,2022年,8月28日參數(shù)估計1、參數(shù)估計:根據(jù)樣本給出參數(shù)的估計值,即選定一個統(tǒng)計量,然后用樣本值代入,算出該統(tǒng)計量的值。2、參數(shù)估計的提法已知總體分布類型,只是其中一個或幾個參數(shù)未知,這時只要求出這些參數(shù)值來,總體分布就可以完全確定;關(guān)心的不是分布類型,而是某些數(shù)字特征,如期望、方差等等。3、參數(shù)估計的方式:點估計和區(qū)間估計4、點估計量的求法:矩估計法和極大似然估計法5、估計量的評選標(biāo)準(zhǔn):無偏性、最小方差性、相合性6、區(qū)間估計包括:數(shù)學(xué)期望和方差的置信區(qū)間估計第四頁,共七十一頁,2022年,8月28日假設(shè)檢驗1、假設(shè)檢驗:先把一些結(jié)論當(dāng)作某種假設(shè),然后選取適當(dāng)?shù)慕y(tǒng)計量,再根據(jù)實測資料的具體值對假設(shè)進(jìn)行檢驗,判斷是否可以認(rèn)為假設(shè)是成立的,從而得出有關(guān)結(jié)論。2、類型可分為:參數(shù)檢驗和非參數(shù)檢驗參數(shù)檢驗:如果總體分布函數(shù)的類型已知,檢驗的目的是為了對總體的參數(shù)及有關(guān)性質(zhì)作出判斷;非參數(shù)檢驗:如果總體分布的類型不確定(或完全未知),檢驗的目的是作出一般性論斷(如分布屬于某種類型;兩變量是獨立的;兩分布是相同的,等等)。第五頁,共七十一頁,2022年,8月28日應(yīng)用統(tǒng)計學(xué)的內(nèi)容《應(yīng)用統(tǒng)計學(xué)》也稱為多元統(tǒng)計分析,簡稱多元分析,是統(tǒng)計學(xué)的一個重要分支,它是處理多維數(shù)據(jù)不可缺少的重要工具,并日益顯示出無比的魅力。本課程介紹常用的各種多元統(tǒng)計分析方法,包括方差分析、正交試驗設(shè)計、回歸分析、聚類分析、判別分析、主成分分析、因子分析等方法。通過對所考慮的包括多個變量的統(tǒng)計問題進(jìn)行分析,以了解各變量的關(guān)系、建立合理的模型等。第六頁,共七十一頁,2022年,8月28日應(yīng)用統(tǒng)計學(xué)的作用通過本課程的學(xué)習(xí),使學(xué)生系統(tǒng)地了解多元統(tǒng)計分析的基本概念和基本原理,掌握一些常用的多元統(tǒng)計思想和統(tǒng)計方法;結(jié)合上機(jī)實習(xí)學(xué)會利用統(tǒng)計軟件(SPSS或Excel)進(jìn)行數(shù)據(jù)處理和統(tǒng)計分析;側(cè)重于多元統(tǒng)計分析方法的應(yīng)用,掌握應(yīng)用多元統(tǒng)計學(xué)解決實際問題的主要環(huán)節(jié)和方法,并能靈活應(yīng)用于科學(xué)研究、生產(chǎn)和經(jīng)營管理中。第七頁,共七十一頁,2022年,8月28日概率論與數(shù)理統(tǒng)計(復(fù)習(xí))第八頁,共七十一頁,2022年,8月28日概率、頻率對概率的再認(rèn)識:古典概率、經(jīng)驗概率、統(tǒng)計概率概率是唯一的、客觀存在的頻率是隨著試驗的變化而變化頻率穩(wěn)定性問題第九頁,共七十一頁,2022年,8月28日拋硬幣試驗實驗者擲硬幣的次數(shù)正面出現(xiàn)次數(shù)正面出現(xiàn)頻率Buffon404020480.5069Pearson1270060190.5016Pearson24000120120.5005第十頁,共七十一頁,2022年,8月28日隨機(jī)事件與隨機(jī)變量隨機(jī)變量的引入是對隨機(jī)事件的抽象對隨機(jī)事件的研究可以轉(zhuǎn)化為對隨機(jī)變量的研究,可以借助于高等數(shù)學(xué)的知識離散隨機(jī)變量與連續(xù)隨機(jī)變量的數(shù)學(xué)處理方法實質(zhì)上是一致的第十一頁,共七十一頁,2022年,8月28日拋硬幣的試驗中出現(xiàn)正面的事件可以表示為:出現(xiàn)正面出現(xiàn)反面第十二頁,共七十一頁,2022年,8月28日離散隨機(jī)變量的數(shù)學(xué)期望表達(dá)式:連續(xù)隨機(jī)變量的數(shù)學(xué)期望表達(dá)式:第十三頁,共七十一頁,2022年,8月28日隨機(jī)變量及其分布隨機(jī)變量與分布的研究類似于高等數(shù)學(xué)中變量與函數(shù)的研究函數(shù)的研究著重討論六大類基本初等函數(shù),隨機(jī)分布的研究則討論其常用分布第十四頁,共七十一頁,2022年,8月28日理論分布與統(tǒng)計分布理論分布也稱為概率分布統(tǒng)計分布也稱為頻率分布由概率與頻率的關(guān)系,得知:理論分布是客觀存在的,反映了隨機(jī)事件發(fā)生的概率的一般規(guī)律;頻率分布是現(xiàn)實的反映,隨著試驗的變化而變化第十五頁,共七十一頁,2022年,8月28日常用分布及其數(shù)學(xué)期望與方差名稱及記號概率分布數(shù)學(xué)期望方差“0-1”分布X=0,1(0<p<1)ppq二項分布B(n,p)X=0,1,…,n(0<p<1)npnpq超幾何分布H(n,M,N)X=0,1,…min(n,M)(0≤M≤N,0≤n≤N)泊松分布P(x)X=0,1,…(λ>0)λλ幾何分布G(p)X=1,2…(0<p<1)第十六頁,共七十一頁,2022年,8月28日常用分布及其數(shù)學(xué)期望與方差名稱及記號概率密度數(shù)學(xué)期望方差均勻分布U(0,1)a≤x≤bx<a或x>b正態(tài)分布N(μ,σ)-∞<x<+∞μσ2指數(shù)分布e(λ)x>0

x≤0(λ>0)第十七頁,共七十一頁,2022年,8月28日數(shù)字特征的討論期望與樣本均值方差與樣本方差矩與樣本矩樣本均值與樣本方差是統(tǒng)計中的兩大類指標(biāo)第十八頁,共七十一頁,2022年,8月28日多維隨機(jī)變量的學(xué)習(xí)方法邊緣概率(分布)條件概率(分布)隨機(jī)變量的獨立性第十九頁,共七十一頁,2022年,8月28日大數(shù)定律與中心極限定理小概率事件實際不可能性原理一般情況下,隨機(jī)分布的極限分布是正態(tài)分布第二十頁,共七十一頁,2022年,8月28日數(shù)理統(tǒng)計的基本知識簡單隨機(jī)抽樣樣本分布函數(shù)的建立統(tǒng)計量的概念統(tǒng)計中的常用分布正態(tài)總體統(tǒng)計量的分布第二十一頁,共七十一頁,2022年,8月28日簡單隨機(jī)抽樣(獨立同分布)滿足:等可能性----總體中每個樣本被選中的可能性是相同的,獨立性----每次抽樣的結(jié)果既不影響其它各次抽樣的結(jié)果,也不受其它各次抽樣的結(jié)果的影響,則這種抽樣方法為簡單隨機(jī)抽樣。第二十二頁,共七十一頁,2022年,8月28日樣本分布函數(shù)的建立設(shè)(X1,X2,…Xn)是從總體X中抽取的一個容量為n的樣本,將其樣本值x1,x2,…xn按遞增次序排列,得

x(1)≤x(2)≤……≤x(n)

當(dāng)

x≤

x(1)

……..

x(k)<

x≤

x(k+1)(k=1,…n-1)

…….

x>

x(n)

第二十三頁,共七十一頁,2022年,8月28日統(tǒng)計量的概念

設(shè)樣本(X1,X2,…Xn)的函數(shù)f(X1,X2,…Xn)中不含有任何未知參數(shù),則稱這樣的函數(shù)為統(tǒng)計量。常用統(tǒng)計量:樣本均值樣本方差第二十四頁,共七十一頁,2022年,8月28日統(tǒng)計中的常用分布(1)名稱及記號概率密度數(shù)學(xué)期望方差χ2分布χ2(k)

x>0x≤0k2k正態(tài)分布N(μ,σ)μσ2t分布t(k)0(n>1)n/n-2(n>2)第二十五頁,共七十一頁,2022年,8月28日統(tǒng)計中的常用分布(2)名稱及記號F分布F(k1,k2)概率密度

x>0x≤0數(shù)學(xué)期望

k2>2方差k2>4第二十六頁,共七十一頁,2022年,8月28日正態(tài)總體統(tǒng)計量的分布第二十七頁,共七十一頁,2022年,8月28日參數(shù)估計與假設(shè)檢驗理論和方法推斷性統(tǒng)計是根據(jù)樣本的信息,對總體的特征作出推斷,是“從現(xiàn)象到本質(zhì)的認(rèn)識過程”估計理論和方法、檢驗理論和方法是推斷統(tǒng)計的兩個重要組成部分第二十八頁,共七十一頁,2022年,8月28日參數(shù)估計估計量點估計區(qū)間估計第二十九頁,共七十一頁,2022年,8月28日估計量和估計值對總體參數(shù)進(jìn)行估計的相應(yīng)的樣本統(tǒng)計量稱為估計量估計值是估計量的一個具體數(shù)值第三十頁,共七十一頁,2022年,8月28日估計量的優(yōu)良標(biāo)準(zhǔn)無偏性:如果樣本統(tǒng)計量的期望值等于該統(tǒng)計量所估計的總體參數(shù),則這個估計量為無偏估計量一致性:當(dāng)樣本容量n增大時,如果估計量越來越接近總體參數(shù)的真值時,就稱這個估計量為一致估計有效性:指估計量的離散程度(即最小方差性)第三十一頁,共七十一頁,2022年,8月28日常用估計量第三十二頁,共七十一頁,2022年,8月28日點估計法矩法:樣本矩等于總體矩準(zhǔn)則極大似然法:使似然函數(shù)(即樣本的聯(lián)合分布函數(shù))最大準(zhǔn)則最小二乘法:距離平方和最小準(zhǔn)則第三十三頁,共七十一頁,2022年,8月28日區(qū)間估計區(qū)間估計的原理總體均值的區(qū)間估計兩個總體均值之差的區(qū)間估計樣本容量的確定正態(tài)總體方差與兩個正態(tài)總體方差之比的區(qū)間估計第三十四頁,共七十一頁,2022年,8月28日區(qū)間估計的原理第三十五頁,共七十一頁,2022年,8月28日第三十六頁,共七十一頁,2022年,8月28日區(qū)間估計的步驟第三十七頁,共七十一頁,2022年,8月28日總體均值的區(qū)間估計(1)樣本取自正態(tài)分布總體,且σ2已知:第三十八頁,共七十一頁,2022年,8月28日總體均值的區(qū)間估計(2)樣本取自非正態(tài)分布總體,且σ2已知:

(大樣本情況)第三十九頁,共七十一頁,2022年,8月28日總體均值的區(qū)間估計(3)樣本取自非正態(tài)分布總體,且σ2未知:(大樣本情況)第四十頁,共七十一頁,2022年,8月28日總體均值的區(qū)間估計(4)樣本取自正態(tài)分布總體,且σ2未知:(小樣本情況)第四十一頁,共七十一頁,2022年,8月28日兩個總體均值之差的區(qū)間估計(1)兩個正態(tài)總體,而且σ1、σ2已知:第四十二頁,共七十一頁,2022年,8月28日兩個總體均值之差的區(qū)間估計(2)兩個正態(tài)總體,而且σ1、σ2未知,但σ1=σ2

:第四十三頁,共七十一頁,2022年,8月28日兩個總體均值之差的區(qū)間估計(3)兩個正態(tài)總體,而且σ1、σ2未知,但σ1≠σ2

:第四十四頁,共七十一頁,2022年,8月28日兩個總體均值之差的區(qū)間估計(4)兩個非正態(tài)總體,且方差未知(大樣本情況):第四十五頁,共七十一頁,2022年,8月28日正態(tài)總體方差的區(qū)間估計第四十六頁,共七十一頁,2022年,8月28日兩個正態(tài)總體方差之比的區(qū)間估計第四十七頁,共七十一頁,2022年,8月28日樣本容量的確定決定樣本大小的因素總體方差數(shù)值大小可靠性程度的高低允許誤差的大小第四十八頁,共七十一頁,2022年,8月28日估計總體均值時樣本容量的確定在重復(fù)抽樣的條體下:在不重復(fù)抽樣的條體下:第四十九頁,共七十一頁,2022年,8月28日估計總體比例時樣本容量的確定在重復(fù)抽樣的條體下:在不重復(fù)抽樣的條體下:第五十頁,共七十一頁,2022年,8月28日假設(shè)檢驗假設(shè)檢驗的基本問題總體均值的假設(shè)檢驗兩個總體的均值的假設(shè)檢驗總體方差的假設(shè)檢驗第五十一頁,共七十一頁,2022年,8月28日假設(shè)檢驗的基本問題假設(shè)檢驗的基本原理兩類錯誤顯著水平雙側(cè)檢驗單側(cè)檢驗假設(shè)檢驗的一般程序第五十二頁,共七十一頁,2022年,8月28日假設(shè)檢驗的基本思想(小概率原理)先把一些結(jié)論當(dāng)作某種假設(shè),然后選取適當(dāng)?shù)慕y(tǒng)計量,再根據(jù)實測資料的具體值對假設(shè)進(jìn)行檢驗,判斷是否可以認(rèn)為假設(shè)是成立的,從而得出有關(guān)結(jié)論。小概率原理:指發(fā)生概率很小的事件在一次試驗中幾乎是不可能發(fā)生的,根據(jù)這一原理就可以作出是否接受原假設(shè)的決定。第五十三頁,共七十一頁,2022年,8月28日

假設(shè)檢驗的基本內(nèi)容

假設(shè)檢驗的規(guī)則就是把隨機(jī)變量取值區(qū)間劃分為兩個互不相交的部分,即拒絕區(qū)域與接受區(qū)域。當(dāng)樣本的某個統(tǒng)計量屬于拒絕區(qū)域時,將拒絕原假設(shè)。落入拒絕區(qū)域的概率,就是小概率,一般用顯著性水平表示。第五十四頁,共七十一頁,2022年,8月28日假設(shè)檢驗的基本原理由大數(shù)定理:

是事先給定的一個很小的正數(shù),稱為顯著水平尋找的分布由事件為,概率為,求出的值解不等式

在參數(shù)假設(shè)已知,而估計量未知的前提下其解為則為拒絕域而為接受域,稱為臨界值5.將估計值與臨界值作比較并由此作出判斷第五十五頁,共七十一頁,2022年,8月28日兩類錯誤

對假設(shè)H0

自然狀態(tài)采取的行動

H0為真H0為偽接受H0

決斷正確第二類錯誤(取偽)拒絕H0

第一類錯誤(棄真)決斷正確第五十六頁,共七十一頁,2022年,8月28日假設(shè)檢驗的一般程序根據(jù)研究問題的需要提出假設(shè),包括原假設(shè)H0和備擇假設(shè)H1找出檢驗的統(tǒng)計量及其分布規(guī)定顯著水平確定決策規(guī)則:在確定了顯著水平以后,根據(jù)統(tǒng)計量的分布就可以規(guī)定決策規(guī)則,找出接受域和拒絕域的臨界值根據(jù)樣本數(shù)據(jù)計算的統(tǒng)計值并由此作出決策第五十七頁,共七十一頁,2022年,8月28日均值檢驗案例

某企業(yè)購買金屬板供應(yīng)商聲稱金屬板的厚度漸近服從正態(tài)分布,其總體均值為15毫米,總體標(biāo)準(zhǔn)差為0.1毫米。該企業(yè)隨機(jī)抽取了50張金屬板作為樣本,測得樣本均值為14.982毫米。以0.05顯著性水平,能否證明供應(yīng)商提供的總體均值是正確的。第五十八頁,共七十一頁,2022年,8月28日①提出假設(shè):原假設(shè):Ho:μ=15;備擇假設(shè):Ha:μ≠15。②統(tǒng)計量:由于總體服從正態(tài)分布且總體標(biāo)準(zhǔn)差σ已知,選z作為統(tǒng)計量。又因為如果樣本均值顯著大于或小于15,都拒絕原假設(shè),故該檢驗是雙側(cè)檢驗。③確定顯著性水平:根據(jù)題意可知顯著性水平為a=0.05。第五十九頁,共七十一頁,2022年,8月28日④決策規(guī)則根據(jù)顯著性水平可得下圖。從圖可以看出,臨界值為1.96,所以,統(tǒng)計量絕對值如果大于1.96,則落入拒絕區(qū)域,拒絕原假設(shè)。同樣,如果統(tǒng)計量的P值小于1.96,則落入拒絕區(qū)域,拒絕原假設(shè)。第六十頁,共七十一頁,2022年,8月28日總體均值的假設(shè)檢驗(1)正態(tài)總體且方差己知由于 服從的正態(tài)分布,即Z=~N(0,1),則:1.顯著水平α的Z的雙側(cè)檢驗(即)的拒絕域為第六十一頁,共七十一頁,2022年,8月28日2.顯著水平α的Z的右側(cè)檢驗(即)的拒絕域為:3.顯著水平α的Z的左側(cè)檢驗(即)的拒絕域為:第六十二頁,共七十一頁,2022年,8月28日兩個總體的均值的假設(shè)檢驗(2)

兩個正態(tài)分布總體,未知,但:由于T=~t(n1+n2-2),其中,則:1.顯著水平α的T的雙側(cè)檢驗(即)的拒絕域為第六十三頁,共七十一頁,2022年,8月28日2.顯著水平α的T的右側(cè)檢驗(即)的拒絕域為:3.顯著水平α的T的左側(cè)檢驗(即)的拒絕域為:第六十四頁,共七十一頁,2022年,8月28日兩個總體的均值的假設(shè)檢驗(3)兩個非正態(tài)總體,且方差未知(大樣本情況)由于Z=~N(0,1),則:1.顯著水平α的Z的雙側(cè)檢驗(即)的拒絕域為第六十五頁,共七十一頁,2022年,8月28日2.顯著水平α的Z的右側(cè)檢驗(即)的拒絕域為:3.顯著水平α的Z的左側(cè)檢驗(即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論