幾種統(tǒng)計(jì)分析模型介紹_第1頁
幾種統(tǒng)計(jì)分析模型介紹_第2頁
幾種統(tǒng)計(jì)分析模型介紹_第3頁
幾種統(tǒng)計(jì)分析模型介紹_第4頁
幾種統(tǒng)計(jì)分析模型介紹_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

幾種統(tǒng)計(jì)分析模型介紹第一頁,共五十三頁,編輯于2023年,星期日張業(yè)圳福建師范大學(xué)經(jīng)濟(jì)學(xué)院副教授、博士、財(cái)金系副主任主要教學(xué)研究方向:數(shù)量經(jīng)濟(jì)學(xué)與金融實(shí)證分析聯(lián)系電話:87369087

Email:zhangyz1971@126.comQQ:107345901地址:福建師范大學(xué)經(jīng)濟(jì)學(xué)院郵編:350108第二頁,共五十三頁,編輯于2023年,星期日經(jīng)濟(jì)統(tǒng)計(jì)分析統(tǒng)計(jì)學(xué)研究如何測(cè)定、收集、整理、歸納和分析反映客觀現(xiàn)象總體數(shù)量的數(shù)據(jù),以便給出正確認(rèn)識(shí)的方法論科學(xué)。

經(jīng)濟(jì)統(tǒng)計(jì)分析就是用統(tǒng)計(jì)方法來分析經(jīng)濟(jì)現(xiàn)象數(shù)量特征和經(jīng)濟(jì)變量之間的關(guān)系。主要的工作有:1)分析經(jīng)濟(jì)現(xiàn)象中變量之間相互關(guān)系2)經(jīng)濟(jì)預(yù)測(cè)3)政策評(píng)價(jià)第三頁,共五十三頁,編輯于2023年,星期日什么是經(jīng)濟(jì)統(tǒng)計(jì)分析模型模型對(duì)現(xiàn)實(shí)的描述和模擬。用不同方法對(duì)現(xiàn)實(shí)進(jìn)行描述和模擬,就構(gòu)成不同的模型。語義模型、物理模型、幾何模型、數(shù)學(xué)模型和計(jì)算機(jī)模擬模型。經(jīng)濟(jì)數(shù)學(xué)模型:用數(shù)學(xué)方法描述經(jīng)濟(jì)活動(dòng)。采用的數(shù)學(xué)方法不同,對(duì)經(jīng)濟(jì)活動(dòng)提示的程度不同,構(gòu)成各類不同的經(jīng)濟(jì)數(shù)學(xué)模型。數(shù)理經(jīng)濟(jì)模型計(jì)量經(jīng)濟(jì)學(xué)模型

第四頁,共五十三頁,編輯于2023年,星期日本次培訓(xùn)主要模型1、聚類分析2、回歸分析3)因子分析和主成分分析4)時(shí)間序列分析第五頁,共五十三頁,編輯于2023年,星期日第一部分:預(yù)備知識(shí)第六頁,共五十三頁,編輯于2023年,星期日樣本與統(tǒng)計(jì)量總體與樣本

在數(shù)理統(tǒng)計(jì)中,把研究對(duì)象的全體稱為總體(population)或母體,而把組成總體的每個(gè)單元稱為個(gè)體。抽樣

要了解總體的分布規(guī)律,在統(tǒng)計(jì)分析工作中,往往是從總體中抽取一部分個(gè)體進(jìn)行觀測(cè),這個(gè)過程稱為抽樣。第七頁,共五十三頁,編輯于2023年,星期日樣本與統(tǒng)計(jì)量子樣

子樣是n個(gè)隨機(jī)變量,抽取之后的觀測(cè)數(shù)據(jù)稱為樣本值或子樣觀察值。在抽取過程中,每抽取一個(gè)個(gè)體,就是對(duì)總體X進(jìn)行一次隨機(jī)試驗(yàn),每次抽取的n個(gè)個(gè)體,稱為總體X的一個(gè)容量為n的樣本(sample)或子樣;其中樣本中所包含的個(gè)體數(shù)量稱為樣本容量。第八頁,共五十三頁,編輯于2023年,星期日隨機(jī)抽樣方法的基本要求獨(dú)立性——即每次抽樣的結(jié)果既不影響其余各次抽樣的結(jié)果,也不受其它各次抽樣結(jié)果的影響。滿足上述兩點(diǎn)要求的子樣稱為簡(jiǎn)單隨機(jī)子樣.獲得簡(jiǎn)單隨機(jī)子樣的抽樣方法叫簡(jiǎn)單隨機(jī)抽樣.從簡(jiǎn)單隨機(jī)子樣的含義可知,樣本是來自總體、與總體具有相同分布的隨機(jī)變量.代表性——即子樣()的每個(gè)分量與總體具有相同的概率分布。第九頁,共五十三頁,編輯于2023年,星期日簡(jiǎn)單隨機(jī)抽樣

例如:要通過隨機(jī)抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測(cè)后放回原來的總量中,則這是一個(gè)簡(jiǎn)單隨機(jī)抽樣。但實(shí)際抽樣中,往往是不再放回產(chǎn)品,則這不是一個(gè)簡(jiǎn)單隨機(jī)抽樣。但當(dāng)總量N很大時(shí),可近似看成是簡(jiǎn)單隨機(jī)抽樣。

例如:為了分析福建省居民家庭收入狀況,對(duì)福建省居民家庭收入進(jìn)行調(diào)查。第十頁,共五十三頁,編輯于2023年,星期日統(tǒng)計(jì)量則例如:設(shè)是從正態(tài)總體中抽取的一個(gè)樣本,其中為已知參數(shù),為未知參數(shù),是統(tǒng)計(jì)量不是統(tǒng)計(jì)量

定義設(shè)()為總體X的一個(gè)樣本,為不含任何未知參數(shù)的連續(xù)函數(shù),則稱為樣本()的一個(gè)統(tǒng)計(jì)量。第十一頁,共五十三頁,編輯于2023年,星期日幾個(gè)常用的統(tǒng)計(jì)量樣本均值(samplemean)設(shè)是總體的一個(gè)樣本,樣本方差(samplevariance)第十二頁,共五十三頁,編輯于2023年,星期日樣本均方差或標(biāo)準(zhǔn)差它們的觀測(cè)值用相應(yīng)的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。幾個(gè)常用的統(tǒng)計(jì)量設(shè)是總體的一個(gè)樣本,第十三頁,共五十三頁,編輯于2023年,星期日子樣的K階(原點(diǎn))矩幾個(gè)常用的統(tǒng)計(jì)量設(shè)是總體的一個(gè)樣本,子樣的K階中心矩第十四頁,共五十三頁,編輯于2023年,星期日它包括兩個(gè)方面——數(shù)據(jù)整理計(jì)算樣本特征數(shù)數(shù)據(jù)的簡(jiǎn)單處理為了研究隨機(jī)現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調(diào)查或試驗(yàn)得到的數(shù)據(jù)往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。數(shù)據(jù)的簡(jiǎn)單處理是以一種直觀明了方式加工數(shù)據(jù)。第十五頁,共五十三頁,編輯于2023年,星期日計(jì)算樣本特征數(shù):數(shù)據(jù)的簡(jiǎn)單處理數(shù)據(jù)整理:將數(shù)據(jù)分組計(jì)算各組頻數(shù)作頻率分布表作頻率直方圖(1)反映趨勢(shì)的特征數(shù)樣本均值中位數(shù):數(shù)據(jù)按大小順序排列后,位置居中的那個(gè)數(shù)或居中的兩個(gè)數(shù)的平均數(shù)。眾數(shù):樣本中出現(xiàn)最多的那個(gè)數(shù)。第十六頁,共五十三頁,編輯于2023年,星期日數(shù)據(jù)的簡(jiǎn)單處理(2)反映分散程度的特征數(shù):極差、四分位差極差——樣本數(shù)據(jù)中最大值與最小值之差,四分位數(shù)——將樣本數(shù)據(jù)依概率分為四等份的3個(gè)數(shù)椐,依次稱為第一、第二、第三四分位數(shù)。第一四分位數(shù)Q1:第二四分位數(shù)Q2:第三四分位數(shù)Q3:第十七頁,共五十三頁,編輯于2023年,星期日第二部分:參數(shù)估計(jì)第十八頁,共五十三頁,編輯于2023年,星期日第一節(jié)參數(shù)的點(diǎn)估計(jì)

一、點(diǎn)估計(jì)問題設(shè)總體X的分布函數(shù)的形式為已知的F(

x,θ

),其中x是自變量,θ為未知參數(shù)(它可以是一個(gè)數(shù),也可以是一個(gè)向量).借助于總體X的一個(gè)樣本(X

1,X

2,…,X

n),來估計(jì)未知參數(shù)θ的值的問題,稱為參數(shù)的點(diǎn)估計(jì)問題.點(diǎn)估計(jì)的問題就是要構(gòu)造一個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量(X1,X2,…,Xn),用樣本的一組觀察值(x1,x2,…,xn),得到的觀察值(x1,x2,…,xn),以此來估計(jì)未知參數(shù)θ.稱統(tǒng)計(jì)量(X

1,X

2,…,X

n)為θ的估計(jì)量,稱(x1,x2,…,xn)為θ的估計(jì)值.第十九頁,共五十三頁,編輯于2023年,星期日二、矩估計(jì)法的函數(shù),記作μl=μl()即,l=1,2,…,k.設(shè)總體X的分布函數(shù)為,其中為k個(gè)未知參數(shù).

假設(shè)總體X的各階原點(diǎn)矩存在,則E(Xl)是對(duì)于總體X的樣本(X1,X2,…,Xn),樣本的l階原點(diǎn)矩為,l=1,

2,…,k.令μl=

Al,l=1,2,…,k,第二十頁,共五十三頁,編輯于2023年,星期日即從上述方程組中解出,分別記作以此作為未知參數(shù)的估計(jì)量,稱為矩估計(jì)量.第二十一頁,共五十三頁,編輯于2023年,星期日如果樣本觀察值為(x1,x2,…,xn),則得未知參數(shù)的矩估計(jì)值為上述估計(jì)未知參數(shù)的方法就叫做矩估計(jì)法.第二十二頁,共五十三頁,編輯于2023年,星期日解此方程組得到與的矩估計(jì)量為令即解

例1設(shè)總體X的均值為μ,方差為,且,但μ與均未知,又設(shè)總體X的一個(gè)樣本為(X1,

X2,

,

Xn),求μ與的矩估計(jì)量.第二十三頁,共五十三頁,編輯于2023年,星期日解由例4可得例2某廠生產(chǎn)一批鉚釘,現(xiàn)要檢驗(yàn)鉚釘頭部直徑,從這批產(chǎn)品中隨機(jī)抽取12只,測(cè)得頭部直徑(單位:mm)如下:13.30 13.38 13.40 13.43 13.32 13.4813.54 13.31 13.34 13.47 13.44 13.50設(shè)鉚釘頭部直徑這一總體X服從正態(tài)分布,試求與的矩估計(jì)值.注此例說明,無論總體X服從什么分布,樣本均值都是總體均值的矩估計(jì)量,樣本二階中心矩就是總體方差的矩估計(jì)量.第二十四頁,共五十三頁,編輯于2023年,星期日三、極大似然估計(jì)法1.設(shè)總體X為離散型隨機(jī)變量,其分布律為其中θ為未知參數(shù),取值范圍為.設(shè)X1,X2,,Xn為來自X的樣本,則X1,X2,,Xn的聯(lián)合分布律為.又設(shè)x1,x2,,xn為一組樣本值,令

稱L(θ)為樣本的似然函數(shù).(1)若有,使得對(duì)一切,有成立,則稱為θ的極大(或最大)似然估計(jì)值,相應(yīng)的統(tǒng)計(jì)量稱為θ的極大(或最大)似然估計(jì)量.第二十五頁,共五十三頁,編輯于2023年,星期日我們規(guī)定,使得的就是θ的極大似然估計(jì)值.由于lnx是單增函數(shù),所以

與有相同的駐點(diǎn),因此只需從

中解出就是θ的極大似然估計(jì)值,稱方程(2)(2)為極大似然方程.第二十六頁,共五十三頁,編輯于2023年,星期日

例3設(shè)總體,與未知,(X1,X2,…,Xn)為總體X的樣本,求與的極大似然估計(jì)量.解

X的概率密度為設(shè)x1,x2,…,xn為樣本值,似然函數(shù)為第二十七頁,共五十三頁,編輯于2023年,星期日令解得與的極大似然估計(jì)值為因此,與的極大似然估計(jì)量為第二十八頁,共五十三頁,編輯于2023年,星期日四、估計(jì)量的評(píng)選標(biāo)準(zhǔn)1.無偏性估計(jì)量是樣本的函數(shù),它是一個(gè)隨機(jī)變量,由不同的方法得到的估計(jì)量可能相同也可能不同.而對(duì)同一估計(jì)量,由不同的樣本觀察值得到參數(shù)的估計(jì)值也可能不同.我們很自然地要求估計(jì)量的期望等于參數(shù)的真值,即無偏性.定義設(shè)是未知參數(shù)θ的估計(jì)量,若,則稱為θ的無偏估計(jì)(量).第二十九頁,共五十三頁,編輯于2023年,星期日例4設(shè)總體X的均值為,(X1,X2,X3)是總體X的樣本,證明下列兩個(gè)估計(jì)量都是的無偏估計(jì).

證由于所以與都是的無編估計(jì).(只需k1+

k2++

kn

=1,則=k1X1+

k2X2++

knXn就是的無偏估計(jì))第三十頁,共五十三頁,編輯于2023年,星期日設(shè)為參數(shù)θ的估計(jì)量,若當(dāng)時(shí),按概率收斂于θ,即對(duì)于任意正數(shù)ε,有,則稱為θ的一致估計(jì)(量).3.一致性根據(jù)大數(shù)定律可知,樣本均值是總體均值的一致估計(jì)量.設(shè)與是參數(shù)θ的兩個(gè)無偏估計(jì)量,若,則稱比有效.2.有效性第三十一頁,共五十三頁,編輯于2023年,星期日第二節(jié)參數(shù)的區(qū)間估計(jì)點(diǎn)估計(jì)是通過構(gòu)造統(tǒng)計(jì)量(X1,X2,…,

Xn)來對(duì)總體X中的未知參數(shù)θ進(jìn)行估計(jì),由一個(gè)樣本值(x1,x2,…,

xn)可得到θ的估計(jì)值(x1,x2,…,

xn).這種估計(jì)值是無法知道誤差的.我們要定出一個(gè)范圍,并要求以一定的概率保證這個(gè)范圍包含著θ的真值.這個(gè)范圍通常以區(qū)間的形式給出,我們把這個(gè)區(qū)間稱為置信區(qū)間.定義設(shè)總體X的分布中含有一個(gè)未知參數(shù)θ,(X1,X2,…,

Xn)是來自總體X的一個(gè)樣本.如果對(duì)于給定的常數(shù),統(tǒng)計(jì)量θ1=θ1(X1,X2,…,

Xn)與θ2=θ2(X1,X2,…,

Xn)滿足(1)則稱隨機(jī)區(qū)間(θ1,θ2)是θ的置信度為的置信區(qū)間,分別稱θ1與θ2為θ的置信下限與置信上限.第三十二頁,共五十三頁,編輯于2023年,星期日

例1設(shè)總體,為已知,未知,(X1,X2,…,Xn)為來自總體X的一個(gè)樣本,求的置信度為的置信區(qū)間.解由于是的無偏估計(jì),且有由正態(tài)分布表可查得,使1-稱為置信度或置信水平.(1)式的含義是,隨機(jī)區(qū)間(θ1,θ2)以的概率包含著θ,也就是說,對(duì)每一個(gè)樣本值(x1,x2,…,

xn)可求得一個(gè)具體的區(qū)間(θ1(x1,x2,…,

xn),θ2(x1,x2,…,

xn)).在這些眾多的區(qū)間中,包含θ的有100()%個(gè),不包含θ的有100%個(gè).第三十三頁,共五十三頁,編輯于2023年,星期日即有取,于是得到的置信度為的置信區(qū)間為第三十四頁,共五十三頁,編輯于2023年,星期日求未知參數(shù)θ的置信區(qū)間的一般方法:1°對(duì)于給定的樣本X1,X2,…,Xn,構(gòu)造樣本函數(shù),它包含待估參數(shù)θ,而不含其它未知參數(shù),并且Z的分布已知,在Z的分布中不依賴任何未知參數(shù).2°對(duì)于給定的置信度,定出兩個(gè)常數(shù)a,b(一般地,按Z所服從的分布的上分位點(diǎn)來確定),使

3°從a<Z(X1,X2,…,Xn)<b得到等價(jià)的不等式θ1(X1,X2,…,Xn)<θ<θ2(X1,X2,…,Xn),其中θ1=θ1(X1,X2,…,Xn)與θ2=θ2(X1,X2,…,Xn)都是統(tǒng)計(jì)量,于是得到θ的一個(gè)置信度為的置信區(qū)間(θ1,θ2).第三十五頁,共五十三頁,編輯于2023年,星期日第三部分:假設(shè)檢驗(yàn)第三十六頁,共五十三頁,編輯于2023年,星期日假設(shè)檢驗(yàn)是進(jìn)行統(tǒng)計(jì)推斷的另一種方法,問題的一般提法是對(duì)總體未知參數(shù)或總體的分布形式作一假設(shè),利用樣本提供的信息來檢驗(yàn)這一假設(shè)是否成立,這一方法具有很重要的實(shí)際意義,因而也是數(shù)理統(tǒng)計(jì)的重要內(nèi)容之一.第三十七頁,共五十三頁,編輯于2023年,星期日第一節(jié)假設(shè)檢驗(yàn)的基本概念假設(shè)檢驗(yàn)是指施加于一個(gè)或多個(gè)總體的概率分布或參數(shù)的假設(shè).所作的假設(shè)可以是正確的,也可以是錯(cuò)誤的.為判斷所作的假設(shè)是否正確,從總體中抽取樣本,根據(jù)樣本的取值,按一定的原則進(jìn)行檢驗(yàn),然后,作出接受或拒絕所作假設(shè)的決定.何為假設(shè)檢驗(yàn)?第三十八頁,共五十三頁,編輯于2023年,星期日假設(shè)檢驗(yàn)所以可行,其理論背景為實(shí)際推斷原理,即“小概率原理”.假設(shè)檢驗(yàn)的內(nèi)容參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)總體均值、均值差的檢驗(yàn)總體方差、方差比的檢驗(yàn)分布擬合檢驗(yàn)符號(hào)檢驗(yàn)秩和檢驗(yàn)假設(shè)檢驗(yàn)的理論依據(jù)第三十九頁,共五十三頁,編輯于2023年,星期日

引例1某產(chǎn)品的出廠檢驗(yàn)規(guī)定:次品率p不超過4%才能出廠.現(xiàn)從一萬件產(chǎn)品中任意抽查12件發(fā)現(xiàn)3件次品,問該批產(chǎn)品能否出廠?若抽查結(jié)果發(fā)現(xiàn)1件次品,問能否出廠?件,沒理由拒絕原假設(shè),從而接受原假設(shè),即該批產(chǎn)品可以出廠.解假設(shè)這是小概率事件,一般在一次試驗(yàn)中是不會(huì)發(fā)生的,現(xiàn)一次試驗(yàn)竟然發(fā)生,故可認(rèn)為原假設(shè)不成立,即該批產(chǎn)品次品率這不是小概率事,則該批產(chǎn)品不能出廠.第四十頁,共五十三頁,編輯于2023年,星期日若不采用假設(shè)檢驗(yàn),按理也不能夠出廠.注

直接算對(duì)總體要求利用樣本觀察值對(duì)提供的信息作出接受H0

(可出廠),還是接受H1

(不準(zhǔn)出廠)的判斷.上述出廠檢驗(yàn)問題的數(shù)學(xué)模型提出假設(shè)第四十一頁,共五十三頁,編輯于2023年,星期日

引例2

某廠生產(chǎn)的螺釘,按標(biāo)準(zhǔn)強(qiáng)度為68克/mm2,而實(shí)際生產(chǎn)的螺釘強(qiáng)度X服從N(,3.62).若E(X)==68,則認(rèn)為這批螺釘符合要求,否則認(rèn)為不符合要求.為此提出如下假設(shè):H0:=68H1:

68現(xiàn)從該廠生產(chǎn)的螺釘中抽取容量為36的樣本,其樣本均值為,問原假設(shè)是否正確?稱為原假設(shè)或零假設(shè).原假設(shè)的對(duì)立面:稱為備擇假設(shè).第四十二頁,共五十三頁,編輯于2023年,星期日若原假設(shè)正確,則故取較大值是小概率事件.因而,即偏離68不應(yīng)該太遠(yuǎn),偏離較遠(yuǎn)是小概率事件,由于第四十三頁,共五十三頁,編輯于2023年,星期日規(guī)定為小概率事件的概率大小,通常取=0.05,0.01,…例如,取=0.05,則因此,可以確定一個(gè)常數(shù)c,使得由第四十四頁,共五十三頁,編輯于2023年,星期日的取值區(qū)間(66.824,69.18)為檢驗(yàn)的接受域

(實(shí)際上沒理由拒絕),而區(qū)間現(xiàn)落入接受域,則接受原假設(shè)H0:=68.為檢驗(yàn)的拒絕域.稱(,66.824)與(69.18,+)由引例2可見,在給定的前提下,接受還是拒絕原假設(shè)完全取決于樣本值,因此所作檢驗(yàn)可能導(dǎo)致以下兩類錯(cuò)誤的產(chǎn)生:

第一類錯(cuò)誤棄真錯(cuò)誤第二類錯(cuò)誤取偽錯(cuò)誤第四十五頁,共五十三頁,編輯于2023年,星期日H0

為真H0

為假真實(shí)情況所作判斷接受H0拒絕H0正確正確第一類錯(cuò)誤(棄真)第二類錯(cuò)誤(取偽)假設(shè)檢驗(yàn)的兩類錯(cuò)誤犯第一類錯(cuò)誤的概率通常記為;犯第二類錯(cuò)誤的概率通常記為.第四十六頁,共五十三頁,編輯于2023年,星期日希望所用的檢驗(yàn)方法盡量少犯錯(cuò)誤,但不能完全排除犯錯(cuò)誤的可能性.理想的檢驗(yàn)方法應(yīng)使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論