第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識1_第1頁
第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識1_第2頁
第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識1_第3頁
第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識1_第4頁
第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識1_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)量經(jīng)濟(jì)學(xué)第一章統(tǒng)計(jì)學(xué)基礎(chǔ)知識(一)算術(shù)平均(arithmeticmean)就是我們?nèi)粘I钪兴褂玫钠胀ǖ钠骄鶖?shù),其定義式如下:式中,讀作X-ba,Σ讀作sigma,是希臘字母,與羅馬字母的S相當(dāng),是求和計(jì)算的符號。例題1-1表1-1表示的是2005年7個(gè)發(fā)達(dá)國家同亞洲新興工業(yè)國(地區(qū))(NIES)的實(shí)際GDP增長率和失業(yè)率。求各組中,(1)和(2)的算術(shù)平均數(shù)。國家(地區(qū))(1)實(shí)際GDP增長率(%)(2)失業(yè)率(%)7個(gè)發(fā)達(dá)國家日本美國英國德國法國意大利加拿大2.63.21.91.01.20.12.94.45.12.711.79.97.76.8亞洲新興工業(yè)國家(地區(qū))韓國中國臺灣中國香港新加坡中國大陸4.04.17.96.49.93.74.15.63.44.2表1-1實(shí)際GDP增長率和失業(yè)率(2005年)解答(1)(1)實(shí)際GDP增長率7個(gè)發(fā)達(dá)國家亞洲新興工業(yè)國家(地區(qū))解答(2)(2)失業(yè)率7個(gè)發(fā)達(dá)國家亞洲新興工業(yè)國家(地區(qū))加權(quán)算術(shù)平均(weightedarithmeticmean)是將各數(shù)據(jù)乘以反映其重要性的權(quán)數(shù)(w),再求平均的方法。其定義式如下:這里,權(quán)數(shù)的決定非常重要。例題1-2表1-2顯示了2006年3月日本關(guān)東1都6縣女高中生的大學(xué)錄取率和高中畢業(yè)人數(shù)。(1)求女高中生大學(xué)錄取率的算術(shù)平均數(shù);(2)求女高中生大學(xué)錄取率的加權(quán)算術(shù)平均數(shù)。都縣女高中生的大學(xué)錄取率(%)女高中生的畢業(yè)人數(shù)(百人)茨城櫪木群馬埼玉千葉東京神奈川47.150.448.050.348.062.154.614510592273248519316表1-2女高中生的大學(xué)錄取率和畢業(yè)人數(shù)(2006.3)解答(2)將女高中生畢業(yè)人數(shù)作為加權(quán)平均的權(quán)數(shù)(1)由此可見,加權(quán)算術(shù)平均數(shù)(54%)比算術(shù)平均數(shù)(51.5%)高2.5%。中位數(shù)(median)和眾數(shù)(mode)中位數(shù)(median)是指當(dāng)數(shù)據(jù)按大小順序排列時(shí),恰好屬于中間位置的數(shù)值;當(dāng)數(shù)據(jù)個(gè)數(shù)為偶數(shù)時(shí),取中間兩個(gè)數(shù)值的算術(shù)平值;簡稱Me。眾數(shù)(mode)指的是數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,也叫高頻直,與中位數(shù)一樣,它不受極端值的影響。但是,如果數(shù)據(jù)中沒有集中的趨勢,則無法計(jì)算眾數(shù),勉強(qiáng)計(jì)算也是沒有意義的;簡稱Mo。例題1-3根據(jù)下列數(shù)據(jù),求算術(shù)平均數(shù)、中位數(shù)、眾數(shù)。(1)1235557(2)244467845(3)1246791113解答可見算術(shù)平均值受極端值(45)影響很大(1)(2)由這個(gè)例子也可以看出,如果數(shù)據(jù)沒有集中趨勢,則無法計(jì)算眾數(shù)。(3)變化率定義式如下:例題1-4表1-3為日本2004年和2005年對8個(gè)主要出口對象國(地區(qū))的出口額。求日本對各國(地區(qū))的出口增長率。國家(地區(qū))2004年2005年美國中國大陸韓國中國臺灣中國香港泰國德國新加坡13737994794543832192051941481884515481397248206203表1-3日本對主要出口對象國(地區(qū))的出口額(單位:100億日元)解答可以看出,除了美國較為特殊,暫不考慮外,日本對亞洲新興工業(yè)國家和地區(qū)(韓國、中國臺灣、中國香港、新加坡)以及中國大陸的出口數(shù)額較大,而且增長較為顯著。幾何平均(geometricmean)是n個(gè)數(shù)據(jù)連乘積的n次方根。其定義式如下:需要注意的是,幾何平均數(shù)是有弱點(diǎn)的。數(shù)據(jù)中只要有一個(gè)為零,根就會變?yōu)榱?,幾何平均?shù)就無法計(jì)算。而且,如果數(shù)據(jù)中有負(fù)值也無法計(jì)算。例題1-5求下列各數(shù)據(jù)的幾何平均數(shù)(1)925(2)248(3)34618(4)36122448解答例題1-6表1-4顯示了日本實(shí)際國內(nèi)生產(chǎn)總值(實(shí)際GDP)的變化。(1)計(jì)算包括“神武景氣”和“巖戶景氣”在內(nèi)的1955-1961年的實(shí)際經(jīng)濟(jì)增長率(實(shí)際GDP的增長率);(2)計(jì)算1965-1970年,鋼鐵、汽車、機(jī)械等出口急劇增加,經(jīng)濟(jì)持續(xù)增長的所謂“伊杰諾”的實(shí)際經(jīng)濟(jì)增長率;(3)計(jì)算1987-1990年,以地價(jià)、股價(jià)飛漲為中心的景氣擴(kuò)張,即所謂的“泡沫”時(shí)期的實(shí)際經(jīng)濟(jì)增長率;(4)計(jì)算1991-2000年,“泡沫”崩潰以后,即所謂的“失去的十年”間的實(shí)際經(jīng)濟(jì)增長率。表1-4日本的實(shí)際國內(nèi)生產(chǎn)總值(實(shí)際GDP)的變化(單位:兆日元)年度實(shí)際GDP年度實(shí)際GDP年度實(shí)際GDP195519561957195819591960196119621963196419651966196719681969197047.951.054.958.965.573.582.188.397.5106.8113.4125.9139.8157.1175.9190.41971197219731974197519761977197819791980198119821983198419851986200.1218.2229.3228.2237.3246.3257.4271.3285.3292.7301.5310.8318.7331.8345.4356.319871988198919901991199219931994199519961997199819992000373.2395.5413.1436.1449.8451.4452.5454.6469.4485.7486.8483.0492.1500.3提示跨越數(shù)年的平均變化率的計(jì)算方法現(xiàn)假設(shè)Y從0期到n期,按照同樣的變化率g變化,則解答(1)根據(jù)公式,計(jì)算1955-1961年6年間的實(shí)際經(jīng)濟(jì)增長率:解答(2)根據(jù)公式,計(jì)算1965-1970年5年間的實(shí)際經(jīng)濟(jì)增長率:解答(3)根據(jù)公式,計(jì)算1987-1990年3年間的實(shí)際經(jīng)濟(jì)增長率:解答(4)根據(jù)公式,計(jì)算1991-2000年9年間的實(shí)際經(jīng)濟(jì)增長率:移動平均(movingaverage)所謂移動平均,就是對時(shí)間序列數(shù)據(jù)中前后數(shù)據(jù)求平均,將不必要的變動(循環(huán)變動、季節(jié)變動和不規(guī)則變動)平滑化(smoothing),即剔除這些變動,從而發(fā)現(xiàn)長期變化方向的一種方法。每隔3個(gè)月的季度數(shù)據(jù)(quarterlydata)、每個(gè)月的月度數(shù)據(jù)(monthlydata)中存在著季度和月份中固有變化的影響,利用移動平均可以消除這些季節(jié)變動,有助于理解長期變化趨勢。同樣,循環(huán)變動和不規(guī)則變動也可以通過移動平均來消除,計(jì)算平滑的長期變動。通常,移動平均大多用簡單的奇數(shù)項(xiàng)來計(jì)算,下面是3項(xiàng)移動平均和5項(xiàng)移動平均的定義。3項(xiàng)移動平均5項(xiàng)移動平均時(shí)間序列數(shù)據(jù)Xt-2Xt-1XtXt+1Xt+22項(xiàng)移動平均4項(xiàng)移動平均中心化4項(xiàng)移動平均注:在偶數(shù)項(xiàng)季節(jié)數(shù)據(jù)的情況下,首先計(jì)算兩個(gè)4項(xiàng)移動平均,然后再計(jì)算這2項(xiàng)移動平均。這種方法稱作移動平均的中心化,即中心化4項(xiàng)移動平均。同樣,由于月度數(shù)據(jù)也是偶數(shù)項(xiàng),因而稱作中心化12項(xiàng)移動平均。此外,在選定移動平均的項(xiàng)數(shù)時(shí),如果事先已經(jīng)知道類似于下圖這樣的周期(period),一般要使項(xiàng)數(shù)與周期相一致。周期周期=項(xiàng)數(shù)例題1-7表1-8顯示了2000年第1季度到2005年第4季度,日本全國百貨店的銷售額。求中心化4項(xiàng)移動平均,并且與原數(shù)列一道畫出圖形。年、季百貨店?duì)I業(yè)額年、季百貨店?duì)I業(yè)額2000年第1季度第2季度第3季度第4季度2422352362892003年第1季度第2季度第3季度第4季度2212152142602001年第1季度第2季度第3季度第4季度2312282272772004年第1季度第2季度第3季度第4季度2192092072502002年第1季度第2季度第3季度第4季度2262222212672005年第1季度第2季度第3季度第4季度212206206252表1-8百貨店銷售額(日本全國)(單位:100億日元)解答年、季中心化4項(xiàng)移動平均年、季中心化4項(xiàng)移動平均年、季中心化4項(xiàng)移動平均2000年第1季度第2季度第3季度第4季度――249.1246.92002年第1季度第2季度第3季度第4季度237.3235.3233.4231.92004年第1季度第2季度第3季度第4季度224.6222.5220.4219.12001年第1季度第2季度第3季度第4季度244.9242.3240.1238.82003年第1季度第2季度第3季度第4季度230.1228.4227.3226.32005年第1季度第2季度第3季度第4季度218.6218.8――表1-9百貨店銷售額(日本全國)的中心化4項(xiàng)移動平均(單位:100億日元)極差(range)是數(shù)據(jù)最大值Xmax與最小值Xmin之差,定義如下:極差=Xmax-Xmin極差的計(jì)算雖然簡單,但缺點(diǎn)是容易受數(shù)據(jù)的極端值(異常值)的影響。四分位極差將數(shù)據(jù)從小到大按順序排列時(shí),最初的1/4位置的值稱為第1四分位數(shù)Q1(25%點(diǎn),fristquartile),1/2位置的值稱為第2四分位數(shù)Q2(50%點(diǎn),secondquartile),最后的3/4位置的值稱為第3四分位數(shù)Q3(75%點(diǎn),thirdquartile)。四分位極差(interquartilerange)與四分位離差(quartiledeviation)可以定義如下:四分位極差=第3四分位數(shù)Q3-第1四分位數(shù)Q1四分位離差=(第3四分位數(shù)Q3-第1四分位數(shù)Q1)/2可見,四分位極差是一種既容易理解,也容易計(jì)算的離散指標(biāo),而且它還有一個(gè)優(yōu)點(diǎn),即不太容易受極端數(shù)值的影響。25%25%25%25%Q2Q1Q3(=Me)

四分位極差=Q3-Q1補(bǔ)充這里介紹一種計(jì)算第1四分位點(diǎn)Q1與第3四分位點(diǎn)Q3的簡單方法。當(dāng)樣本量較多時(shí),這種方法特別方便。Q1的位次=(n-1)/4Q3的位次=3(n+1)/4注意,在不同的統(tǒng)計(jì)軟件和教科書中,Q1和Q3的定義可能略有差異。方差(variance)與標(biāo)準(zhǔn)差(standarddeviation)方差s2與標(biāo)準(zhǔn)差s的定義分別如下:方差的計(jì)算方法是,先將每個(gè)數(shù)據(jù)與算術(shù)平均數(shù)的差,即離差的平方相加求和,再除以樣本數(shù)減一。而標(biāo)準(zhǔn)差是求方差的正的平方根。由于方差是通過平方計(jì)算的,故而它與原數(shù)據(jù)的次數(shù)有所不同,而標(biāo)準(zhǔn)差由于是方差的平方根,因而與原數(shù)據(jù)的次數(shù)相同。因此,標(biāo)準(zhǔn)差與原數(shù)據(jù)的單位相同,而方差不附加單位。又稱為離差平方和。方差與標(biāo)準(zhǔn)差越大,意味著數(shù)據(jù)的分散程度越大;相反,方差與標(biāo)準(zhǔn)差越小,則意味著數(shù)據(jù)的分散程度越小,即向平均值(算術(shù)平均)的集中程度越高。正態(tài)分布(normaldistribution):以算術(shù)平均值X為中心,左右取1s范圍,這一部分包含68.3%的數(shù)據(jù);同樣,取2s范圍,包含95.4%的數(shù)據(jù);再取3s范圍,包含99.7%的數(shù)據(jù)(這種性質(zhì)稱為“經(jīng)驗(yàn)法則”(empiricalrule))。下圖顯示了標(biāo)準(zhǔn)差的大小與所含數(shù)據(jù)比例的對應(yīng)關(guān)系。正態(tài)分布中標(biāo)準(zhǔn)差與其相應(yīng)的范圍中所含數(shù)據(jù)的比例XX+sX+2sX+3sX-sX-2sX-3s68.3%95.4%99.7%補(bǔ)充前面兩個(gè)式子,是給定數(shù)據(jù)樣本時(shí)的方差(樣本方差)和標(biāo)準(zhǔn)差(樣本標(biāo)準(zhǔn)差)。另一方面,總體數(shù)據(jù)的方差(總體方差)σ2和標(biāo)準(zhǔn)差(總體標(biāo)準(zhǔn)差)σ(小寫,讀作sigma),應(yīng)定義如下:變動系數(shù)(coefficientofvariation)又稱變異系數(shù),它是用標(biāo)準(zhǔn)差除以算術(shù)平均數(shù)的商來表示。變動系數(shù)CV的定義如下:一般地,變動系數(shù)要求所使用的數(shù)據(jù)均為正數(shù),而且,算出的數(shù)值要按百分比形式來表示。此外,如果算術(shù)平均數(shù)為零或接近于零,變動系數(shù)無法計(jì)算,或者說,變動系數(shù)成為一種曖昧的尺度,因此,這種情況也是需要加以注意的。偏態(tài)(skewness)是對數(shù)據(jù)的分布偏斜方向和程度的測度指標(biāo)。其計(jì)算公式如下:當(dāng)數(shù)據(jù)的分布以算術(shù)平均為中心左右對城時(shí),偏態(tài)為0(但是,即使偏態(tài)為0,偶爾也有做有不對稱的時(shí)候)。當(dāng)分布的尾巴向右延伸時(shí)(右偏),偏態(tài)>0,向左延伸時(shí)(左偏),偏態(tài)<0.正態(tài)分布的偏態(tài)為0.①右偏(偏態(tài)>0)②對稱(偏態(tài)=0)③左偏(偏態(tài)<0)分布的偏態(tài)(非對稱性)峰度(kurtosis)是反映分布的集中趨勢高峰形狀(對數(shù)據(jù)算術(shù)平均的集中度)的指標(biāo),定義式如下:當(dāng)峰度為0時(shí),數(shù)據(jù)的分布與正態(tài)分布的集中程度相同,稱為中峰。當(dāng)峰度>0時(shí),比正態(tài)分布更尖(而且分布的尾巴更厚,數(shù)據(jù)有可能落在分布之外),稱為急峰。當(dāng)峰度<0時(shí),比正態(tài)分布的形狀緩和(分布的尾巴較薄,數(shù)據(jù)落在分布之外的可能性較小),稱為緩峰。①急峰(峰度>0)②中峰(峰度=0)③緩峰(峰度<0)比正態(tài)分布更尖與正態(tài)分布相同比正態(tài)分布更緩峰度補(bǔ)充對于標(biāo)準(zhǔn)的統(tǒng)計(jì)教材上的偏態(tài)式與峰度式一般是這樣定義的:其中,n為樣本數(shù),σ為總體標(biāo)準(zhǔn)差,X為數(shù)據(jù),X-ba為數(shù)據(jù)的算術(shù)平均。但是峰度是以3為基準(zhǔn)的判斷,即峰度=3時(shí)為中峰,峰度>3時(shí)為急峰,峰度<3時(shí)為緩峰。例題1-8表1-14顯示的是東京(千代田區(qū)大手町)年下雪天數(shù)。(1)求算術(shù)平均和標(biāo)準(zhǔn)差(2)求偏態(tài)(3)求峰度年度下雪天數(shù)年度下雪天數(shù)19891990199119921993199419951996199741031089512319981999200020012002200320042005115713510714表1-14東京年下雪天數(shù)(單位:天)解答將數(shù)據(jù)帶入工作表,進(jìn)行計(jì)算(見下表)XX-Xba(X-Xba)2(X-Xba)3(X-Xba)44103108951231157-42-5201-34-53-3-11642540191625991-648-125801-2764-12527-27-12561662516018125662581811續(xù)前表XX-Xba(X-Xba)2(X-Xba)3(X-Xba)4135107145-32-162594136125-278-12166258116112961360194604058∑X∑(X-Xba)∑(X-Xba)2∑(X-Xba)3∑(X-Xba)4(2)偏態(tài)接近于0,說明東京年下雪天數(shù)近似服從左右對稱分布。(3)峰度為負(fù),說明東京年下雪天數(shù)的分布,比正態(tài)分布更緩和,數(shù)據(jù)遺漏的可能性較小。標(biāo)準(zhǔn)化變量(standardizedvariable)又稱基準(zhǔn)化變量,它是用來測度某個(gè)數(shù)據(jù)的數(shù)值與算術(shù)平均的偏離程度是標(biāo)準(zhǔn)差的多少倍。借此可以看出該數(shù)據(jù)值在全體數(shù)據(jù)中所處的位置。其定義式如下:通過上式進(jìn)行標(biāo)準(zhǔn)化(基準(zhǔn)化),不管什么樣的數(shù)據(jù),由于算術(shù)平均可以轉(zhuǎn)換為零,方差和標(biāo)準(zhǔn)差分別可以轉(zhuǎn)換為1,因此具有不同的算術(shù)平均的數(shù)據(jù)組,可以進(jìn)行相互比較。補(bǔ)充日本大學(xué)的入學(xué)模擬考試在公布相對的成績時(shí),通常利用偏差值,這種偏差值實(shí)際上就是標(biāo)準(zhǔn)化變量的一種應(yīng)用,其公式如下:可見,這里的偏差值就是設(shè)算術(shù)平均為50,標(biāo)準(zhǔn)差為10,來顯示分?jǐn)?shù)的分布狀況的。同樣,智商指數(shù)(IQ)也是標(biāo)準(zhǔn)化變量的應(yīng)用,它顯示的是算術(shù)平均為100,標(biāo)準(zhǔn)差為15時(shí)分?jǐn)?shù)的分布狀況。智商指數(shù)的定義式如下:下圖在正態(tài)分布的假設(shè)下,顯示了偏差值、智商指數(shù)和算術(shù)平均、標(biāo)準(zhǔn)差之間的相互關(guān)系。偏差值20304050607080智商指數(shù)557085100115130145標(biāo)準(zhǔn)差的范圍-3s-2s-s0s2s3s偏差值與智商指數(shù)例題1-9經(jīng)濟(jì)系的A君,在期末必修考試中,宏觀經(jīng)濟(jì)學(xué)得82分,微觀經(jīng)濟(jì)學(xué)得69分。宏觀經(jīng)濟(jì)學(xué)的平均成績是72分,標(biāo)準(zhǔn)差是8,微觀經(jīng)濟(jì)學(xué)的平均成績是61分,標(biāo)準(zhǔn)差是5。(1)計(jì)算標(biāo)準(zhǔn)化變量,并回答A君的宏觀經(jīng)濟(jì)學(xué)與微觀經(jīng)濟(jì)學(xué)哪一個(gè)更靠前?(2)求A君宏觀經(jīng)濟(jì)學(xué)和微觀經(jīng)濟(jì)學(xué)的偏差值。解答(1)根據(jù)公式計(jì)算標(biāo)準(zhǔn)化變量z,宏觀經(jīng)濟(jì)學(xué)為:微觀經(jīng)濟(jì)學(xué)為:由于微觀經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)化變量比宏觀經(jīng)濟(jì)學(xué)院大,因此,A君的微觀經(jīng)濟(jì)學(xué)成績處于上等。解答(2)根據(jù)公式計(jì)算偏差值,宏觀經(jīng)濟(jì)學(xué)為:偏差值=50+z×10=50+1.25×10=62.5微觀經(jīng)濟(jì)學(xué)為:偏差值=50+z×10=50+1.60×10=66.0從偏差值的比較中可以看出,A君的微觀經(jīng)濟(jì)學(xué)的成績相對來說要好一些。相關(guān)系數(shù)(correlationcoefficient)是用來測量身高和體重、收入與消費(fèi)、營業(yè)額與利潤、氣溫和啤酒的消費(fèi)量等兩個(gè)變量X、Y之間相互關(guān)系的大小和方向(正或負(fù))的。通過計(jì)算相關(guān)系數(shù),可以知道X和Y之間具有多大程度的線性關(guān)系。其定義式如下:相關(guān)系數(shù)R的取值范圍為:-1≤R≤1,R的取值具有以下幾種不同的含義:1)R=1:完全正相關(guān)(perfectcorrelation)2)R>0:正相關(guān)(positivecorrelation)3)R=0:不相關(guān)(nocorrelation)4)R<0:負(fù)相關(guān)(negativecorrelation)5)R=-1:完全負(fù)相關(guān)(perfectcorrelation)Y0X(1)R=1Y0X(2)0<R<1Y0X(4)-1<R<0Y0X(5)R=-1Y0X(3)R=0相關(guān)系數(shù)與散點(diǎn)圖相關(guān)系數(shù)的檢驗(yàn)相關(guān)系數(shù)越大,兩個(gè)變量之間越有顯著的相關(guān)關(guān)系;自由度,即樣本數(shù)-2(n-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論