應(yīng)用統(tǒng)計(jì)學(xué)總復(fù)習(xí)_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)總復(fù)習(xí)_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)總復(fù)習(xí)_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)總復(fù)習(xí)_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)總復(fù)習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《應(yīng)用統(tǒng)計(jì)學(xué)(1)》

總復(fù)習(xí)課程主要內(nèi)容1.為什么要學(xué)習(xí)統(tǒng)計(jì)學(xué)——用數(shù)據(jù)說(shuō)話

2.描述性統(tǒng)計(jì)(可視化)

3.匯總統(tǒng)計(jì)(集中趨勢(shì)、離散趨勢(shì))

4.相關(guān)分析與回歸分析初步

5.時(shí)間序列分析

6.指數(shù)一、數(shù)據(jù)的分布中心(集中趨勢(shì))1.

中位數(shù)

(Median):x1

x2…xn

處于中間的位置觀測(cè)值。2.眾數(shù)(Mode):出現(xiàn)頻次最多的觀測(cè)值3.均值(Mean):第一章統(tǒng)計(jì)數(shù)據(jù)的匯總統(tǒng)計(jì)比較:均值、中位數(shù)、眾數(shù)應(yīng)用建議:(1)對(duì)于名義變量,描述集中趨勢(shì)的辦法是:(2)對(duì)于順序變量,描述集中趨勢(shì)的最常用的辦法是:(3)對(duì)于定量變量,一般使用平均值。

但當(dāng)數(shù)據(jù)的直方圖顯示出是非對(duì)稱(偏斜)分布時(shí),常常使用中位數(shù)。

眾數(shù)中位數(shù)二、數(shù)據(jù)離散程度的測(cè)量

1、極差(Rang)2、方差(Variance)總體方差:樣本方差:3、標(biāo)準(zhǔn)差(StandardDeviation)

Excel是用樣本方差例題:某車間有甲、乙兩人,加工某零件質(zhì)量質(zhì)量數(shù)據(jù):直徑(mm)

甲:0.7,0.7,0.8,0.8,0.8,0.8,1.0,1.1眾數(shù)=0.8,中位數(shù)=0.8,均值=0.8375

乙:0.4,0.5,0.7,0.8,0.8,0.9,1.2,1.4眾數(shù)=0.8,中位數(shù)=0.8,均值=0.8375問(wèn)題:誰(shuí)是師傅?Excel計(jì)算過(guò)程:平均值總體方差樣本方差另一種方差計(jì)算方法方差計(jì)算方法其他擴(kuò)展內(nèi)容2、離散系數(shù)(CoefficientofVariation)1.四分位極差(InterquartileRang)3、異眾比(VariationRatio):四分位極差=Q3-Q1定性數(shù)據(jù)離散程度的度量三、數(shù)據(jù)的標(biāo)準(zhǔn)化處理:1.中心化——壓縮性質(zhì):

均值為0

方差等于12.消除均值的作用性質(zhì):

均值恒等于13.Max-min標(biāo)準(zhǔn)化

離散系數(shù)四.數(shù)據(jù)的標(biāo)準(zhǔn)得分(改成要求內(nèi)容)Chebyshev定理:令c

為任意大于1的數(shù)值。對(duì)于任意分布的數(shù)據(jù)集合,在(

-c

,

+c

)區(qū)間內(nèi),所包含的觀測(cè)值比例至少是(1-1/c2)。當(dāng):c=2:(1-1/c2)=75%c=3:(1-1/c2)=89%

c=4:(1-1/c2)=93%經(jīng)驗(yàn)規(guī)則:對(duì)于近似鐘形分布的總體或樣本分布,在(

-

,+

)區(qū)間,有68%在(

-2

,+2

)區(qū)間,有95%(>75%)在(

-3

,+3

)區(qū)間,有99.7%(>89%)的觀測(cè)值將落入該區(qū)間內(nèi)。

如果員工工資呈鐘形對(duì)稱分布,至少95%的員工工資在以下的區(qū)間內(nèi):(1266.47,1986.91)數(shù)據(jù)的標(biāo)準(zhǔn)得分:Zscore:對(duì)于總體數(shù)據(jù):

Z=(X-

)/

例:某中學(xué)高三年級(jí)連續(xù)兩次考試的平均成績(jī)分別為78.53分和70.19分,標(biāo)準(zhǔn)差分別為9.43分和7分。某學(xué)生兩次考試的成績(jī)分別為90分和82分。問(wèn)他在年級(jí)的排名退步了嗎?(90–78.53)/9.43=1.22(82–70.19)/7=1.69問(wèn)題:如果年級(jí)共有500人,可否大致判斷他的排名不低于多少?拓展內(nèi)容:

數(shù)據(jù)分布的偏度與峰度偏態(tài)系數(shù)(coefficientofskewness):基本思想:使用數(shù)據(jù)集合的“三階中心矩”峰度系數(shù)(coefficientofkurtosis)Ku:某一數(shù)據(jù)分布與正態(tài)分布相比的尖峰程度或平坦程度Sk=0對(duì)稱分布Sk>0

右偏Sk<0左偏Ku=0正態(tài)分布Ku>0尖峰Ku<0扁平

第四章相關(guān)分析與回歸分析初步

一、Pearson相關(guān)系數(shù)記(1)-1

r1(2)0<r1:正線性相關(guān)(3)-1

r<0:負(fù)線性相關(guān)(4)r=0:線性無(wú)關(guān)(5)r=1:完全正線性相關(guān)(6)r=-1:完全負(fù)線性相關(guān)二、Spearman秩相關(guān)系數(shù)(拓展內(nèi)容)三、線性回歸模型一、最小二乘法1、多元回歸方程殘差平方和(SumofSquaresforError)2、模型的評(píng)價(jià)復(fù)測(cè)定系數(shù)(CoefficientofMultipleDetermination)問(wèn)題:測(cè)定系數(shù)是否越大越好?

當(dāng)增加變量個(gè)數(shù),而樣本容量過(guò)小時(shí),會(huì)出現(xiàn)過(guò)度擬和現(xiàn)象。

線性回歸模型預(yù)測(cè)點(diǎn)Oyx多項(xiàng)式模型預(yù)測(cè)點(diǎn)新數(shù)據(jù)點(diǎn)調(diào)整的測(cè)定系數(shù)(AdjustedCoefficientofDetermination)

3、假設(shè)檢驗(yàn)

(1)F-test:在

Y

X1,X2,…,Xk

之間是否存在線性關(guān)系

(2)

t–檢驗(yàn)

Xj

在解釋Y時(shí)是否是一個(gè)有用的變量?當(dāng)SignificanceF<0.05時(shí),F(xiàn)檢驗(yàn)通過(guò)。當(dāng)P-value<0.05時(shí),t檢驗(yàn)通過(guò)例題:

某商業(yè)銀行25家分行2002年的主要業(yè)務(wù)數(shù)據(jù)4、變量篩選方法向后篩選法(BackwardElimination)1)起始:所有自變量X1~Xk均包含在模型中;如果t-test都顯著,則X1~Xk均包含在模型中;如果存在若干t-test不通過(guò)的參數(shù),則先把P值最大的變量刪除。2)對(duì)剩余的(k-1)個(gè)變量做回歸方程,刪除t-test不通過(guò)中,P值最大的變量;3)重復(fù)以上步驟。直到模型中所以變量均通過(guò)t-test。曲線回歸(拓展問(wèn)題)

可以對(duì)方程做變換:原方程變換為多元線性模型:(一)時(shí)間數(shù)列的概念將某一統(tǒng)計(jì)指標(biāo)按時(shí)間順序排列起來(lái),用于分析社會(huì)經(jīng)濟(jì)現(xiàn)象發(fā)展變動(dòng)的數(shù)量規(guī)律。例1:1990~1998國(guó)內(nèi)生產(chǎn)總值等時(shí)間序列絕對(duì)數(shù)絕對(duì)數(shù)相對(duì)數(shù)平均數(shù)時(shí)期數(shù)時(shí)點(diǎn)數(shù)第五章時(shí)間序列分析5.2時(shí)間數(shù)列的分析指標(biāo)

在利用時(shí)間數(shù)列描述現(xiàn)象動(dòng)態(tài)發(fā)展過(guò)程時(shí),可以運(yùn)用一系列分析指標(biāo):發(fā)展水平、平均發(fā)展水平增長(zhǎng)量、平均增長(zhǎng)量發(fā)展速度、平均發(fā)展速度增長(zhǎng)率、平均增長(zhǎng)率水平速度一、發(fā)展水平

例如:各時(shí)期工業(yè)增加值a0,

a1,a2,,an

年份工業(yè)增加值(億元)200025394.9200128329.4200232994.8200341990.2200454805.1200572187.0200691075.72007117048.42008129112.0反映社會(huì)經(jīng)濟(jì)現(xiàn)象在不同時(shí)期的規(guī)模水平基期水平:

在動(dòng)態(tài)對(duì)比時(shí)作為基準(zhǔn)期的水平(a0)報(bào)告期水平:

所要分析時(shí)期的水平(an)n=8一共有9個(gè)數(shù)二.平均發(fā)展水平:

1.時(shí)期數(shù)列其中:序時(shí)平均數(shù)

n+1時(shí)期數(shù)

at

t時(shí)期的發(fā)展水平例:計(jì)算1990~1998年各年度的平均國(guó)內(nèi)生產(chǎn)總值a0,a1,a2,,an

對(duì)不同時(shí)期的發(fā)展水平求平均數(shù)(序時(shí)平均數(shù))2、時(shí)點(diǎn)數(shù)列:計(jì)算1994--1998年中國(guó)第三產(chǎn)業(yè)GDP占全部GDP的平均比重.3.相對(duì)數(shù)或平均數(shù)的序時(shí)平均數(shù)案例:中航工業(yè)規(guī)劃建設(shè)公司

技術(shù)人員占公司人員總數(shù)的平均比重(相對(duì)數(shù)的平均值)計(jì)算1~11月技術(shù)人員占公司人員總數(shù)的平均比重。問(wèn)題:能否直接計(jì)算“比重(%)”的平均值?如何計(jì)算“平均比重”?“公司的人員數(shù)”是時(shí)期數(shù)還是時(shí)點(diǎn)數(shù)?計(jì)算全公司的人均產(chǎn)值(平均數(shù)的平均值)51.56=(49.98+73.74+69.46+63.76+33.66+70.26+10.46+41.20)/850.51=44886/888.68

對(duì)于平均數(shù),不能在每個(gè)單位人均數(shù)的基礎(chǔ)上直接求總數(shù)平均,而是要把產(chǎn)值和人數(shù)分別相加再求總數(shù)的平均。三.增長(zhǎng)量

增長(zhǎng)量=報(bào)告期水平-基期水平

描述現(xiàn)象在觀察期內(nèi)增長(zhǎng)的絕對(duì)數(shù)量由于采用的基期不同,可以分成1.逐期增長(zhǎng)量=報(bào)告期水平-前期水平2.累計(jì)增長(zhǎng)量=報(bào)告期水平-固定基期水平逐期增長(zhǎng)量累計(jì)增長(zhǎng)量累計(jì)增長(zhǎng)量=逐期增長(zhǎng)量之和3.平均增長(zhǎng)量

現(xiàn)象在觀察期內(nèi)平均增長(zhǎng)的數(shù)量例:中國(guó)1983~1987年糧食產(chǎn)量a0,

a1,,an四.發(fā)展速度用于描述現(xiàn)象在觀察期內(nèi)相對(duì)的發(fā)展變化程度.由于采用的基期不同,可以分為:定基發(fā)展速度:

在n

期內(nèi)總的發(fā)展變化情況2.

環(huán)比發(fā)展速度:

與上期相比,發(fā)展變化的程度3.

同比發(fā)展速度:

與上年同期相比,發(fā)展變化情況a0,

a1,,an年份不變價(jià)GDP(1990年億元)環(huán)比速度at/at-1定基速度定基速度an/a0不變價(jià)GDP199018547.9

(a0)10010018547.9199120250.4109.18109.18109.1820250.4199223134.2114.24124.73124.7323134.2199326364.7113.96142.14142.1426364.73199429813.4113.08160.74160.7429813.42199533070.5110.92178.3178.333070.53199636380.4110.01196.14196.1436380.4199739762.7109.3214.38214.3839762.7199842877.4107.83231.17231.1742877.45199946144.6107.62248.79248.7946144.64200050035.2108.43269.76269.7650035.22環(huán)比速度、定基速度、不變價(jià)GDP之間的換算換算關(guān)系:當(dāng)期定基速度=當(dāng)期環(huán)比速度上期定基速當(dāng)期不變價(jià)GDP(1990年億元)=當(dāng)期定基速度

1990現(xiàn)價(jià)GDP五.增長(zhǎng)率說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象的增長(zhǎng)程度2.環(huán)比增長(zhǎng)率1.定基增長(zhǎng)率3.同比增長(zhǎng)率a0,

a1,,an六.平均發(fā)展速度

表示在一段較長(zhǎng)時(shí)間內(nèi),平均發(fā)展變化的程度.發(fā)展速度的平均值以a0為基期水平,以平均發(fā)展速度發(fā)展到n

期后的水平,正好等于an。七.平均增長(zhǎng)率

說(shuō)明某種社會(huì)經(jīng)濟(jì)現(xiàn)象在一個(gè)較長(zhǎng)時(shí)期內(nèi),逐期遞增的平均速度.計(jì)算公式:平均增長(zhǎng)率=平均發(fā)展速度-1(類比:增長(zhǎng)率=發(fā)展速度-1)練習(xí)

某企業(yè)2005年的銷售額為2000萬(wàn)元。計(jì)劃2010年的銷售額達(dá)到5000萬(wàn)元。求:(1)每年應(yīng)按怎樣的增長(zhǎng)速度進(jìn)行生產(chǎn),才能達(dá)到預(yù)定的計(jì)劃指標(biāo)?(2)若希望提前兩年完成計(jì)劃,則每年增長(zhǎng)速度應(yīng)較原來(lái)提高多少?(3)如果按新的增長(zhǎng)速度持續(xù)生產(chǎn),到2010年該企業(yè)的銷售額應(yīng)為多少?6.1指數(shù)的概念指數(shù)(indexnumber):用于測(cè)量社會(huì)經(jīng)濟(jì)現(xiàn)象總體在不同時(shí)間和空間綜合變動(dòng)的一種相對(duì)數(shù)。①相對(duì)性:指數(shù)是一種相對(duì)數(shù),可以用于在不同的時(shí)間和空間,對(duì)總體情況進(jìn)行對(duì)比。②綜合性:指數(shù)可以在不同時(shí)間和空間,反映一組變量的綜合變動(dòng)水平。③平均性:指數(shù)可以代表總體的平均水平。第六章指數(shù)概述

個(gè)體指數(shù)(simpleindex):

是反映個(gè)體社會(huì)經(jīng)濟(jì)現(xiàn)象變動(dòng)的相對(duì)數(shù)。例如:一種商品的價(jià)格指數(shù)、一種產(chǎn)品的產(chǎn)量指數(shù)、一種商品的成本指數(shù)。

通常是建立在一個(gè)時(shí)間序列變量基礎(chǔ)上的指數(shù),反映了一個(gè)時(shí)間序列變量相對(duì)于基期的百分變動(dòng)。

計(jì)算方法:①選擇基期(t0):計(jì)算價(jià)格指數(shù)時(shí),通常經(jīng)濟(jì)學(xué)家選擇價(jià)格水平“正?!睍r(shí)期為基期。②計(jì)算第t期時(shí)間序列變量的簡(jiǎn)單指數(shù)it6.2個(gè)體指數(shù)的編制方法例:計(jì)算1971—1993年黃金價(jià)格的簡(jiǎn)單指數(shù)(1972年=100)1971年的金價(jià)指數(shù)為70.38,表明1971年黃金價(jià)格是1972年價(jià)格的70.38%;1987年的黃金價(jià)指數(shù)為697.68,表明1987年黃金價(jià)格是1972年價(jià)格的697.68%,或者說(shuō)1987年價(jià)格相對(duì)1972年上漲了597.68%.6.3簡(jiǎn)單綜合指數(shù)

(simplecompositeindex)“簡(jiǎn)單綜合指數(shù)”的計(jì)算方法:①選擇基期(t0)②計(jì)算第t期的簡(jiǎn)單綜合指數(shù)It綜合指數(shù)(compositeindex):是反映經(jīng)濟(jì)現(xiàn)象在不同時(shí)期上的綜合變動(dòng)的相對(duì)數(shù)。如商品零售價(jià)格指數(shù)、居民消費(fèi)價(jià)格指數(shù)和股票價(jià)格指數(shù)。涉及到多個(gè)時(shí)間序列的變量例:1986—1991年美國(guó)城市居民在食品、交通和醫(yī)療方面的年度個(gè)人消費(fèi)支出(以10億美元為單位)。試以基期t0

=1980年計(jì)算這三項(xiàng)總年度開支的簡(jiǎn)單綜合指數(shù)。

1991年的指數(shù)為149.3%,表示美國(guó)城市居民在食品、交通、醫(yī)療三個(gè)方面的年度總支出與基期1980年相比增加了49.3%。6.4加權(quán)綜合指數(shù)

(weightedcompositeindex)加權(quán)綜合指數(shù):多個(gè)時(shí)間序列變量依據(jù)重要程度,對(duì)各個(gè)變量賦予不同的權(quán)重計(jì)算方法:①選擇基期(t0);②選擇權(quán)重:反映每個(gè)變量的相對(duì)重要性(比如,對(duì)于價(jià)格指數(shù),權(quán)值應(yīng)為相應(yīng)的消費(fèi)量)③計(jì)算第t期的加權(quán)綜合指數(shù)It—先加權(quán)綜合,后對(duì)比(1)拉氏指數(shù)—基期加權(quán)綜合指數(shù)問(wèn)題:如何計(jì)算多產(chǎn)品銷售量的綜合指數(shù)?

在實(shí)際應(yīng)用時(shí),大多數(shù)用于反映社會(huì)經(jīng)濟(jì)現(xiàn)象總體的規(guī)模、水平的數(shù)量指數(shù)(例如:商品銷售量指數(shù)、產(chǎn)品產(chǎn)量指數(shù),等等)采用拉氏指數(shù)計(jì)算方法。采用基期價(jià)格例:計(jì)算以下5種商品的拉氏銷售量指數(shù)(按基期不變價(jià))

結(jié)果表明:5種商品綜合起來(lái),其銷售量平均增長(zhǎng)了8.97%。由于銷售量增長(zhǎng)8

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論