現(xiàn)代統(tǒng)計(jì)方法--回歸分析1_第1頁
現(xiàn)代統(tǒng)計(jì)方法--回歸分析1_第2頁
現(xiàn)代統(tǒng)計(jì)方法--回歸分析1_第3頁
現(xiàn)代統(tǒng)計(jì)方法--回歸分析1_第4頁
現(xiàn)代統(tǒng)計(jì)方法--回歸分析1_第5頁
已閱讀5頁,還剩114頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、現(xiàn)代統(tǒng)計(jì)方法現(xiàn)代統(tǒng)計(jì)方法前言 統(tǒng)計(jì)學(xué)的幾個(gè)問題1、自1969年設(shè)立諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)以來,已有42名學(xué)者獲獎(jiǎng),而其中有2/3的人是統(tǒng)計(jì)學(xué)家、計(jì)量經(jīng)濟(jì)學(xué)家、數(shù)學(xué)家。2、目前的研究趨勢(shì)是:從一般的邏輯推理發(fā)展到重視實(shí)證研究;從理論論述發(fā)展到數(shù)量研究。3、碩士和博士的學(xué)位論文,如果沒有數(shù)量模型和分析,其文章的水平會(huì)有問題。統(tǒng)計(jì)學(xué)的幾個(gè)問題n李懷祖在管理學(xué)研究方法論中提到大量的統(tǒng)計(jì)研究方法:n描述統(tǒng)計(jì)n推斷統(tǒng)計(jì)n結(jié)構(gòu)方程建模n評(píng)估研究SEM(Structural Equation Modellingx1x2x3x4x5x6x712312y1y2y3y41432x11x21x31x32x42x52x63x7

2、331213212r11r12r22r2312y11y11y32y42現(xiàn)代統(tǒng)計(jì)方法的種類一、分類分析方法: 1、聚類分析 2、判別分析 3、定性資料分析二、結(jié)構(gòu)簡(jiǎn)化方法: 1、回歸選元法 2、聚類分析 3、主成分分析 4、因子分析 5、對(duì)應(yīng)分析現(xiàn)代統(tǒng)計(jì)方法的種類三、相關(guān)分析方法1、定性資料分析2、回歸分析3、典型相關(guān)分析4、主成分分析5、因子分析6、對(duì)應(yīng)分析現(xiàn)代統(tǒng)計(jì)方法的種類四、預(yù)測(cè)決策方法:1、回歸分析2、判別分析3、定性資料分析4、聚類分析統(tǒng)計(jì)分析方法應(yīng)用流程現(xiàn)實(shí)經(jīng)濟(jì)問題提煉具體問題確定欲達(dá)目標(biāo)根據(jù)定性理論設(shè)計(jì)指標(biāo)變量 搜集整理統(tǒng)計(jì)數(shù)據(jù) 選擇統(tǒng)計(jì)方法構(gòu)造理論模型 進(jìn)行統(tǒng)計(jì)計(jì)算估計(jì)模型參數(shù)

3、修改NOYES應(yīng)用分類研究分類研究結(jié)構(gòu)簡(jiǎn)化結(jié)構(gòu)簡(jiǎn)化研究研究相關(guān)分析相關(guān)分析研究研究預(yù)測(cè)決策預(yù)測(cè)決策研究研究教材統(tǒng)計(jì)軟件簡(jiǎn)介nSPSSnSASnS-PLUSnMINITABnTSPnEVIEW關(guān)于SPSSnSPSS(Statistical Package for the Social Science)即“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”, 是世界著名的統(tǒng)計(jì)分析軟件。1968年,3位斯坦福大學(xué)的學(xué)生開發(fā)了最早的SPSS統(tǒng)計(jì)軟件系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了SPSS公司,1984年開發(fā)出世界第一個(gè)統(tǒng)計(jì)分析軟件的微機(jī)版本。關(guān)于SPSSn于2000年正式將英文全稱更改為Statistical P

4、roduct and Service Solutions,意為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。n目前全球擁有25萬用戶,分布于通信、醫(yī)療、銀行、證券、保險(xiǎn)、制造、商業(yè)、市場(chǎng)研究、科研教育等領(lǐng)域。是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件關(guān)于SASnSAS系統(tǒng)全稱為Statistics Analysis System,最早由北卡羅來納大學(xué)的兩位生物統(tǒng)計(jì)學(xué)研究生編制,并于1976年成立了SAS軟件研究所,正式推出了SAS軟件。SAS是用于決策支持的大型集成信息系統(tǒng),但該軟件系統(tǒng)最早的功能限于統(tǒng)計(jì)分析,至今,統(tǒng)計(jì)分析功能也仍是它的重要組成部分和核心功能。 關(guān)于SASn經(jīng)過

5、多年的發(fā)展,SAS已被全世界120多個(gè)國(guó)家和地區(qū)的近三萬家機(jī)構(gòu)所采用,直接用戶則超過三百萬人,遍及金融、醫(yī)藥衛(wèi)生、生產(chǎn)、運(yùn)輸、通訊、政府和教育科研等領(lǐng)域。在數(shù)據(jù)處理和統(tǒng)計(jì)分析領(lǐng)域,SAS系統(tǒng)被譽(yù)為國(guó)際上的標(biāo)準(zhǔn)軟件系統(tǒng),并在9697年度被評(píng)選為建立數(shù)據(jù)庫的首選產(chǎn)品??胺Q統(tǒng)計(jì)軟件界的巨無霸。關(guān)于SASnSAS系統(tǒng)是一個(gè)組合軟件系統(tǒng),它由多個(gè)功能模塊組合而成它們是:nBASE SAS nSAS/STAT(統(tǒng)計(jì)分析模塊)nSAS/GRAPH(繪圖模塊)nSAS/QC(質(zhì)量控制模塊)nSAS/ETS(經(jīng)濟(jì)計(jì)量學(xué)和時(shí)間序列分析模)nSAS/OR(運(yùn)籌學(xué)模塊)nSAS/IML(交互式矩陣程序設(shè)計(jì)語言模塊nS

6、AS/FSP(快速數(shù)據(jù)處理的交互式菜單系統(tǒng)模塊)nSAS/AF(交互式全屏幕軟件應(yīng)用系統(tǒng)模塊) 關(guān)于SASn由于SAS系統(tǒng)是從大型機(jī)上的系統(tǒng)發(fā)展而來,在設(shè)計(jì)上也是完全針對(duì)專業(yè)用戶進(jìn)行設(shè)計(jì),因此其操作至今仍以編程為主仍以編程為主,人機(jī)對(duì)話界面不太友好,并且在編程操作時(shí)需要用戶最好對(duì)所使用的統(tǒng)計(jì)方法有較清楚的了解,非統(tǒng)計(jì)專業(yè)人員掌握起來較為困難。而且,SAS極為高昂的價(jià)格和只租不賣的銷售策略使得實(shí)力不足的個(gè)人和機(jī)構(gòu)只能對(duì)他望而卻步。關(guān)于S-PLUSnS,S-PLUS,R,S語言是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析、作圖的解釋型語言。它的豐富的數(shù)據(jù)類型(向量、數(shù)組、列表

7、、對(duì)象等)特別有利于實(shí)現(xiàn)新的統(tǒng)計(jì)算法,其交互式運(yùn)行方式及強(qiáng)大的圖形及交互圖形功能使得我們可以方便的探索數(shù)據(jù)。目前S語言的實(shí)現(xiàn)版本主要就是S-PLUS。 關(guān)于S-PLUSnS-PLUS基于S語言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。作為統(tǒng)計(jì)學(xué)家及一般研究人員的通用方法工具箱,S-PLUS強(qiáng)調(diào)演示圖形、探索性數(shù)據(jù)分析、統(tǒng)計(jì)方法、開發(fā)新統(tǒng)計(jì)工具的計(jì)算方法,以及可擴(kuò)展性。S-plus有微機(jī)版本和工作站版本,它是一個(gè)商業(yè)軟件,可以直接用來進(jìn)行標(biāo)準(zhǔn)的統(tǒng)計(jì)分析得到所需結(jié)果,但是它的主要的特點(diǎn)是它可以交互地從各個(gè)方面去發(fā)現(xiàn)數(shù)據(jù)中的信息,并可以很容易地實(shí)現(xiàn)一個(gè)新的統(tǒng)計(jì)方法。 關(guān)于S-PLUSn另外A

8、uckland大學(xué)的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開發(fā)了一個(gè)R系統(tǒng),其語法形式與S語言基本相同,但實(shí)現(xiàn)不同,兩種語言的程序有一定的兼容性。R是一個(gè)GPL自由軟件,現(xiàn)在的版本是1.00版,它比S-PLUS 還少許多功能,但已經(jīng)具有了很強(qiáng)的實(shí)用性 關(guān)于MINITABnMinitab,Minitab同樣是國(guó)際上流行的一個(gè)統(tǒng)計(jì)軟件包,其特點(diǎn)是簡(jiǎn)單易懂,在國(guó)外大學(xué)統(tǒng)計(jì)學(xué)系開設(shè)的統(tǒng)計(jì)軟件課程中,Minitab與SAS、BMDP并列,根據(jù)沒有SPSS的份,甚至有的學(xué)術(shù)研究機(jī)構(gòu)專門教授Minitab之概念及其使用。MiniTab for Windows統(tǒng)計(jì)軟件比SA

9、S、SPSS等小得多,但其功能并不弱,特別是它的試驗(yàn)設(shè)計(jì)及質(zhì)量控制等功能。關(guān)于MINITABnMiniTab目前的最高版本為V14.1,它提供了對(duì)存儲(chǔ)在二維工作表中的數(shù)據(jù)進(jìn)行分析的多種功能,包括:基本統(tǒng)計(jì)分析、回歸分析、方差分析、多元分析、非參數(shù)分析、時(shí)間序列分析、試驗(yàn)設(shè)計(jì)、質(zhì)量控制、模擬、繪制高質(zhì)量三維圖形等,從功能來看,Minitab除各種統(tǒng)計(jì)模型外,還具有許多統(tǒng)計(jì)軟件不具備的功能矩陣運(yùn)算關(guān)于EViewsnEViews,EViews是美國(guó)GMS公司1981年發(fā)行第1版的Micro TSP的Windows版本,通常稱為計(jì)量經(jīng)濟(jì)學(xué)軟件包。EViews是Econometrics Views的縮寫

10、,它的本意是對(duì)社會(huì)經(jīng)濟(jì)關(guān)系與經(jīng)濟(jì)活動(dòng)的數(shù)量規(guī)律,采用計(jì)量經(jīng)濟(jì)學(xué)方法與技術(shù)進(jìn)行“觀察”。計(jì)量經(jīng)濟(jì)學(xué)研究的核心是設(shè)計(jì)模型、收集資料、估計(jì)模型、檢驗(yàn)?zāi)P?、運(yùn)用模型進(jìn)行預(yù)測(cè)、求解模型和運(yùn)用模型。EViews是完成上述任務(wù)得力的必不可少的工具 關(guān)于EViewsn正是由于EViews等計(jì)量經(jīng)濟(jì)學(xué)軟件包的出現(xiàn),使計(jì)量經(jīng)濟(jì)學(xué)取得了長(zhǎng)足的進(jìn)步,發(fā)展成為實(shí)用與嚴(yán)謹(jǐn)?shù)慕?jīng)濟(jì)學(xué)科。使用 EViews軟件包可以對(duì)時(shí)間序列和非時(shí)間序列的數(shù)據(jù)進(jìn)行分析,建立序列(變量)間的統(tǒng)計(jì)關(guān)系式,并用該關(guān)系式進(jìn)行預(yù)測(cè)、模擬等等 關(guān)于EViewsnEViews。雖然 EViews是由經(jīng)濟(jì)學(xué)家開發(fā)的,并且大多數(shù)被用于經(jīng)濟(jì)學(xué)領(lǐng)域,但并意味著必須

11、限制該軟件包僅只用于處理經(jīng)濟(jì)方面的時(shí)間序列。EViews處理非時(shí)間序列數(shù)據(jù)照樣得心應(yīng)手。實(shí)際上,相當(dāng)大型的非時(shí)間序列(截面數(shù)據(jù))的項(xiàng)目也能在 EViews中進(jìn)行處理關(guān)于TSPnTSPTM是一種用于經(jīng)濟(jì)模型估算和模擬的完整語言。它是一個(gè)用于經(jīng)濟(jì)估算的世界標(biāo)準(zhǔn)。雖然TSP主要由經(jīng)濟(jì)學(xué)家開發(fā)并發(fā)展,但它的設(shè)計(jì)并沒僅把它限制在經(jīng)濟(jì)領(lǐng)域。任何由相同變量的重復(fù)觀測(cè)得到的數(shù)據(jù),都可用TSP分析 線性回歸分析1回歸分析第一節(jié) 回歸分析的背景第二節(jié) 一元線性回歸分析第三節(jié) 多元線性回歸分析第三節(jié) 逐步回歸分析第四節(jié) 回歸診斷回歸分析的相關(guān)背景1、回歸分析的由來: 英國(guó)統(tǒng)計(jì)學(xué)家F.GALTON(1822-1911

12、)和其學(xué)生K.Pearson(1856-1936)觀察了1078對(duì)夫婦,以每對(duì)夫婦的平均身高為X,而取他們成年的兒子的身高為Y,得到如下經(jīng)驗(yàn)方程: Y=33.73+0.516X回歸分析的相關(guān)背景2、自1969年設(shè)立諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)以來, 已有42名學(xué)者獲獎(jiǎng),而其中有2/3的人是統(tǒng)計(jì)學(xué)家、計(jì)量經(jīng)濟(jì)學(xué)家、數(shù)學(xué)家。由獲獎(jiǎng)?wù)呖巳R因發(fā)起的國(guó)際連接系統(tǒng)使用了7447個(gè)方程和3368個(gè)外生變量。 英國(guó)劍橋大學(xué)的多部門動(dòng)態(tài)模型有2759個(gè)方程和7484個(gè)變量。回歸分析的相關(guān)背景3、回歸分析的幾個(gè)發(fā)展方向:1)、統(tǒng)計(jì)學(xué)的重要方法與回歸的關(guān)系密切 時(shí)間序列分析(BOX-JINKINS)、判別分析、主成分分析、因子分

13、析、典型相關(guān)分析2)、回歸分析自身的完善和發(fā)展 自變量選擇、穩(wěn)健回歸、回歸診斷、投影尋蹤、非參數(shù)回歸回歸分析的相關(guān)背景3)、新的研究方法為回歸分析提供了方法論 非參數(shù)統(tǒng)計(jì)、自助法、刀切法、經(jīng)驗(yàn)貝 葉斯估計(jì)4)、各種有偏估計(jì)出現(xiàn): 嶺估計(jì)、壓縮估計(jì)、主成分估計(jì)、STEN 估計(jì)、特征根估計(jì)、偏最小二乘估計(jì)。一元線性回歸分析1、一元線性回歸模型2、回歸模型的參數(shù)估計(jì)3、OLSE估計(jì)的性質(zhì)4、回歸方程的顯著性檢驗(yàn)5、回歸方程的擬合優(yōu)度6、殘差分析7、回歸系數(shù)的區(qū)間估計(jì)一元線性回歸分析模型1、回歸模型建模的實(shí)踐背景2、一元線性回歸模型的數(shù)學(xué)形式: 1)、理論模型: xyEVarExy10210)()(0

14、)(同時(shí)有:一元線性回歸模型的數(shù)學(xué)形式2)、樣本回歸模型對(duì)于n組觀測(cè)值 有:),),.(,(),(2211nnyxyxyxiiiiiiixyEVarExy10210)()(0)(同時(shí)有:一元線性回歸模型的數(shù)學(xué)形式3)、模型的矩陣表達(dá): nIVarEXy2)(0)(回歸分析的參數(shù)估計(jì)(OLSE)nOrdinary Least Square Estimation: 對(duì)于已知n組觀測(cè)值有: niiiniixyxyQ1210,121101)(min)(),(100回歸分析的參數(shù)估計(jì)(OLSE)xyxxnyxxynxxyxxnyxxyQxyQniniiniiiininiiiiiniiinii102211

15、12110111011011100)(0)(20)(210解上式:整理上式有:回歸分析的參數(shù)估計(jì)(OLSE)由此得回歸方程: 21012210)iiniiiiiiiiiixyyyeyyeyxy()(殘差平方和:回歸殘差:稱為擬合值或回歸值關(guān)于系數(shù)的幾種表達(dá)方式niiniiiiniiniiiniiniixxniiniiixxyxxyxnyxyyxxLyyxnxxxLLxxLyyxxyyxx1211112121211211)()(3)()(2)()(1、設(shè):、關(guān)于回歸方程估計(jì)的幾個(gè)說明1、回歸方程通過樣本的中心點(diǎn)2、殘差具有如下性質(zhì): 0011niiiniiexe回歸方程的極大似然估計(jì)niiini

16、niiiiiiiiniiixyyfLxyyfxNyyyyxniyx12102221210202210221)(21exp)2()()(21exp21)(),(0,.,.,2 , 1,),(則極大似然函數(shù)為:分布密度:服從如下分布:),則,服從分布(為隨機(jī)變量,設(shè):為非隨機(jī)變量,),:(前提:各個(gè)樣本觀測(cè)值回歸方程的極大似然估計(jì)但后者無此要求。要求正態(tài)分布,估計(jì)完全相同,但前者因此,與求極小值,于對(duì)上式求極大似然值等價(jià)OLSExyxynlLnniiiniii1210121022)()(21)2ln(2)(OLSE的性質(zhì)1、線性: iiiiiiiyxxxxxxyxxnxnyy2211010)()(

17、)()(線性函數(shù)即:為隨機(jī)變量,就是指估計(jì)量OLSE的性質(zhì)2、無偏性)11yEyEE()()(OLSE的性質(zhì)3、參數(shù)的方差:上面的公式表明,參數(shù)的準(zhǔn)確性除受總體的差異外,還受X值的范圍影響,X取值范圍越大,參數(shù)就越穩(wěn)定222021)(1)()(xxxnVarLVariXXOLSE的性質(zhì)nGauss-Markov條件: 如果參數(shù)的下列條件成立: ),(,.2 , 101010, 02imatorUnbasedEstBestlinearEniEjijijii最佳線性無偏估計(jì)(的與分別是,此條件成立時(shí),)(回歸方程的檢驗(yàn)n在得到回歸方程后,必須運(yùn)用統(tǒng)計(jì)檢驗(yàn)方法分析該方程是否真正描述了Y與X之間的統(tǒng)計(jì)

18、規(guī)律之后,才能進(jìn)行分析預(yù)測(cè)等各種運(yùn)用,檢驗(yàn)的基本假設(shè)前提是:),(20NiT檢驗(yàn)nT檢驗(yàn)主要用于檢驗(yàn)回歸系數(shù)有效性的統(tǒng)計(jì)檢驗(yàn)方法1、設(shè)置假設(shè): 0:0:1110HHT檢驗(yàn)2、構(gòu)造檢驗(yàn)統(tǒng)計(jì)量: 21122)(2121/iniiniixxxxyynenLLtT檢驗(yàn)3、檢驗(yàn)過程: 在給定顯著性水平 ,雙側(cè)檢驗(yàn)臨界值為 ,當(dāng) ,拒絕原假設(shè),反之,接受原假設(shè),即回歸方程不成立,2t2tt T檢驗(yàn)4、P值檢驗(yàn)法: P值又稱P-Value,基本的檢驗(yàn)關(guān)系是: P( )=P值其中t為檢驗(yàn)統(tǒng)計(jì)量,服從t(n-2)的分布判別的標(biāo)準(zhǔn)是:值tt 0202,HttPHttP接受值時(shí),值當(dāng)拒絕值時(shí),值當(dāng)用P值代替t 值的

19、優(yōu)越性1、直接對(duì)比P值與 的水平,不用查表2、用P值檢驗(yàn)可比性較好。3、P值的意義明確,就是犯拒鎮(zhèn)真錯(cuò)誤的 概率。F檢驗(yàn)1、回歸方程平方和分解;見分解圖YXyiy iyF檢驗(yàn)n由上圖有:nSST-Sum of squares for TotalnSSE-Sum of squares for errornSSR-Sum of squares for Regression SSRSSESSTyyyyyyyyyyyyniiniiiniiiiii121221)()()()()(F檢驗(yàn)2、回歸方程顯著性檢驗(yàn)1)、設(shè)置假設(shè):2)、構(gòu)造統(tǒng)計(jì)量: 回歸方程顯著回歸方程不顯著0:0:1110HH)2/( nSS

20、ESSRFF檢驗(yàn)3)、檢驗(yàn)標(biāo)準(zhǔn): )()2, 1 ()()2, 1 (10值拒絕值拒絕pHnFFpHnFFF檢驗(yàn)方差來源自由度平方和均方F值P值回歸1SSRSSR/1對(duì)比P與殘差n-2SSESSE/n-2總和n-1SST2/1 /nSSESSR三種檢驗(yàn)的關(guān)系n可以證明,就一元回歸方程而言,回歸系數(shù)檢驗(yàn)、相關(guān)系數(shù)檢驗(yàn)和F檢驗(yàn)是完全等價(jià)的?;娟P(guān)系是: 22212212/1/212/1tLnSSESSRFtFrnrtLtxxxx統(tǒng)計(jì)量的平方檢驗(yàn)是上述、等價(jià)于等價(jià):、回歸系數(shù)與相關(guān)系數(shù)回歸方程的擬合優(yōu)度檢驗(yàn)1、檢驗(yàn)公式:2、基本意義: 表現(xiàn)回歸方程總平方和中能夠?yàn)榛貧w平方和解釋部分的比重,該值越大則

21、擬合優(yōu)度越好。 212122)()()(ryyyySSTSSRrniiniin但是,當(dāng)觀測(cè)值很大時(shí),高度顯著的檢驗(yàn)結(jié)果可能對(duì)應(yīng)較低的決定系數(shù),產(chǎn)生這種結(jié)果的原因有:nX與Y存在的關(guān)系不是線性關(guān)系而是非線性的。nX與Y的線性相關(guān)關(guān)系確立,但是誤差項(xiàng)方差 太大,導(dǎo)致樣本決定系數(shù)很小?;貧w方程的擬合優(yōu)度檢驗(yàn)2回歸系數(shù)的區(qū)間估計(jì)在實(shí)際運(yùn)用中,經(jīng)??紤]回歸系數(shù)的區(qū)間估計(jì),由公式:1、區(qū)間估計(jì)的統(tǒng)計(jì)量: 有),(211xxL)2(/211ntLtxx回歸系數(shù)的區(qū)間估計(jì)2、概率度公式:1)2(/2211ntLPxx概率度為:回歸系數(shù)的區(qū)間估計(jì)3、區(qū)間估計(jì):),12212211xxxxLtLt(的置信區(qū)間:的

22、置信度為取得回歸方程預(yù)測(cè)與控制1、單值預(yù)測(cè):稱為單值預(yù)測(cè)時(shí)有預(yù)測(cè)值:當(dāng)由:00100010,yxyxxxyii回歸方程預(yù)測(cè)與控制2、區(qū)間預(yù)測(cè):1)、因變量新值的區(qū)間估計(jì):222020)()(1(1)2(xxxxnnty回歸方程預(yù)測(cè)與控制2)、因變量新值的平均值的區(qū)間估計(jì)預(yù)測(cè)區(qū)間為:),(的值預(yù)測(cè)因變量平均值如果用自變量00yEx)()(1() 2(220220 xxxxnnty一元線性回歸模型的估計(jì)某地區(qū)月人均收入與月食品支出的資料恩格爾函數(shù)計(jì)算示例ttXY1802.099.99872.91515161802.0154321802.015161636541542315164463215021回

23、歸方程誤差的估計(jì)n總體回歸方程的誤差與樣本誤差的關(guān)系為:n根據(jù)回歸直線得到: 222nest21022nYXYYstttt回歸均方誤差與標(biāo)準(zhǔn)誤差21022nYXYYstttt2102nYXYYstttt回歸方程誤差的估計(jì)8285. 13438. 33438. 3215446321802. 04239878. 91231122sss最小二乘法估計(jì)量的性質(zhì)1100)()(無偏性EE最小二乘法估計(jì)量的性質(zhì)22202221)(1)()(xxxnVarxxLVariXX(一元線性回歸模型的檢驗(yàn)n回歸方程必須通過檢驗(yàn)才能實(shí)際應(yīng)用回歸方程必須通過檢驗(yàn)才能實(shí)際應(yīng)用n檢驗(yàn)內(nèi)容:檢驗(yàn)內(nèi)容: 1、統(tǒng)計(jì)學(xué)檢驗(yàn):、統(tǒng)計(jì)

24、學(xué)檢驗(yàn): 擬合程度評(píng)價(jià)擬合程度評(píng)價(jià)-可決系數(shù)評(píng)價(jià)可決系數(shù)評(píng)價(jià) 顯著性檢驗(yàn)顯著性檢驗(yàn)-T檢驗(yàn),檢驗(yàn),F(xiàn)檢驗(yàn)檢驗(yàn) 2、計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)、計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)-DW,等級(jí)相,等級(jí)相關(guān)檢驗(yàn)關(guān)檢驗(yàn)可決系數(shù)的含義1、回歸方程平方和分解;見分解圖、回歸方程平方和分解;見分解圖YXyiy iy可決系數(shù)的含義n由上圖有:nSST-Sum of squares for TotalnSSE-Sum of squares for errornSSR-Sum of squares for Regression SSRSSESSTyyyyyyyyyyyyniiniiiniiiiii121221)()()()()(可決系數(shù)的含義n

25、由上面的公式有:由上面的公式有:SSTSSESSTSSRSSRSSESSTyyyyyyyyyyyyniiniiiniiiiii1)()()()()(121221可決系數(shù)的含義n可決系數(shù)定義為:可決系數(shù)定義為:n很顯然,可決系數(shù)越大,方程的擬合度就越高。很顯然,可決系數(shù)越大,方程的擬合度就越高。SSTSSESSTSSRrSSTSSESSTSSR112可決系數(shù)的應(yīng)用47.43446321802. 04269878. 912311)(4 .3821542312311)(11101212211221niiiniiniiniiininiiiniiyxyyyySSEnyyyySST可決系數(shù)的應(yīng)用8 . 0

26、4 .3827 .43112SSTSSESSTSSRr可決系數(shù)的特性:1、具有非負(fù)性2、取值范圍為:3、可決系數(shù)是樣本觀測(cè)值的函數(shù)102 rT檢驗(yàn)nT檢驗(yàn)主要用于檢驗(yàn)回歸系數(shù)用于檢驗(yàn)回歸系數(shù) 有效性有效性的統(tǒng)計(jì)檢驗(yàn)方法1、設(shè)置假設(shè): 0:0:1110HHT檢驗(yàn)2、構(gòu)造檢驗(yàn)統(tǒng)計(jì)量: niixxxxSSSLt121112)(/T檢驗(yàn)9.10436151516163654)()(8286.1)(22212121nxxxxSxxSSniiniiT檢驗(yàn)0179. 09 .104368286. 1)(121niixxSST檢驗(yàn)07.100179.01802.0/112SLtxxT檢驗(yàn)3、檢驗(yàn)過程: 在給定

27、顯著性水平 ,雙側(cè)檢驗(yàn)臨界值為 ,當(dāng) ,拒絕原假設(shè),反之,接受原假設(shè),即回歸方程不成立,2t2tt T檢驗(yàn)07.100179.01802.0/112SLtxx16. 2)13()2(2%52tntt概率分布表有:由102%507.1016. 2)13(HHtt,接受所以,拒絕由于:T檢驗(yàn)%5并且,犯錯(cuò)誤的概率為既回歸方程顯著T檢驗(yàn)4、P值檢驗(yàn)法: P值又稱P-Value,基本的檢驗(yàn)關(guān)系是: P( )=P值其中t為檢驗(yàn)統(tǒng)計(jì)量,服從t(n-2)的分布判別的標(biāo)準(zhǔn)是:值tt 0202,HttPHttP接受值時(shí),值當(dāng)拒絕值時(shí),值當(dāng)用P值代替t 值的優(yōu)越性1、直接對(duì)比P值與 的水平,不用查表2、用P值檢驗(yàn)

28、可比性較好。3、P值的意義明確,就是犯拒鎮(zhèn)真錯(cuò)誤的 概率?;貧w方程預(yù)測(cè)與控制1、單值預(yù)測(cè):、單值預(yù)測(cè):稱為單值預(yù)測(cè)時(shí)有預(yù)測(cè)值:當(dāng)由:00100010,yxyxxxyii示例n假定某地區(qū)居民家庭的人均收入為假定某地區(qū)居民家庭的人均收入為200元,根據(jù)回歸方程,有月食品支出預(yù)測(cè)元,根據(jù)回歸方程,有月食品支出預(yù)測(cè)值:值: y=9.99+0.1802x y=9.99+0.1802200=46.03元元回歸方程預(yù)測(cè)與控制2、區(qū)間預(yù)測(cè):、區(qū)間預(yù)測(cè): 因變量新值的區(qū)間估計(jì)因變量新值的區(qū)間估計(jì):設(shè):)()(1(1)2(22020 xxxxnSnty回歸方程預(yù)測(cè)與控制因變量預(yù)測(cè)值的估計(jì)區(qū)間因變量預(yù)測(cè)值的估計(jì)區(qū)間

29、efefSntyxxxxnSS)2()()(1(120220回歸方程預(yù)測(cè)與控制%95%511)2()2()2(2002020且,置信度為即:efefefSntyySntySnty由上例有:(元)5852.293.1043615/151620015118286.1)()(1(1220efefefSSxxxxnSS回歸方程預(yù)測(cè)與控制%95%51161.51(45.40585. 216. 203.465852. 216. 203.46)2()2()2(002002020且,置信度為(元)元)即:yySntyySntySntyefefef一元線性回歸分析1、一元線性回歸模型(理論模型與經(jīng)驗(yàn)?zāi)P?2、回

30、歸模型的參數(shù)估計(jì)(OLS估計(jì)與殘差計(jì)算)3、回歸方程的顯著性檢驗(yàn)(t回歸系數(shù)的t檢驗(yàn))4、回歸方程的擬合優(yōu)度(可決系數(shù),F檢驗(yàn))5、殘差分析(回歸診斷)6、回歸系數(shù)的區(qū)間估計(jì)(單值預(yù)測(cè)與區(qū)間估計(jì))第三節(jié) 相關(guān)分析n相關(guān)系數(shù)的定義n相關(guān)系數(shù)與可決系數(shù)n單相關(guān)系數(shù)的檢驗(yàn)相關(guān)系數(shù)的定義n1、相關(guān)系數(shù):是在直線相關(guān)的前提下,用以測(cè)量?jī)蓚€(gè)變量之間相關(guān)關(guān)系的密切程度的統(tǒng)計(jì)分析工具。 2、相關(guān)系數(shù)的含義解釋: 1)、相關(guān)系數(shù)測(cè)定的原始公式: 積差法公式: yxnyyxx)(積差法公式的幾何解釋XYyxnyyxx)(積差法公式的幾何解釋XY相關(guān)系數(shù)的測(cè)算公式: 2222)()(yynxxnyxxynr樣本相關(guān)

31、系數(shù)的計(jì)算樣本相關(guān)系數(shù)的計(jì)算一元線性回歸模型的估計(jì)編號(hào)編號(hào)X XY YXYXYX2Y21 1102272754104047292 29626249692166763 39725242594096254 4102282856104047845 59127245782817296 61583656882496412967 75419102629163618 88326215868896769 91233138131512996110101063132861123696111111293443861664111561212138385244190441444131381272187656172914

32、149228257684647841515642012804096400合計(jì)合計(jì)15164234463216365412311某地區(qū)月人均收入與月食品支出的資料計(jì)算示例(P177)9414. 042312311151516163645154231516446321522rr)()(l0.3-0.5低度相關(guān),低度相關(guān),l0.6-0.8顯著相關(guān),顯著相關(guān),l0.8-1高度相關(guān)高度相關(guān)相關(guān)系數(shù)的基本性質(zhì)關(guān)系,現(xiàn)象之間不存在相關(guān)、關(guān)系,現(xiàn)象之間呈完全相關(guān)、現(xiàn)象之間呈負(fù)相關(guān)關(guān)系現(xiàn)象之間呈正相關(guān)關(guān)系、0413, 0., 02111rrrrr相關(guān)系數(shù)的幾個(gè)數(shù)量關(guān)系1、相關(guān)系數(shù)與可決系數(shù)的關(guān)系: 在一元線性回歸方程中,有:2、相關(guān)系數(shù)與回歸系數(shù)的關(guān)系: 9414. 08863. 02rrr如例中:數(shù)同號(hào)即:相關(guān)系數(shù)與回歸系有:由yyxxyyxxLLrLLLxyr1相關(guān)系數(shù)的檢驗(yàn)相關(guān)系數(shù)僅能表現(xiàn)兩個(gè)變量之間的線性相關(guān)系數(shù)僅能表現(xiàn)兩個(gè)變量之間的線性關(guān)系,而不能反映非線性關(guān)系。就是說,關(guān)系,而不能反映非線性關(guān)系。就是說,即使即使r=0,也不能說兩個(gè)變量無關(guān)。也不能說兩個(gè)變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論