版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、研究生“應(yīng)用數(shù)理統(tǒng)計”課程課外作業(yè)人均實際收入與電子設(shè)備購買量相關(guān)與回歸分析摘要: 數(shù)據(jù)挖掘經(jīng)常需要數(shù)據(jù)集成-合并多個數(shù)據(jù)存儲的數(shù)據(jù)。為了便于后續(xù)的分析,合并的過程需要解決包括冗余等一系列問題。而相關(guān)分析可以在一定程度上解決數(shù)據(jù)冗余的問題,并且運(yùn)用回歸分析,可以幫助分析屬性之間的關(guān)系,降低數(shù)據(jù)規(guī)模,簡化分析,并且回歸分析還可以實現(xiàn)預(yù)測。關(guān)鍵字:數(shù)據(jù)挖掘 數(shù)據(jù)冗余 回歸分析 預(yù)測一、問題提出,問題分析。隨著社會的發(fā)展,國家的綜合實力的提高,我國城鎮(zhèn)居民人均收入與相關(guān)的消費(fèi)已經(jīng)成為現(xiàn)代社會的一個重要特征。尤其是隨著信息技術(shù)的迅速發(fā)展,越來越多的電子產(chǎn)品已經(jīng)成為人們生活的必備品或者已經(jīng)成為一種不可或
2、缺的工具。如何通過在中國統(tǒng)計年鑒整理的數(shù)據(jù),進(jìn)行這方面的分析便成了一個很合理的問題了。二、數(shù)據(jù)描述我國城鎮(zhèn)居民電子設(shè)備消費(fèi)量及其影響因素的有關(guān)資料(已輸入到Excel),見下圖1 圖1 中國城鎮(zhèn)居民電子設(shè)備消費(fèi)量與有關(guān)資料本圖表中數(shù)據(jù)根據(jù)中國統(tǒng)計年鑒的基礎(chǔ)資料整理。城鎮(zhèn)居民人均實際收入城鎮(zhèn)居民人均收入城鎮(zhèn)居民消費(fèi)價格指數(shù)電子設(shè)備相對價格指數(shù)電子設(shè)備價格指數(shù)城鎮(zhèn)居民消費(fèi)價格指數(shù)價格指數(shù)均以1998年為100。要求利用上述資料進(jìn)行以下分析:(一)畫出人均電子設(shè)備消費(fèi)量與人均實際收入水平的相關(guān)圖;(二)計算人均電子設(shè)備消費(fèi)量與人均實際收入水平及電子設(shè)備相對價格指數(shù)的相關(guān)系數(shù);(三)建立我國城鎮(zhèn)居民電
3、子設(shè)備消費(fèi)需求的多元線性回歸方程,并進(jìn)行統(tǒng)計檢驗;(四)計算人均電子設(shè)備消費(fèi)量與電子設(shè)備相對價格指數(shù)之間的偏相關(guān)系數(shù)。(五)假定2002年我國城鎮(zhèn)居民的人均實際收入為2200元,電子設(shè)備相對價格指數(shù)為102,試預(yù)測電子設(shè)備的需求量,給出置信度為95的預(yù)測區(qū)間。三、繪制相關(guān)圖與計算相關(guān)系數(shù)(一)繪制相關(guān)圖在將有關(guān)數(shù)據(jù)已經(jīng)輸入到工作表的基礎(chǔ)上,可按如下步驟繪制散點圖:1、拖動鼠標(biāo)選定數(shù)值區(qū)域,該區(qū)域不包括數(shù)據(jù)的標(biāo)志。本例中的數(shù)值區(qū)域為“$B$3:$C$15”。2、執(zhí)行菜單命令插入à圖表,進(jìn)入圖表向?qū)А?、選擇“圖表類型”為“散點圖”,然后單擊下一步按鈕。4、Excel自動將前面所選的數(shù)值
4、區(qū)的地址放入圖表的數(shù)據(jù)區(qū)內(nèi),同時自動將排在前面一列的數(shù)據(jù)作為X,排在后面的一列數(shù)據(jù)作為Y。本例中,Excel自動把電子設(shè)備購買量作為X,人均實際收入作為Y。如果要將縱軸與橫軸對調(diào),可點擊“系列”,修改其中X與Y的數(shù)值區(qū)域后,單擊下一步。5、填寫圖表標(biāo)題為“人均電子設(shè)備購買量與人均實際收入的相關(guān)圖”,X軸坐標(biāo)名稱為“人均實際收入”,Y軸坐標(biāo)名稱為“人均電子設(shè)備購買量”,單擊下一步按鈕。6、選擇圖表輸出的位置,單擊完成按鈕,得到的結(jié)果如下圖2示。圖2人均電子設(shè)備購買量與人均實際收入相關(guān)圖(二)計算相關(guān)系數(shù)利用Excel中的相關(guān)系數(shù)分析工具可以方便地計算相關(guān)系數(shù)。操作步驟如下。1、調(diào)出相關(guān)系數(shù)分析工
5、具對話框,其填寫如下圖3示。圖3相關(guān)系數(shù)2、填寫完相關(guān)系數(shù)對話框,單擊確定即可得到各個變量的相關(guān)系數(shù)矩陣,結(jié)果如下。YX2X3Y1X20.9497241X30.2318660.3719481由上表可以看出,我國城鎮(zhèn)居民的電子設(shè)備購買量與人均實際收入之間存在顯著的正相關(guān),其單相關(guān)系數(shù)為0.9497,與電子設(shè)備相對價格指數(shù)之間則存在較弱的正相關(guān)。四、線性回歸分析1、對一元線性回歸模型的顯著性檢驗,可以歸結(jié)為對統(tǒng)計假設(shè): ;的檢驗。若拒絕,就認(rèn)為Y與X之間有線性相關(guān)關(guān)系;否則,認(rèn)為Y與X之間不存在線性相關(guān)關(guān)系。在此,我們采用相關(guān)系數(shù)檢驗法5來檢驗以上假設(shè)。用檢驗法,算出臨界值。線性回歸表示數(shù)據(jù)集內(nèi)的
6、變化趨勢,各個點的實際值圍繞回歸線波動,一般的波動在一定的范圍內(nèi),即各點的殘差。根據(jù)計算得到的回歸線找出數(shù)據(jù)單元內(nèi)的異常點,本文使用標(biāo)準(zhǔn)殘差閾值異常發(fā)現(xiàn)方法。數(shù)據(jù)集內(nèi)點處的殘差表示該點估計值與誤差值的偏差。不同數(shù)據(jù)單元的值可能差異較大,無法確定一個標(biāo)準(zhǔn)的閾值,因此采用單元內(nèi)的標(biāo)準(zhǔn)差對殘差進(jìn)行規(guī)格化, 得到標(biāo)準(zhǔn)殘差(Standardized Residual):根據(jù)經(jīng)濟(jì)理論的分析,某種商品的需求主要取決于人們的實際收入水平和該商品的相對價格。因此,可設(shè)定以下鮮蛋需求的回歸模型: (t=1,2,n) (7.85)利用Excel中配備的回歸分析工具,可以方便地進(jìn)行回歸模型的估計和檢驗。具體操作步驟如
7、下:2、調(diào)出回歸分析對話框,其中主要選項的含義如下。Y值輸入?yún)^(qū)域:在此輸入因變量數(shù)據(jù)區(qū)域,該區(qū)域只能由單列數(shù)據(jù)組成,本例為“$B$2:$B$15”X值輸入?yún)^(qū)域:在此輸入自變量數(shù)據(jù)區(qū)域,本例為“$C$2:$D$15”,Excel 將此區(qū)域中的自變量從左到右排列,自變量的個數(shù)最多可達(dá)16個。標(biāo)志:當(dāng)輸入的數(shù)值區(qū)域包括變量名時,選擇該復(fù)選項。置信度:如果需要在匯總輸出表中包含附加的置信度信息,則選中此復(fù)選框,然后輸入所要使用的置信度,95%為默認(rèn)值。常數(shù)為零:如果回歸方程中不想包含常數(shù)項,則選中此復(fù)選框。殘差:如果需要查看殘差,則選中此復(fù)選框。標(biāo)準(zhǔn)殘差:如果需要在殘差輸出表中包含標(biāo)準(zhǔn)殘差,則選中此復(fù)
8、選框。殘差圖:如果需要生成一張圖表,繪制每個自變量及其殘差,則選中此復(fù)選框。線形擬合圖:如需要為預(yù)測值和觀察值生成一個圖表,則選中此復(fù)選框。要注意,輸出結(jié)果至少需要占有7列寬度。3、填寫完對話框后,單擊確定按鈕,計算機(jī)將自動輸出計算結(jié)果。其基本內(nèi)容包括以下三個部分。第一部分“回歸統(tǒng)計”反映整個回歸方程擬合的情況,具體有復(fù)相關(guān)系數(shù)、決定系數(shù)R2、調(diào)整自由度的決定系數(shù)、回歸標(biāo)準(zhǔn)差以及樣本個數(shù)。第二部分是方差分析表,包括可解釋的離差平方和、殘差平方和、總離差平方和、它們的自由度以及由此計算出的F統(tǒng)計量和F統(tǒng)計量的顯著水平。第三部分是回歸系數(shù)的估計值以及它們的估計標(biāo)準(zhǔn)誤差、t統(tǒng)計量、t統(tǒng)計量的P值、回
9、歸系數(shù)估計值的上下界。如果在前面的選項中,要求輸出殘差、殘差圖和線性擬合圖,則計算機(jī)輸出結(jié)果除了以上三個基本部分外,還包括所要求的內(nèi)容。本例的輸出結(jié)果如下。SUMMARY OUTPUT回歸統(tǒng)計Multiple R0.958684R Square0.919075Adjusted R Square0.90289標(biāo)準(zhǔn)誤差0.465335觀測值13方差分析dfSSMSFSignificance F回歸分析224.5923312.2961656.785663.47E-06殘差102.1653640.216536總計1226.75769Coefficients標(biāo)準(zhǔn)誤差t StatP-valueLower
10、95%Upper 95%下限 95.0%上限 95.0%Intercept4.8719792.0261142.4045920.0370240.3575149.3864430.3575149.386443X20.0062480.00060410.340591.17E-060.0049010.0075940.0049010.007594X3-0.028060.019302-1.453590.176712-0.071060.01495-0.071060.01495從計算結(jié)果可知,本例所擬合的樣本回歸方程為:=4.8720+ 0.0062X2 0.028X3t =(2.40) (10.34) (-1.
11、45)回歸系數(shù)的符號與經(jīng)濟(jì)理論分析的結(jié)果相符。X2的t檢驗值較大、P值較低,而X3的t檢驗值值較小、P值較高,這表明人均實際收入對鮮蛋需求量的影響較大,相對價格指數(shù)的影響則不夠顯著。另外,整個方程的F統(tǒng)計量也較大達(dá)56.78,修正自由度的決定系數(shù)達(dá)0.9029,這表明該回歸方程有較好的擬合程度,能夠通過統(tǒng)計檢驗。五、計算偏相關(guān)系數(shù)前面已經(jīng)得到了人均電子設(shè)備購買量對電子設(shè)備價格指數(shù)的偏回歸系數(shù)即=-0.0028。按照類似的步驟,以電子設(shè)備價格指數(shù)為因變量,人均電子設(shè)備購買量和人均實際收入為自變量,再次進(jìn)行回歸,可得到電子設(shè)備價格指數(shù)對電子設(shè)備購買量的偏回歸系數(shù)即6.2172。將其代入計算偏相關(guān)系
12、數(shù)的公式,可得:13.2=-0.1319將其與前面已求得的單相關(guān)系數(shù)(13=0.2318)比較,可以看出,本例中需求與價格的單相關(guān)系數(shù)和偏相關(guān)系數(shù)有較大差別,連符號也不相同。偏相關(guān)分析的結(jié)果更符合客觀事物的內(nèi)在聯(lián)系。六、預(yù)測1、利用回歸模型進(jìn)行預(yù)測可以分為:點預(yù)測和置信區(qū)間預(yù)測法 (1)點預(yù)測法:將自變量取值帶入回歸預(yù)測模型求出因變量的預(yù)測值。 (2)置信區(qū)間預(yù)測法:估計一個范圍,并確定該范圍出現(xiàn)的概率。置信區(qū)間的大小的影響的因素:a、因變量估計值;b、回歸標(biāo)準(zhǔn)差;C、概率度t;下面主要介紹置信區(qū)間的預(yù)測:的置信度為的預(yù)測區(qū)間為:其中, 。本例需要利用多元線性回歸模型區(qū)間預(yù)測的矩陣公式和Exc
13、el中的矩陣計算函數(shù),步驟如下。2.構(gòu)造如圖7-7所示的工作表,該表可通過對圖74改造后得到。圖中,A1:A14輸入年份,B2:D14為矩陣X,B16:D16為矩陣Xf,即自變量在預(yù)測期的取值,F(xiàn)2:F4存放的是、的估計值,F(xiàn)5:F10存放的是一些中間變量及最終計算結(jié)果。為了便于輸寫公式,在此定義某些單元格區(qū)域的名稱。定義F6、F7、F8的名稱,選定E6:F8,執(zhí)行菜單命令插入à名稱à指定,在調(diào)出的對話框中,選中“最左列”,單擊確定按鈕即可;定義B2:D14的名稱,選定該區(qū)域,執(zhí)行菜單命令插入à名稱à定義,調(diào)出定義名稱對話框,輸入名稱“X”,單擊確定按鈕
14、即可。同樣,將B16:D16定義為“Xf”,F(xiàn)2:F4定義為“B”。3.計算點預(yù)測值Yf。在F5中輸入公式“=MMULT(Xf,B)”即可。4.計算t臨界值。在F6中輸入公式“=TINV(1-0.95,13-2-1)”即可,其中0.95為置信度,13為樣本個數(shù)。樣本個數(shù)也可通過COUNT函數(shù)求得。5.計算預(yù)測估計誤差的估計值Sef。先計算,在F5中輸入如下公式:=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X),TRANSPOSE(Xf)然后按Ctrl+Shift+Enter組合鍵即可,表示輸入的是數(shù)組公式。再計算Sef,在F8中輸入公式“=0.4653*SQRT(1+F5)”即可,其中0.4653是回歸估計標(biāo)準(zhǔn)差。6.計算置信區(qū)間上下限。在F9、F10中分別輸入公式“=Yf-t臨界值*Sef”和“=Yf+t臨界值*Sef”。最終結(jié)果見圖7-7。七、主要的結(jié)論和發(fā)現(xiàn) 隨著國民收入的提高,人們注重生活的便捷性和效率性,因此在電子設(shè)備或者電子產(chǎn)品的消費(fèi)呈一種上升趨勢。電子產(chǎn)品的不斷更新?lián)Q代也是人們消費(fèi)電子產(chǎn)品的一個重要因素。因此,我相信,在未來的很長的一段時間里,國民收入不斷增加的同時也會在電子產(chǎn)品上進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 改良早期預(yù)警評分
- 滬科版八年級數(shù)學(xué)上冊第13章三角形中的邊角關(guān)系命題與證明13-1三角形中的邊角關(guān)系第2課時三角形中角的關(guān)系課件
- 蘇教版八年級生物上冊第7單元第二十章生物圈是最大的生態(tài)系統(tǒng)第一節(jié)生物圈中的各種生態(tài)系統(tǒng)課件
- 人教版九年級數(shù)學(xué)上冊《第二十一章一元二次方程》單元測試卷(附答案)
- 2024年危險化學(xué)品氯堿電解工藝作業(yè)模擬考試題庫試卷
- 化 學(xué)2024-2025學(xué)年九年級上學(xué)期期中化學(xué)重要考點梳理
- 文獻(xiàn)檢索思維導(dǎo)圖
- 關(guān)于生命的教學(xué)課件
- 青島版二年級上冊科學(xué)教案
- 技術(shù)能手聘用合同模板
- 戰(zhàn)狼Ⅱ課件完整版
- 常見電泳漆弊病與解決方法
- 2023年國際生物奧林匹克競賽國際生物奧林匹克
- 傳媒公司簽約藝人合同
- 學(xué)校學(xué)生志愿服務(wù)登記表
- 交管12123學(xué)法減分題庫大全(有參考答案)
- 大學(xué)英語四級 700核心高頻詞
- 建筑施工危險源識別與風(fēng)險評價清單
- 資金集中管理五大模式
- GB/T 28708-2012管道工程用無縫及焊接鋼管尺寸選用規(guī)定
- 小學(xué)五年級語文思政融合課教學(xué)設(shè)計圓明園的毀滅
評論
0/150
提交評論