




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于線性回歸的銀行卡業(yè)務(wù)量因素分析摘 要回歸分析是一種應(yīng)用廣泛的統(tǒng)計(jì)分析方法,在金融、經(jīng)濟(jì)、醫(yī)學(xué)等領(lǐng)域已被成功的應(yīng)用。它用于分析事物之間的統(tǒng)計(jì)關(guān)系,側(cè)重觀察變量之間的數(shù)量變化規(guī)律,并通過(guò)回歸方程的形式描述和反應(yīng)這種關(guān)系,幫助人們準(zhǔn)確的把握變量受其他一個(gè)或多個(gè)變量影響的程度,進(jìn)而為預(yù)測(cè)提供科學(xué)依據(jù)。本文以銀行卡為對(duì)象,以微觀經(jīng)濟(jì)學(xué)中的商品需求理論為基礎(chǔ),運(yùn)用計(jì)量經(jīng)濟(jì)學(xué)中的普通最小二乘法,針對(duì)商業(yè)銀行中間業(yè)務(wù)中較為重要的銀行卡業(yè)務(wù)需求問(wèn)題,嘗試運(yùn)用線性回歸的方法,具體對(duì)影響銀行卡業(yè)務(wù)量的因素進(jìn)行分析。以銀行卡業(yè)務(wù)量為因變量,以銀行卡受理環(huán)境的各種因素為自變量,建立銀行卡業(yè)務(wù)影響的多自變量函數(shù)模型,
2、考察銀行卡的需求函數(shù);同時(shí),通過(guò)理論與實(shí)證分析,找出對(duì)銀行卡業(yè)務(wù)需求影響的顯著性因素,揭示銀行卡業(yè)務(wù)需求的特征、銀行卡業(yè)務(wù)發(fā)展趨勢(shì),為該業(yè)務(wù)拓展提供經(jīng)營(yíng)決策的實(shí)證基礎(chǔ)。關(guān)鍵詞:回歸分析,受理環(huán)境,統(tǒng)計(jì)檢驗(yàn),銀行卡analysis of the bank card business factors based on linear regression author: zhang wei-min tutor: guo jing-meiabstractregression analysis is a widely used statistical analysis method. it has be
3、en successfully used in financial, economic, medical and other fields. it is used for statistical analysis of the relationship between things, focus on the number of changes of variables, and through the formal description and the relationship between the regression equation, to help people grasp th
4、e other variables by one or more variables influence degree, and provide the scientific basis for predicting.using the merchandise demand theory as the base, this paper takes bank cards as the object and tries to analyze the factors influencing the bank card business. basing on the ordinary least sq
5、uares, this paper analyzes the data with the regression method. the dependent variable is bank card business and the independent factors include the amount of the shops engaged by special arrangement, the amount of the savings outlets, the amount of the atm and the amount of the pos. then this paper
6、 analyzes these variables using spss, with the analysis of theory and demonstration. we can find out the remarkable factors which influence the independent variable, so that offer the positive groundwork of management decision-making for developing bank card operation.key words: regression analysis,
7、 environment, statistical test, bank card目 錄1 緒論11.1 課題背景及意義11.2 研究的思路與方法11.3 論文構(gòu)成及研究?jī)?nèi)容22 銀行卡產(chǎn)業(yè)發(fā)展?fàn)顩r32.1 我國(guó)銀行卡業(yè)務(wù)發(fā)展現(xiàn)狀32.2 我國(guó)銀行卡受理環(huán)境現(xiàn)狀32.3 銀行卡業(yè)務(wù)量與受理環(huán)境的關(guān)聯(lián)性43 回歸分析53.1 一元線性回歸分析53.1.1 一元線性回歸分析的基本原理和方法53.1.2 決定系數(shù)63.2 多元線性回歸分析73.2.1 多元回歸模型與回歸方程73.2.2 多元回歸方程的多重判定系數(shù)83.2.3 多重共線性現(xiàn)象93.3 變量選擇93.3.1 變量的選擇過(guò)程103.3.2
8、 變量選擇的方法104 回歸分析的統(tǒng)計(jì)檢驗(yàn)114.1 回歸方程的顯著性檢驗(yàn)114.1.1 多元線性回歸方程的顯著性檢驗(yàn)124.2 回歸系數(shù)的顯著性檢驗(yàn)124.2.1 一元線性回歸系數(shù)的檢驗(yàn)124.2.2 多元線性回歸系數(shù)的檢驗(yàn)134.3 殘差分析134.3.1 殘差分析內(nèi)容144.3.2 殘差序列的獨(dú)立性144.4 方差分析154.4.1 方差分析簡(jiǎn)介154.4.2 單因素方差分析164.4.3 多因素方差分析184.4.4 協(xié)方差分析195 銀行卡受理環(huán)境對(duì)銀行卡業(yè)務(wù)量的影響分析195.1 數(shù)據(jù)、變量選取與模型設(shè)計(jì)205.2 銀行卡業(yè)務(wù)量函數(shù)的回歸擬合分析205.2.1 回歸方法的選擇及標(biāo)準(zhǔn)
9、205.2.2 回歸結(jié)果與分析21結(jié) 論25致 謝26參考文獻(xiàn)27附 錄281 緒論1.1 課題背景及意義中國(guó)經(jīng)過(guò)20多年的改革開放政策,國(guó)民經(jīng)濟(jì)取得了巨大的成就,銀行卡產(chǎn)業(yè)經(jīng)歷了飛速的發(fā)展。銀行卡的受理環(huán)境是銀行卡業(yè)務(wù)發(fā)展的重要影響因素。歷經(jīng)20年面向經(jīng)濟(jì)金融領(lǐng)域的融合進(jìn)程,我國(guó)銀行卡產(chǎn)業(yè)發(fā)展迄今已初具規(guī)模,對(duì)于增強(qiáng)商業(yè)銀行市場(chǎng)競(jìng)爭(zhēng)力及推動(dòng)國(guó)民經(jīng)濟(jì)信息化發(fā)揮了重要作用。由于受理環(huán)境是整個(gè)銀行產(chǎn)業(yè)發(fā)展的市場(chǎng)基礎(chǔ),受理環(huán)境(包括atm機(jī)的數(shù)量,pos機(jī)終端的數(shù)量,特約商戶的數(shù)量,儲(chǔ)蓄網(wǎng)點(diǎn)的數(shù)量和網(wǎng)絡(luò)質(zhì)量等)的好壞,直接對(duì)銀行卡業(yè)務(wù)量有很大影響。目前的文獻(xiàn)中,有關(guān)商業(yè)銀行中間業(yè)務(wù)的討論很多,但是有
10、關(guān)銀行卡的受理環(huán)境對(duì)銀行卡業(yè)務(wù)需求影響的文獻(xiàn)較少。在銀行卡業(yè)務(wù)的討論中,又以定性的、直觀的議論為主,不能夠通過(guò)定量的方法找出各因素之間的具體關(guān)系,把握其發(fā)展趨勢(shì)以指導(dǎo)該業(yè)務(wù)實(shí)踐?;谏鲜龇治觯卷?xiàng)研究主要針對(duì)銀行卡的業(yè)務(wù)量與其受理環(huán)境的各因素之間的影響關(guān)系。嘗試通過(guò)計(jì)量模型,找出受理環(huán)境的建設(shè)對(duì)銀行卡業(yè)務(wù)量的影響因素,以揭示銀行卡的發(fā)展規(guī)律,為銀行卡受理環(huán)境的建設(shè)提供一些幫助。最近幾年關(guān)于銀行卡業(yè)務(wù)和受理環(huán)境分析的文獻(xiàn)大致包括以下幾類:(1) 綜合論述我國(guó)銀行卡市場(chǎng)的發(fā)展情況,包括我國(guó)銀行卡市場(chǎng)概況,銀行卡市場(chǎng)面臨的問(wèn)題及解決方案,銀行卡市場(chǎng)前景預(yù)測(cè)等。(2) 論述我國(guó)銀行卡業(yè)務(wù)量與宏觀經(jīng)濟(jì)因
11、素的相關(guān)關(guān)系,包括gdp,人均gdp,城鎮(zhèn)居民消費(fèi)總額,社會(huì)消費(fèi)品零售總額等對(duì)銀行卡需求量的影響分析。 (3)論述我國(guó)銀行卡受理環(huán)境的問(wèn)題及解決對(duì)策。前人的文章大多從宏觀上分析銀行卡市場(chǎng)的各種問(wèn)題,大多運(yùn)用定性的手法。雖然也有少數(shù)人用數(shù)據(jù)模型做實(shí)證研究,但是也都是分析銀行卡業(yè)務(wù)量和宏觀因素的相關(guān)性,沒(méi)有能夠從微觀層面上定量分析各種因素對(duì)銀行卡業(yè)務(wù)的影響。1.2 研究的思路與方法在銀行卡的受理環(huán)境中,有諸多因素會(huì)對(duì)銀行卡業(yè)務(wù)需求產(chǎn)生影響,如atm機(jī)的數(shù)量,pos機(jī)終端的數(shù)量,特約商戶的數(shù)量,儲(chǔ)蓄網(wǎng)點(diǎn)的數(shù)量和網(wǎng)絡(luò)建設(shè)方面等等。本文重點(diǎn)研究atm機(jī)數(shù)量,pos機(jī)終端數(shù)量,特約商戶的數(shù)量和儲(chǔ)蓄網(wǎng)點(diǎn)的數(shù)
12、量這四個(gè)因素的變化對(duì)銀行卡業(yè)務(wù)需求會(huì)產(chǎn)生怎樣的影響,即銀行卡業(yè)務(wù)需求與受理環(huán)境各因素的相關(guān)性如何,這些工作是本文的任務(wù),通過(guò)數(shù)據(jù)的分析,考察銀行卡業(yè)務(wù)需求函數(shù)的特征,使我們能夠進(jìn)一步把握銀行卡業(yè)務(wù)發(fā)展的規(guī)律。本文以銀行卡為對(duì)象,運(yùn)用計(jì)量經(jīng)濟(jì)學(xué)中的最小二乘法,針對(duì)商業(yè)銀行中間業(yè)務(wù)中較為重要的銀行卡業(yè)務(wù)需求問(wèn)題,具體對(duì)影響需求的因素進(jìn)行分析。以銀行卡業(yè)務(wù)需求為因變量,以銀行卡受理環(huán)境的各種因素為自變量,建立銀行卡業(yè)務(wù)需求的多自變量函數(shù)模型,考察需求函數(shù):同時(shí),通過(guò)理論與實(shí)證分析,找出對(duì)銀行卡業(yè)務(wù)需求影響的顯著性因素,揭示銀行卡業(yè)務(wù)需求的特征、銀行卡業(yè)務(wù)發(fā)展趨勢(shì),為該業(yè)務(wù)拓展提供經(jīng)營(yíng)決策的實(shí)證基礎(chǔ)。
13、1.3 論文構(gòu)成及研究?jī)?nèi)容本文首先對(duì)銀行卡以及銀行卡受理環(huán)境的現(xiàn)狀做簡(jiǎn)要介紹,同時(shí)指出了銀行卡的受理環(huán)境與銀行卡業(yè)務(wù)量之間的關(guān)聯(lián)性。以及對(duì)回歸分析進(jìn)行了介紹,包括一元線性回歸分析,多元線性回歸分析以及變量的選擇問(wèn)題。接著介紹了方程的顯著性檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn),殘差分析及方差分析。分析了所研究問(wèn)題的歷史與現(xiàn)狀。提出了要研究的問(wèn)題和及其研究意義。第五章利用計(jì)量方法對(duì)數(shù)據(jù)進(jìn)行回歸分析,并用各種方法進(jìn)行檢驗(yàn),得出因變量與自變量之間的關(guān)系并解釋說(shuō)明。最后一章對(duì)全文進(jìn)行了總結(jié),并建議了未來(lái)可研究的內(nèi)容。在附錄部分運(yùn)用微觀經(jīng)濟(jì)學(xué)和消費(fèi)者行為學(xué)理論分析了銀行卡產(chǎn)品和服務(wù)價(jià)格對(duì)銀行卡業(yè)務(wù)量的影響以及介紹了
14、異方差性及其解決方法。2 銀行卡產(chǎn)業(yè)發(fā)展?fàn)顩r2.1 我國(guó)銀行卡業(yè)務(wù)發(fā)展現(xiàn)狀我國(guó)的銀行卡最早出現(xiàn)是在1979年,當(dāng)時(shí)中國(guó)銀行廣東省分行與香港東亞銀行簽訂代理東美信用卡業(yè)務(wù)協(xié)議書,并開始辦理此項(xiàng)業(yè)務(wù)。隨后,中國(guó)銀行于1986年10月又推出了以人民幣為結(jié)算貨幣的信用卡即為準(zhǔn)貸記卡,并統(tǒng)一命名為“長(zhǎng)城卡”,到了1995年,廣東發(fā)展銀行發(fā)行了國(guó)內(nèi)第一張真正意義上的符合國(guó)際標(biāo)準(zhǔn)的人民幣貸記卡和國(guó)際卡,開創(chuàng)了中國(guó)真正信用卡市場(chǎng)發(fā)展的先河。1996年8月中國(guó)銀行首家發(fā)行具有國(guó)際標(biāo)準(zhǔn)的人民幣借記卡長(zhǎng)城電子借記卡。到目前為止,國(guó)內(nèi)很多商業(yè)銀行都推出了自己的銀行卡。據(jù)中國(guó)人民銀行統(tǒng)計(jì),截至2006年5月底,中國(guó)銀行
15、卡累計(jì)發(fā)卡量超過(guò)16億張,其中信用卡累計(jì)發(fā)行量達(dá)1.1億余張。此外,銀行卡產(chǎn)業(yè)發(fā)展的其他各項(xiàng)指標(biāo)也創(chuàng)下新高。銀行數(shù)劇顯示,2008年1至5月份,中國(guó)銀行卡跨行交易額達(dá)到1.7萬(wàn)億元,比去年同期增長(zhǎng)了55。 隨著銀行卡受理終端的普及推廣,截至2008年5月底,中國(guó)境內(nèi)銀行卡受理商戶已達(dá)88萬(wàn)戶、聯(lián)網(wǎng)pos機(jī)139萬(wàn)臺(tái)、聯(lián)網(wǎng)atm機(jī)14萬(wàn)臺(tái)。截至2009年末,我國(guó)銀行卡發(fā)卡總量約為20.7億張,較2008年末增加2.7億張。截至2009年末,借記卡發(fā)卡量為18.8億張,信用卡發(fā)卡量為1.9億張。各類銀行結(jié)算賬戶共計(jì)28.1億戶,較2008年末增長(zhǎng)17.2%;其中,個(gè)人銀行結(jié)算賬戶27.9億戶,單位
16、銀行結(jié)算賬戶2191萬(wàn)戶。2.2 我國(guó)銀行卡受理環(huán)境現(xiàn)狀在銀行卡跨行交易網(wǎng)絡(luò)的建設(shè)方面,中國(guó)銀聯(lián)己在2004年12月01日正式上線投產(chǎn)新一代銀行卡跨行信息交換新系統(tǒng)。新系統(tǒng)的技術(shù)處理能力和各項(xiàng)技術(shù)都達(dá)到了國(guó)際先進(jìn)水平,網(wǎng)絡(luò)可用性達(dá)到99%,峰值達(dá)到每秒處理跨行交易1300筆,較原系統(tǒng)的峰值大大提高。新系統(tǒng)為跨行轉(zhuǎn)接業(yè)務(wù)的規(guī)模增長(zhǎng)預(yù)留了足夠的技術(shù)空間,同時(shí)也為各項(xiàng)新興業(yè)務(wù)的開展提供了堅(jiān)實(shí)的技術(shù)保障。自從新系統(tǒng)的應(yīng)用,我國(guó)銀行卡跨行系統(tǒng)運(yùn)行效率得到進(jìn)一步提高。中國(guó)銀聯(lián)轉(zhuǎn)接成功率達(dá)到99.8%,交易成功率在前兩年大幅提高的基礎(chǔ)上進(jìn)一步攀升。同時(shí),為進(jìn)一步提高跨行交易運(yùn)行質(zhì)量,中國(guó)銀聯(lián)進(jìn)一步建立健全了
17、系統(tǒng)運(yùn)行質(zhì)量管理體系,積極協(xié)助入網(wǎng)機(jī)構(gòu)解決影響跨行交易質(zhì)量的突出問(wèn)題,確保了系統(tǒng)安全、穩(wěn)定、高效運(yùn)行,促進(jìn)了跨行交易成功率的提高。另外,中國(guó)銀聯(lián)積極組織各入網(wǎng)機(jī)構(gòu)修改技術(shù)規(guī)范,制定實(shí)現(xiàn)emv遷移的策略,為新系統(tǒng)實(shí)現(xiàn)集中交換、統(tǒng)一清算作好了全面準(zhǔn)備。在受理環(huán)境的建設(shè)方面,我國(guó)特約商戶和入網(wǎng)機(jī)具數(shù)量不斷增加。截至2004年底,我國(guó)特約商戶總數(shù)為64萬(wàn)戶,入網(wǎng)pos機(jī)具數(shù)為34萬(wàn)臺(tái),入網(wǎng)atm機(jī)具為6.8萬(wàn)臺(tái)。同比分別增長(zhǎng)28.1%、5.8%和14.4%。從區(qū)域分布看,銀行卡機(jī)具主要還是集中在發(fā)達(dá)城市和地區(qū)。截至2004年底,18個(gè)主要城市和地區(qū)的聯(lián)網(wǎng)pos機(jī)具和atm機(jī)具數(shù)分別為27.42萬(wàn)臺(tái)和5
18、.19萬(wàn)臺(tái),分別比年初增長(zhǎng)了60%和24%;入網(wǎng)特約商戶達(dá)到15.8萬(wàn)戶,pos活動(dòng)率在70%以上。在18個(gè)主要城市和地區(qū)中,pos機(jī)具布放量在萬(wàn)臺(tái)以上的地區(qū)有:廣州、上海、北京、深圳、杭州、南京、濟(jì)南和天津:atm機(jī)具布放量超過(guò)5000臺(tái)的地區(qū)有:廣州、南京和杭州。全國(guó)性商業(yè)銀行仍然是市場(chǎng)上pos機(jī)具的主要投放主體。中國(guó)工商銀行、中國(guó)農(nóng)業(yè)銀行、中國(guó)銀行、中國(guó)建設(shè)銀行和交通銀行投放的pos機(jī)具占商業(yè)銀行投放pos機(jī)總數(shù)的87%以上。但我國(guó)的受理環(huán)境中也存在著兩個(gè)主要的問(wèn)題:一是特約商戶的問(wèn)題。目前全國(guó)可以受理聯(lián)網(wǎng)銀行卡的特約商戶數(shù)量還很少,嚴(yán)重限制了持卡消費(fèi)的范圍。同時(shí),特約商戶分布不均,多處
19、在發(fā)達(dá)地區(qū)的大商場(chǎng)和酒店,而居民日常的消費(fèi)地點(diǎn)大多無(wú)法受理銀行卡消費(fèi)。最后,特約商戶與銀行不斷出現(xiàn)的利益之爭(zhēng)給持卡消費(fèi)者帶來(lái)了不便。如上海永樂(lè)家電、好美家出臺(tái)的“罷刷”舉措,以及深圳的“罷刷”風(fēng)波,使眾多消費(fèi)者對(duì)信用卡消費(fèi)信心全無(wú)。二是我國(guó)大多數(shù)發(fā)卡銀行在開展銀行卡業(yè)務(wù)時(shí)將銀行卡定位為存折的電子化形式,發(fā)卡的主要目的是為了獲得存款,為銀行發(fā)展傳統(tǒng)企業(yè)信貸業(yè)務(wù)增加資金來(lái)源,而資產(chǎn)業(yè)務(wù)功能則被置于可有可無(wú)的從屬地位,因此,我國(guó)銀行卡的發(fā)展一直是以借記卡為主,而在國(guó)外作為發(fā)卡銀行收益主要來(lái)源的信用卡業(yè)務(wù)在我國(guó)則發(fā)展緩慢。由于銀行對(duì)銀行卡消費(fèi)的不重視,給消費(fèi)者持卡消費(fèi)帶來(lái)諸多不便。如由于我國(guó)信用卡技術(shù)
20、不過(guò)硬,信用卡消費(fèi)交易成功率低,交易速度慢,出錯(cuò)多,嚴(yán)重阻礙了消費(fèi)者持卡消費(fèi)的積極性,根據(jù)2002年6月份的數(shù)據(jù):全國(guó)跨行交易的成功率為85.17%,在該月發(fā)生的2.54萬(wàn)筆跨行差錯(cuò)交易中,差錯(cuò)率為0.25%,pos機(jī)的差錯(cuò)率為0.15%。比如,消費(fèi)者在刷卡時(shí)經(jīng)常出現(xiàn)的問(wèn)題是,由于機(jī)器失誤,卡上顯示有錢,但是刷不出來(lái),真正收到對(duì)賬單時(shí),錢已經(jīng)刷掉了,消費(fèi)者為了追回款項(xiàng),往往要來(lái)回奔波于銀行與商家之間,本應(yīng)“方便”的信用卡此時(shí)卻帶來(lái)了諸多不便。2.3 銀行卡業(yè)務(wù)量與受理環(huán)境的關(guān)聯(lián)性銀行卡的受理環(huán)境包括特約商戶的發(fā)展、聯(lián)通網(wǎng)絡(luò)的建設(shè)、各種銀行卡設(shè)備的配置、銀行卡受理的效率和質(zhì)量、銀行卡的通用性、安
21、全性等等。銀行卡業(yè)務(wù)的開展需要有良好的用卡環(huán)境,銀行卡產(chǎn)品的各項(xiàng)功能是要在相應(yīng)的環(huán)境下才能實(shí)現(xiàn)的,并給持卡人帶來(lái)效用,用卡環(huán)境是開展銀行卡業(yè)務(wù)的基礎(chǔ)和支撐。經(jīng)過(guò)十多年的建設(shè)和發(fā)展,我國(guó)銀行卡的用卡環(huán)境日益改善,隨著發(fā)卡業(yè)務(wù)管理措施的完善、特約商戶發(fā)展加快,銀行卡受理的質(zhì)量水準(zhǔn)有了很大提高。上世紀(jì)90年代后期以來(lái),科技發(fā)展使銀行卡系統(tǒng)的網(wǎng)絡(luò)覆蓋面不斷加大,通訊質(zhì)量進(jìn)一步提高,同時(shí),銀行卡的相關(guān)的各種設(shè)備、機(jī)具如pos機(jī)、atm機(jī)、自動(dòng)存款機(jī)、自助終端、ic卡受理機(jī)等的數(shù)量有很大增長(zhǎng),功能也日益完備,有力地提升了銀行卡產(chǎn)品可以為持卡人創(chuàng)造效用的能力。通過(guò)銀行卡的用卡環(huán)境的影響,也使得越來(lái)越多的人知
22、道銀行卡,了解銀行卡,并成為銀行卡的持有者,使得銀行卡需求快速增長(zhǎng)。3 回歸分析3.1 一元線性回歸分析一元回歸處理的是兩個(gè)變量之間的關(guān)系,即兩個(gè)變量和間若存在一定的關(guān)系,則通過(guò)實(shí)驗(yàn),分析所得數(shù)據(jù),找出兩者之間關(guān)系的經(jīng)驗(yàn)公式。假如兩個(gè)變量的關(guān)系式是線性的,那就是一元線性回歸分析所研究的對(duì)象。3.1.1 一元線性回歸分析的基本原理和方法我們可以用一條直線來(lái)表示和的關(guān)系,并借助最小二乘法,可得到一元線性回歸的回歸方程又叫做回歸方程的回歸系數(shù)。下面根據(jù)最小二乘法原則來(lái)確定的取值。對(duì)于每一個(gè),由方程可以確定一個(gè)回歸值。這個(gè)回歸值與實(shí)際觀測(cè)值之差,刻畫了與回歸直線的偏離程度。對(duì)于所有的,若與的偏離程度越
23、小,則直線和所有的試驗(yàn)點(diǎn)擬合得越好。全部值與回歸值的偏離平方和由最小二乘法可知要使q達(dá)到極小值,只要對(duì)上式分別對(duì)求偏導(dǎo),并令它們等于零,于是可以推導(dǎo)出的值其中,分別表示,的算術(shù)平均值。3.1.2 決定系數(shù)利用最小二乘法可求出使因變量的觀察值與因變量的預(yù)測(cè)值之間的離差平方和為最小的a與b值。與之間的差即為以估計(jì)所產(chǎn)生的誤差;第個(gè)觀察值的離差為,此差值也稱為第個(gè)殘差(residual)。因此,最小二乘法中所處理的平方和,常被稱為誤差平方和或殘差平方和,以sse表示。由此可知,如果在總離差平方和中回歸平方和所占的比重越大,則線性回歸效果越好,表明回歸直線對(duì)觀測(cè)值的擬合優(yōu)度越好。將回歸平方和與總離差平
24、方和之比定義為決定系數(shù),記為,即決定系數(shù)是一個(gè)衡量回歸直線對(duì)觀測(cè)值擬合優(yōu)度的相對(duì)指標(biāo),反映了因變量的波動(dòng)中能用自變量所解釋的比例的值總是在01之間, 越接近于l,擬合優(yōu)度就越好;反之,說(shuō)明模型中所給出的對(duì)的信息還不充分,回歸方程的效果不好,應(yīng)進(jìn)行修改,使與的信息得到充分利用。其中:總體平方和:回歸平方和:殘差平方和:3.2 多元線性回歸分析在許多實(shí)際問(wèn)題中,影響因變量的因素往往有多個(gè),這種一個(gè)因變量同多個(gè)自變量的回歸問(wèn)題就是多元回歸,當(dāng)因變量與各自變量之間為線性關(guān)系時(shí),稱為多元線性回歸。多元線性回歸分析的原理同一元線性回歸基本相同。3.2.1 多元回歸模型與回歸方程設(shè)因變量為,個(gè)自變量分別為,
25、描述因變量如何依賴于自變量和誤差項(xiàng)的方程稱為多元回歸模型。其一般形式可表示為:式中,是模型的參數(shù);為誤差項(xiàng)。此式表明:是的線性函數(shù)()部分加上誤差項(xiàng)。誤差項(xiàng)反映了除與的線性關(guān)系之外的隨機(jī)因素對(duì)的影響,是不能由與的線性關(guān)系所解釋的變異性。誤差項(xiàng)有三個(gè)基本假定:(1)誤差項(xiàng)是一個(gè)期望為零的隨機(jī)變量,即.這意味著對(duì)于給定的的值,的期望值 (2)對(duì)于自變量的所有值,的方差都相同。(3)誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立,即。獨(dú)立性意味著自變量的一組特定值所對(duì)應(yīng)的與任意一組其他值所對(duì)應(yīng)的不相關(guān)。正態(tài)性意味著對(duì)于給定的的值,因變量也是一個(gè)服從正態(tài)分布的隨機(jī)變量。根據(jù)模型的假定有即為多元回歸方程
26、,它描述了因變量的期望值與自變量之間的關(guān)系?;貧w方程中的參數(shù)是未知的,需要利用樣本數(shù)據(jù)去估計(jì)。當(dāng)用樣本統(tǒng)計(jì)量去估計(jì)回歸方程中的未知參數(shù)時(shí),就得到了估計(jì)的多元回歸方程:式中,是參數(shù)的估計(jì)值:是因變量的估計(jì)值。稱為偏回歸系數(shù)。表示當(dāng)除了之外的其它自變量不變時(shí)每變動(dòng)一個(gè)單位因變量的平均變動(dòng)量。參數(shù)的最小二乘估計(jì):回歸方程中的是通過(guò)最小二乘法求得,也就是使殘差平方和最小。由此可求得的值。3.2.2 多元回歸方程的多重判定系數(shù)多重判定系數(shù)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映了在因變量的變差中被估計(jì)的回歸方程所解釋的比例。其定義式為:多重判定系數(shù)的注意事
27、項(xiàng):自變量個(gè)數(shù)的增加將影響到因變量中被估計(jì)的回歸方程所解釋的變差數(shù)量。當(dāng)增加自變量時(shí),會(huì)使預(yù)測(cè)誤差變得比較小,從而減少了殘差平方和sse。由于回歸平方和ssr=sst-sse,當(dāng)sse變小時(shí),ssr就會(huì)變大,從而使變大。如果模型中增加一個(gè)自變量,即使這個(gè)自變量在統(tǒng)計(jì)上并不顯著,也會(huì)增大。為避免增加自變量而高估,可以使用調(diào)整的多重判定系數(shù)。調(diào)整的多重判定系數(shù)計(jì)算式為:同時(shí)考慮了樣本量和模型中自變量的個(gè)數(shù)的影響,從而調(diào)整的多重判定系數(shù)永遠(yuǎn)小于多重判定系數(shù),并且調(diào)整的多重判定系數(shù)的值不會(huì)由于模型中自變量個(gè)數(shù)的增加而越來(lái)越接近1。在多元回歸分析中具有更大優(yōu)勢(shì)。3.2.3 多重共線性現(xiàn)象當(dāng)回歸模型中使用
28、二個(gè)或二個(gè)以上的自變量時(shí),這些自變量往往會(huì)提供多余的信息;即這些自變量之間彼此相關(guān)。多重共線性在回歸分析中產(chǎn)生的問(wèn)題:首先,變量之間高度相關(guān)時(shí),可能會(huì)使回歸的結(jié)果造成混亂,甚至把分析引入歧途。其次,多重共線性可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響,當(dāng)存在多重共線性時(shí),對(duì)回歸系數(shù)的解釋將是危險(xiǎn)的。多重共線性的判別:檢測(cè)多重共線性最簡(jiǎn)單的方法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)。如果有一個(gè)或多個(gè)相關(guān)系數(shù)是顯著的,就表示模型中所的自變量之間相關(guān),因而存在著多重共線性問(wèn)題。多重共線性的具體表現(xiàn):(1)模型各對(duì)自變量之間顯著相關(guān)。(2)當(dāng)模型的線性關(guān)系檢驗(yàn)(檢驗(yàn))顯著時(shí),幾乎所有
29、的回歸系數(shù)的t檢驗(yàn)卻不顯著。(3)回歸系數(shù)的正負(fù)號(hào)與預(yù)期相反。多重共線性問(wèn)題的處理:(1)將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)。(2)如果要在模型中保留所有的自變量,那就要:a避免t統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)進(jìn)行檢驗(yàn)。b對(duì)因變量值得推斷(估計(jì)或預(yù)測(cè))限定在自變量樣本值的范圍內(nèi)。多重共線性問(wèn)題帶來(lái)的主要麻煩是對(duì)單個(gè)回歸系數(shù)的解釋和檢驗(yàn)。在求因變量的置信區(qū)間和預(yù)測(cè)區(qū)間時(shí)一般不會(huì)受其影響,但必須保證用于估計(jì)或預(yù)測(cè)的自變量的值是在樣本數(shù)據(jù)的范圍之內(nèi)。因此,如果僅僅是為了估計(jì)或預(yù)測(cè),則可以將所有的自變量都保留在模型中。3.3 變量選擇根據(jù)多個(gè)自變量建立回歸模型時(shí),若試圖將所有的自變量都
30、引入回歸模型將會(huì)使建立的模型不能進(jìn)行有效的解釋。因此,必須在建立模型之前能對(duì)所收集到的自變量進(jìn)行篩選,去掉不必要的自變量,這樣才能使模型變得更容易,更具操作性,也更容易解釋。3.3.1 變量的選擇過(guò)程在建立回歸模型時(shí),總希望用最少的變量來(lái)建立模型。在進(jìn)行回歸分析時(shí),每次只增加一個(gè)變量,并且將新變量與已經(jīng)在模型中的變量進(jìn)行比較,若新變量引入模型后以前的某個(gè)變量的t統(tǒng)計(jì)量不顯著,這個(gè)變量就會(huì)從模型中被剔除,這樣回歸分析就很難存在多重共線性的影響,這也是回歸過(guò)程的搜尋過(guò)程。選擇自變量的原則是對(duì)統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn),檢驗(yàn)的依據(jù)為:將一個(gè)或一個(gè)以上的自變量引入回歸模型中,是否使殘差平方和(sse)有顯著
31、減少。如果增加一個(gè)自變量使殘差平方和(sse)的減少是顯著的,則說(shuō)明有必要將這個(gè)自變量引入回歸模型,否則,就沒(méi)有必要將這個(gè)自變量引入回歸模型。確定在模型中引入自變量是否使殘差平方和(sse)有顯著減少的方法,就是使用統(tǒng)計(jì)量的值作為一個(gè)標(biāo)準(zhǔn),以此來(lái)確定是在模型中增加一個(gè)自變量,還是從模型中剔除一個(gè)自變量。3.3.2 變量選擇的方法變量選擇的主要方法有:向前選擇、向后剔除、逐步回歸向前選擇向前選擇法是從模型中沒(méi)有自變量開始,然后按照以下步驟選擇自變量來(lái)擬合模型:第一步:對(duì)個(gè)自變量分別擬合對(duì)因變量的一元線性回歸模型,共有個(gè),然后找出f統(tǒng)計(jì)量的值最高的模型及其自變量,并將其首先引入模型。(如果所有模型
32、均無(wú)統(tǒng)計(jì)上顯著性,則運(yùn)算過(guò)程終止,沒(méi)有模型擬合)第二步:在已經(jīng)引入模型的的基礎(chǔ)上,再分別擬合引入模型外的個(gè)自變量的線性回歸模型,即變量組合的個(gè)線性回歸模型。然后再分別考察這個(gè)線性模型,挑選出f統(tǒng)計(jì)量的值最大的含有二個(gè)自變量的模型,并將f統(tǒng)計(jì)量的值最大的那個(gè)自變量引入模型。如果除之外的個(gè)自變量中沒(méi)有一個(gè)是統(tǒng)計(jì)上顯著的,則運(yùn)算過(guò)程終止。如此反復(fù)進(jìn)行,直至模型外的自變量均無(wú)統(tǒng)計(jì)顯著性為止。向后剔除向后剔除的過(guò)程與向前選擇法過(guò)程相反,具體如下:第一步:先對(duì)因變量擬合包括所有個(gè)自變量的線性回歸模型。然后考察個(gè)去掉一個(gè)自變量的模型(這些模型中的每一個(gè)都有個(gè)自變量),使模型的sse值減少最少的自變量被挑選出
33、來(lái)并從模型中剔除。第二步:考察個(gè)再去掉一個(gè)自變量的模型(這些模型中的每一個(gè)都有個(gè)自變量),使模型的sse值減少最少的自變量被挑選出來(lái)并從模型中剔除。如此反復(fù)進(jìn)行,一直將自變量從模型中剔除,直至剔除一個(gè)自變量不會(huì)使sse顯著減少為止。這時(shí),模型中所剩的自變量都是顯著的。此過(guò)程可以通過(guò)檢驗(yàn)的p值來(lái)判斷。逐步回歸逐步回歸是將向前選擇與向后剔除二種方法結(jié)合起來(lái)篩選自變量的方法。前二步與向前選擇法相同。不過(guò)在增加了一個(gè)自變量后,它會(huì)對(duì)模型中所有的變量進(jìn)行考察,看看有沒(méi)有可能剔除某個(gè)自變量。如果在增加了一個(gè)自變量后,前面增加的某個(gè)自變量對(duì)模型的貢獻(xiàn)變得不顯著,這個(gè)變量就會(huì)被剔除。逐步回歸是向前選擇和向后剔
34、除的結(jié)合。逐步回歸過(guò)程就是按此方法不停的增加變量并考慮剔除以前增加的變量的可能性,直至增加的變量已經(jīng)不能導(dǎo)致殘差平方和的顯著減少,這個(gè)過(guò)程可以通過(guò)f統(tǒng)計(jì)量來(lái)檢驗(yàn)。逐步回歸法在前面步驟中剔除的自變量在后面的步驟中也可能重新進(jìn)入到模型中。4 回歸分析的統(tǒng)計(jì)檢驗(yàn)利用最小二乘法可以計(jì)算出線性回歸中的參數(shù)值,但由此確定的線性回歸方程不能立即用于對(duì)實(shí)際問(wèn)題的分析,還必須對(duì)回歸方程的線性關(guān)系進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),包括方程的顯著性檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn),殘差分析等。4.1 回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn)正是要檢驗(yàn)被解釋變量和解釋變量與所有解釋變量之間的線性關(guān)系是否顯著,用線性回歸方程來(lái)描述它們之間的
35、關(guān)系是否恰當(dāng)?;貧w方程顯著性檢驗(yàn)的基本出發(fā)點(diǎn)和擬合優(yōu)度檢驗(yàn)非常相似。在回歸方程的顯著性檢驗(yàn)中采用方差分析的方法,研究sst中的ssa相對(duì)于sse所占的比例。如果占有較大的比例,則表示與全體的線性關(guān)系明顯;反之,如果所占的比例較小,則表示與全體的線性關(guān)系不明顯,利用線性模型反應(yīng)二者的關(guān)系是不恰當(dāng)?shù)摹?.1.1 多元線性回歸方程的顯著性檢驗(yàn)對(duì)于多元線性回歸方程,其顯著性檢驗(yàn)的原假設(shè)為:,即各個(gè)偏回歸系數(shù)與零無(wú)顯著差異。當(dāng)偏回歸系數(shù)同時(shí)為零時(shí),無(wú)論各個(gè)如何變化都不會(huì)引起y的線性變化,所有無(wú)法解釋的線性變化,與全體不存在線性關(guān)系。多元線性回歸的顯著性檢驗(yàn)采用f統(tǒng)計(jì)量,其數(shù)學(xué)定義為:為多元線性回歸方程中
36、的解釋變量的個(gè)數(shù)。統(tǒng)計(jì)量服從自由度為(p,n-p-1)的分布。利用spss將自動(dòng)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值及相應(yīng)的概率值。如果概率值小于給定的顯著性水平,則應(yīng)拒絕原假設(shè),認(rèn)為回歸系數(shù)與零有顯著差別,被解釋變量與解釋變量的線性關(guān)系顯著,應(yīng)保留在回歸方程中;反之,如果概率值大于給定的顯著性水平,則應(yīng)接受原假設(shè),認(rèn)為回歸系數(shù)與零無(wú)顯著性差別,被解釋變量與解釋變量的線性關(guān)系不顯著,不應(yīng)保留在回歸方程中。4.2 回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)是圍繞回歸系數(shù)(或偏回歸系數(shù))估計(jì)值的抽樣分布展開的,以此構(gòu)造服從某種理論分布的檢驗(yàn)統(tǒng)計(jì)量,并進(jìn)行檢驗(yàn)。4.2.1 一元線性回歸系數(shù)的檢驗(yàn)一元線性回歸系數(shù)的
37、顯著性檢驗(yàn)原假設(shè)為:=0,即回歸系數(shù)與0無(wú)顯著差別,即當(dāng)回歸系數(shù)為零時(shí),不論取值如何變化都不會(huì)引起的變化,無(wú)法解釋的變化,二者之間不存在線性關(guān)系。在一元線性回歸模型中回歸系數(shù)估計(jì)值的抽樣分布服從:于是在原假設(shè)成立時(shí),可構(gòu)造t統(tǒng)計(jì)量為:t統(tǒng)計(jì)量服從自由度為n-2的t分布。利用spss可以自動(dòng)計(jì)算出t統(tǒng)計(jì)量的觀測(cè)值和對(duì)應(yīng)的概率值。如果概率值小于給定的顯著性水平,則應(yīng)拒絕原假設(shè),認(rèn)為回歸系數(shù)與零有顯著差別,被解釋變量與解釋變量的線性關(guān)系顯著,應(yīng)保留在回歸方程中;反之,如果概率值大于給定的顯著性水平,則應(yīng)接受原假設(shè),認(rèn)為回歸系數(shù)與零無(wú)顯著性差別,被解釋變量與解釋變量的線性關(guān)系不顯著,不應(yīng)保留在回歸方程
38、中。4.2.2 多元線性回歸系數(shù)的檢驗(yàn)多元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的原假設(shè)為:,即第i個(gè)偏回歸系數(shù)與零無(wú)顯著性差異,即當(dāng)回歸系數(shù)為零時(shí),不論取值如何變化都不會(huì)引起的變化,都無(wú)法解釋的變化,二者之間不存在線性關(guān)系。在多元線性回歸模型中偏回歸系數(shù)估價(jià)值的抽樣分布服從:在原假設(shè)成立的前提下,可構(gòu)造t檢驗(yàn)統(tǒng)計(jì)量為:服從自由度為n-p-1的t分布。利用spss可以自動(dòng)計(jì)算出t統(tǒng)計(jì)量的觀測(cè)值和對(duì)應(yīng)的概率值。如果概率值小于給定的顯著性水平,則應(yīng)拒絕原假設(shè),認(rèn)為回歸系數(shù)與零有顯著差別,被解釋變量與解釋變量的線性關(guān)系顯著,應(yīng)保留在回歸方程中;反之,如果概率值大于給定的顯著性水平,則應(yīng)接受原假設(shè),認(rèn)為回歸
39、系數(shù)與零無(wú)顯著性差別,被解釋變量與解釋變量的線性關(guān)系不顯著,不應(yīng)保留在回歸方程中。4.3 殘差分析殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距,定義為:它是回歸模型中的估計(jì)值,由多個(gè)形成的序列稱為殘差序列。4.3.1 殘差分析內(nèi)容殘差分析是回歸方程檢驗(yàn)中的重要組成部分,其出發(fā)點(diǎn)是:如果回歸方程能夠很好的解釋變量的特征與變化規(guī)律,那么殘差序列中應(yīng)不包含明顯的規(guī)律性和趨勢(shì)性。主要內(nèi)容為:分析殘差是否服從均值為零的正態(tài)分布;分析殘差是否為等方差的正態(tài)分布;分析殘差序列是否獨(dú)立;借助殘差探測(cè)樣本中的異常值等。當(dāng)解釋變量取某個(gè)特定值時(shí),對(duì)應(yīng)的殘差有正有負(fù),但總體上服從以零為均值的正態(tài)分布???/p>
40、以通過(guò)繪制殘差圖對(duì)該問(wèn)題進(jìn)行分析,如果殘差的均值為零,殘差圖中的點(diǎn)在縱坐標(biāo)為零的橫線上下隨機(jī)散落。對(duì)于殘差正態(tài)性分析可以通過(guò)繪制標(biāo)準(zhǔn)化殘差的概率圖來(lái)進(jìn)行。如果回歸直線對(duì)原始數(shù)據(jù)的擬合是良好的,那么殘差的絕對(duì)數(shù)值比較小,描繪的點(diǎn)應(yīng)在的直線上下隨機(jī)散布,這反映出殘差服從均值為零,方差為的正態(tài)分布,符合原來(lái)的假設(shè)要求。若殘差數(shù)據(jù)點(diǎn)不是在的直線上下呈隨機(jī)分布,而是出現(xiàn)了漸增或漸減的系統(tǒng)變動(dòng)趨勢(shì),則說(shuō)明擬合的回歸方程與原來(lái)的假設(shè)有一定差距。4.3.2 殘差序列的獨(dú)立性殘差序列的獨(dú)立性也是回歸模型所要求的,殘差序列的前期和后期數(shù)值之間不應(yīng)存在相關(guān)關(guān)系,即不存在自相關(guān)。殘差序列存在自相關(guān)性會(huì)帶來(lái)許多問(wèn)題,如
41、參數(shù)的最小二乘估計(jì)不再是最優(yōu)的,不再是最小方差無(wú)偏估計(jì);容易導(dǎo)致回歸系數(shù)顯著性檢驗(yàn)的t值偏高,進(jìn)而容易拒絕原假設(shè),使那些本不應(yīng)該保留在方程中的變量被保留下來(lái),并最終使模型的預(yù)測(cè)偏差較大。殘差分析的獨(dú)立性分析可以通過(guò)以下方式實(shí)現(xiàn):(1) 直線相關(guān)(2) 繪制殘差序列的序列圖。殘差序列以時(shí)間為橫坐標(biāo),以殘差為縱坐標(biāo)。對(duì)圖形直線觀察可以發(fā)現(xiàn)是否存在自相關(guān)性。如果殘差隨時(shí)間的推移呈有規(guī)律的變化,表明殘差序列存在一定的正或負(fù)相關(guān)。(3) 計(jì)算殘差的自相關(guān)系數(shù)。自相關(guān)系數(shù)是一種測(cè)度序列自相關(guān)強(qiáng)弱的工具,期數(shù)學(xué)公式為:自相關(guān)系數(shù)的取值范圍在-11之間。接近于1表明序列存在正自相關(guān);接近-1表明序列存在負(fù)自相
42、關(guān)。(4)dw檢驗(yàn)dw檢驗(yàn)是推斷小樣本序列是否存在自相關(guān)的統(tǒng)計(jì)檢驗(yàn)方法。其原假設(shè)為總體的自相關(guān)系數(shù)與0無(wú)顯著差異。采用的檢驗(yàn)統(tǒng)計(jì)量為:dw取值在04之間。當(dāng)序列不存在自相關(guān)時(shí),。所以,對(duì)dw觀測(cè)值的直觀判斷標(biāo)準(zhǔn)為:當(dāng)dw=4時(shí),殘差序列存在完全負(fù)自相關(guān);當(dāng)dw取值在2到4時(shí),殘差序列存在負(fù)自相關(guān);當(dāng)dw=2時(shí),殘差序列無(wú)自相關(guān);當(dāng)dw取值在0到2時(shí),殘差序列存在正相關(guān)性;當(dāng)dw=0時(shí),殘差序列存在完全正自相關(guān)。如果殘差序列存在自相關(guān)則說(shuō)明回歸方程不能夠充分說(shuō)明被解釋變量的變化,還留有一些規(guī)律性沒(méi)有被解釋,即回歸模型選擇不合適。4.4 方差分析方差分析是從觀測(cè)變量的方差入手,研究諸多控制變量中哪
43、些變量是對(duì)觀測(cè)變量有顯著影響的變量。4.4.1 方差分析簡(jiǎn)介方差分析(analysis of variance,簡(jiǎn)稱anova),又稱“變異數(shù)分析”或“f檢驗(yàn)”,是由r.a.fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。 由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類,一是不可控的隨機(jī)因素,另一是研究中施加的對(duì)結(jié)果形成影響的可控因素。1. 方差分析的假定條件為:(1)各處理?xiàng)l件下的樣本是隨機(jī)的。(2)各處理?xiàng)l件下的樣本是相互獨(dú)立的,否則可能出現(xiàn)無(wú)法解析的輸出結(jié)果。(3)各處理?xiàng)l件下的樣本分別來(lái)自正態(tài)分布總體,否則使用非參數(shù)分析。(4)各處理?xiàng)l件下的樣本
44、方差相同,即具有齊效性。2. 方差分析的假設(shè)檢驗(yàn):假設(shè)有個(gè)樣本,如果原假設(shè):樣本均數(shù)都相同,個(gè)樣本有共同的方差,則個(gè)樣本來(lái)自具有共同方差和相同均值的總體。如果經(jīng)過(guò)計(jì)算,組間均方遠(yuǎn)遠(yuǎn)大于組內(nèi)均方,則推翻原假設(shè),說(shuō)明樣本來(lái)自不同的正態(tài)總體,說(shuō)明處理造成均值的差異有統(tǒng)計(jì)意義。否則承認(rèn)原假設(shè),樣本來(lái)自相同總體,處理間無(wú)差異。3. 方差分析的作用:一個(gè)復(fù)雜的事物,其中往往有許多因素互相制約又互相依存。方差分析的目的是通過(guò)數(shù)據(jù)分析找出對(duì)該事物有顯著影響的因素,各因素之間的交互作用,以及顯著影響因素的最佳水平等。方差分析是在可比較的數(shù)組中,把數(shù)據(jù)間的總的“變差”按各指定的變差來(lái)源進(jìn)行分解的一種技術(shù)。對(duì)變差的
45、度量,采用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定來(lái)源的部分離差平方和,這是一個(gè)很重要的思想。4.4.2 單因素方差分析 1. 單因素方差分析概念理解單因素方差分析是用來(lái)研究一個(gè)控制變量的不同水平是否對(duì)觀測(cè)變量產(chǎn)生了顯著影響。這里,由于僅研究單個(gè)因素對(duì)觀測(cè)變量的影響,因此稱為單因素方差分析。2. 單因素方差分析步驟單因素方差分析的第一步是明確觀測(cè)變量和控制變量。單因素方差分析的第二步是剖析觀測(cè)變量的方差。方差分析認(rèn)為:觀測(cè)變量值得變動(dòng)會(huì)受控制變量和隨機(jī)變量?jī)煞矫娴挠绊憽?jù)此,單因素方差分析將觀測(cè)變量總的離差平方和分解為組間離差平方和和組內(nèi)離差平方和兩部分,用數(shù)學(xué)形式表述為:
46、sst=ssa+sse。單因素方差分析的第三步是通過(guò)比較觀測(cè)變量總離差平方和各部分所占的比例,推斷控制變量是否給觀測(cè)變量帶來(lái)了顯著影響。3. 單因素方差分析原理在觀測(cè)變量總離差平方和中,如果組間離差平方和所占比例較大,則說(shuō)明觀測(cè)變量的變動(dòng)主要是由控制變量引起的,可以主要由控制變量來(lái)解釋,控制變量給觀測(cè)變量帶來(lái)了顯著影響;反之,如果組間離差平方和所占比例小,則說(shuō)明觀測(cè)變量的變動(dòng)不是主要由控制變量引起的,不可以主要由控制變量來(lái)解釋,控制變量的不同水平?jīng)]有給觀測(cè)變量帶來(lái)顯著影響,觀測(cè)變量值的變動(dòng)是由隨機(jī)變量因素引起的。4. 單因素方差分析基本步驟a、提出原假設(shè):即為無(wú)差異;有顯著差異b、選擇檢驗(yàn)統(tǒng)計(jì)
47、量:方差分析采用的檢驗(yàn)統(tǒng)計(jì)量是統(tǒng)計(jì)量,即值檢驗(yàn)。c、計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和概率值:該步驟的目的就是計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和相應(yīng)的概率值。d、給定顯著性水平,并作出決策5. 單因素方差分析的進(jìn)一步分析在完成上述單因素方差分析的基本分析后,可得到關(guān)于控制變量是否對(duì)觀測(cè)變量造成顯著影響的結(jié)論,接下來(lái)還應(yīng)做其他幾個(gè)重要分析,主要包括方差齊性檢驗(yàn)、多重比較檢驗(yàn)。(1)方差齊性檢驗(yàn)方差齊性檢驗(yàn)是對(duì)控制變量不同水平下各觀測(cè)變量總體方差是否相等進(jìn)行檢驗(yàn)。前面提到,控制變量不同各水平下觀測(cè)變量總體方差無(wú)顯著差異是方差分析的前提要求。如果沒(méi)有滿足這個(gè)前提要求,就不能認(rèn)為各總體分布相同。因此,有必要對(duì)方差是否齊性
48、進(jìn)行檢驗(yàn)。spss單因素方差分析中,方差齊性檢驗(yàn)采用了方差同質(zhì)性(homogeneity of variance)檢驗(yàn)方法,其原假設(shè)是:各水平下觀測(cè)變量總體的方差無(wú)顯著差異。(2)多重比較檢驗(yàn)單因素方差分析的基本分析只能判斷控制變量是否對(duì)觀測(cè)變量產(chǎn)生了顯著影響。如果控制變量確實(shí)對(duì)觀測(cè)變量產(chǎn)生了顯著影響,進(jìn)一步還應(yīng)確定控制變量的不同水平對(duì)觀測(cè)變量的影響程度如何,其中哪個(gè)水平的作用明顯區(qū)別于其他水平,哪個(gè)水平的作用是不顯著的,等等。多重比較檢驗(yàn)利用了全部觀測(cè)變量值,實(shí)現(xiàn)對(duì)各個(gè)水平下觀測(cè)變量總體均值的逐對(duì)比較。由于多重比較檢驗(yàn)問(wèn)題也是假設(shè)檢驗(yàn)問(wèn)題,因此也遵循假設(shè)檢驗(yàn)的基本步驟。6. 檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造
49、方法(1)lsd方法lsd方法稱為最小顯著性差異(least significant difference)法。最小顯著性差異法的字畫就體現(xiàn)了其檢驗(yàn)敏感性高的特點(diǎn),即水平間的均值只要存在一定程度的微小差異就可能被檢驗(yàn)出來(lái)。正是如此,它利用全部觀測(cè)變量值,而非僅使用某兩組的數(shù)據(jù)。lsd方法適用于各總體方差相等的情況,但它并沒(méi)有對(duì)犯一類錯(cuò)誤的概率問(wèn)題加以有效控制。(2)s-n-k方法s-n-k方法是一種有效劃分相似性子集的方法。該方法適合于各水平觀測(cè)值個(gè)數(shù)相等的情況。7. 其他檢驗(yàn)(1)先驗(yàn)對(duì)比檢驗(yàn)在多重比較檢驗(yàn)中,如果發(fā)現(xiàn)某些水平與另外一些水平的均值差距顯著,如有五個(gè)水平,其中、與、的均值有顯著
50、差異,就可以進(jìn)一步分析比較這兩組總的均值是否存在顯著差異,即與是否有顯著差異。這種事先指定各均值的系數(shù),再對(duì)其線性組合進(jìn)行檢驗(yàn)的分析方法稱為先驗(yàn)對(duì)比檢驗(yàn)。通過(guò)先驗(yàn)對(duì)比檢驗(yàn)?zāi)軌蚋_地掌握各水平間或各相似性子集間均值的差異程度。(2)趨勢(shì)檢驗(yàn)當(dāng)控制變量為定序變量時(shí),趨勢(shì)檢驗(yàn)?zāi)軌蚍治鲭S著控制變量水平的變化,觀測(cè)變量值變化的總體趨勢(shì)是怎樣的,是呈現(xiàn)線性變化趨勢(shì),還是呈二次、三次等多項(xiàng)式變化。通過(guò)趨勢(shì)檢驗(yàn),能夠幫助人們從另一個(gè)角度把握控制變量不同水平對(duì)觀測(cè)變量總體作用的程度。4.4.3 多因素方差分析1. 多因素方差分析基本思想多因素方差分析用來(lái)研究?jī)蓚€(gè)及兩個(gè)以上控制變量是否對(duì)觀測(cè)變量產(chǎn)生顯著影響。這
51、里,由于研究多個(gè)因素對(duì)觀測(cè)變量的影響,因此稱為多因素方差分析。多因素方差分析不僅能夠分析多個(gè)因素對(duì)觀測(cè)變量的獨(dú)立影響,更能夠分析多個(gè)控制因素的交互作用能否對(duì)觀測(cè)變量的分布產(chǎn)生顯著影響,進(jìn)而最終找到利于觀測(cè)變量的最優(yōu)組合。2多因素方差分析的其他功能均值檢驗(yàn)在spss中,利用多因素方差分析功能還能夠?qū)Ω骺刂谱兞坎煌较掠^測(cè)變量的均值是否存在顯著差異進(jìn)行比較,實(shí)現(xiàn)方式有兩種,即多重比較檢驗(yàn)和對(duì)比檢驗(yàn)。多重比較檢驗(yàn)的方法與單因素方差分析類似。對(duì)比檢驗(yàn)采用的是單樣本檢驗(yàn)的方法,它將控制變量不同水平下的觀測(cè)變量值看做來(lái)自不同總體的樣本,并依次檢驗(yàn)這些總體的均值是否與某個(gè)指定的檢驗(yàn)值存在顯著差異。其中,檢
52、驗(yàn)值可以指定為以下幾種:觀測(cè)變量的均值(deviation);第一水平或最后一個(gè)水平上觀測(cè)變量的均值(simple);前一水平上觀測(cè)變量的均值(difference);后一水平上觀測(cè)變量的均值(helmert)。4.4.4 協(xié)方差分析1. 協(xié)方差分析基本思想不論是單因素方差分析還是多因素方差分析,控制因素都是可控的,其各個(gè)水平可以通過(guò)人為的努力得到控制和確定。但在許多實(shí)際問(wèn)題中,有些控制因素很難人為控制,但它們的不同水平確實(shí)對(duì)觀測(cè)變量產(chǎn)生了較為顯著的影響。 2. 協(xié)方差分析的原理協(xié)方差分析將那些人為很難控制的控制因素作為協(xié)變量,并在排除協(xié)變量對(duì)觀測(cè)變量影響的條件下,分析控制變量(可控)對(duì)觀測(cè)變
53、量的作用,從而更加準(zhǔn)確地對(duì)控制因素進(jìn)行評(píng)價(jià)。協(xié)方差分析仍然沿承方差分析的基本思想,并在分析觀測(cè)變量變差時(shí),考慮了協(xié)變量的影響,人為觀測(cè)變量的變動(dòng)受四個(gè)方面的影響:即控制變量的獨(dú)立作用、控制變量的交互作用、協(xié)變量的作用和隨機(jī)因素的作用,并在扣除協(xié)變量的影響后,再分析控制變量的影響。方差分析中的原假設(shè)是:協(xié)變量對(duì)觀測(cè)變量的線性影響是不顯著的;在協(xié)變量影響扣除的條件下,控制變量各水平下觀測(cè)變量的總體均值無(wú)顯著差異,控制變量各水平對(duì)觀測(cè)變量的效應(yīng)同時(shí)為零。檢驗(yàn)統(tǒng)計(jì)量仍采用f統(tǒng)計(jì)量,它們是各均方與隨機(jī)因素引起的均方比。5 銀行卡受理環(huán)境對(duì)銀行卡業(yè)務(wù)量的影響分析5.1 數(shù)據(jù)、變量選取與模型設(shè)計(jì)銀行卡業(yè)務(wù)需
54、求與銀行卡的受理環(huán)境存在關(guān)聯(lián)性,銀行卡受理環(huán)境的建設(shè)將對(duì)銀行卡的業(yè)務(wù)量產(chǎn)生影響。而銀行卡的受理環(huán)境中,有許多因素對(duì)銀行卡的業(yè)務(wù)量產(chǎn)生影響,但考慮到影響因素的重要性以及數(shù)據(jù)的可得性。選取特約商戶的數(shù)量(),儲(chǔ)蓄網(wǎng)點(diǎn)的數(shù)量(),atm機(jī)的數(shù)量()和pos機(jī)的數(shù)量()這四個(gè)變量為自變量,而以我國(guó)銀行卡的業(yè)務(wù)量為因變量(y)。以表5.1中的數(shù)據(jù)為基礎(chǔ),使用spss軟件的多元線性回歸分析過(guò)程對(duì)我國(guó)銀行卡業(yè)務(wù)交易金額尋求恰當(dāng)?shù)亩嘣貧w函數(shù)模型,分析銀行卡業(yè)務(wù)交易金額量與對(duì)它具有顯著影響的因素之間的關(guān)系。表5.1 1995年至2004年銀行卡業(yè)務(wù)量回歸分析數(shù)據(jù)時(shí)間銀行卡業(yè)務(wù)量(萬(wàn)元)特約商戶(個(gè))儲(chǔ)蓄網(wǎng)點(diǎn)(
55、個(gè))atm機(jī)(臺(tái))pos機(jī)終端(臺(tái))20042637796935.36486261336096835234944820031798279626.645061991384175973633023220021156018471.09436014140390489662859002001842794866400671130114399572999822000452999919383683125268330942878451999242167209.34345190123643264242235091998132018300305776.9611440220634180272199712965270028052610778418346131924199610377300023453295315994199716199596122000183422769837051483845.2 銀行卡業(yè)務(wù)量函數(shù)的回歸擬合分析5.2.1 回歸方法的選擇及標(biāo)準(zhǔn)取y 為因變量,為自
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 能源資源開發(fā)與利用作業(yè)指導(dǎo)書
- 醫(yī)院建設(shè)項(xiàng)目可行性研究
- 公共建筑節(jié)能(綠色建筑)設(shè)計(jì)標(biāo)準(zhǔn)
- 醫(yī)療器械居間銷售提成保證
- 4S店裝修環(huán)保保證金協(xié)議
- 高鐵經(jīng)濟(jì)圈用地購(gòu)置居間
- 信息化項(xiàng)目可行性研究報(bào)告編制規(guī)范
- 2025年度保健食品個(gè)性化定制配送與市場(chǎng)推廣服務(wù)合同
- 農(nóng)民合作社志愿者招募手冊(cè)
- 低空經(jīng)濟(jì)未來(lái)產(chǎn)業(yè)
- 2025年錫林郭勒職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)標(biāo)準(zhǔn)卷
- 2024年湖北省武漢市中考數(shù)學(xué)試題(解析版)
- 低壓變頻器技術(shù)規(guī)范書
- 我的好朋友優(yōu)秀課件
- 松濤水利樞紐設(shè)計(jì)
- 2022版義務(wù)教育(語(yǔ)文)課程標(biāo)準(zhǔn)(含2022年修訂部分)
- 兒童青少年同伴關(guān)系評(píng)級(jí)量表
- 電磁閥基礎(chǔ)知識(shí)培訓(xùn)課件
- 場(chǎng)地清理檢驗(yàn)批質(zhì)量驗(yàn)收及記錄
- 鋼軌超聲波探傷PPT
- 磁共振1.5T和3.0T的差異課件
評(píng)論
0/150
提交評(píng)論