版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、決定系數(shù)r2計算決定系數(shù)r2計算【篇一:決定系數(shù)】【篇二:判定系數(shù)與相關(guān)系數(shù)的深入研究】判定系數(shù)與相關(guān)系數(shù)的深入研究什么叫相關(guān)性?比如某個地區(qū)人的身高與體重的關(guān)系,某個學(xué)校學(xué)生學(xué)習(xí)時間與學(xué)習(xí)成績的關(guān)系,我們的收入與教育水平的關(guān)系等等,除此之外,在我們工作中也有大量相關(guān)性的應(yīng)用實例,例如我們在定位質(zhì)差原因中運用常規(guī)mrr與質(zhì)差mrr的電平分布間的相關(guān)性,在定位互調(diào)干擾小區(qū)時運用干擾系數(shù)與話務(wù)量的相關(guān)性,在分析質(zhì)差成因時運用全網(wǎng)質(zhì)差話務(wù)比例與弱信號的相關(guān)性等等,既然我們的工作離不開相關(guān)性的運用,那我們有必要深入的去了解相關(guān)性的計算及其原理。一、概念介紹說到相關(guān)性分析會使我們聯(lián)想到線性回歸和散點圖的
2、概念,它們同屬于回歸分析中的概線性回歸:線性回歸是利用數(shù)理統(tǒng)計中的回歸分析,來確定兩種或兩種以上變量間相互念,都是被廣泛應(yīng)用的相關(guān)性分析方法:依賴的定量關(guān)系的一種統(tǒng)計分析方法之一,通俗點來說回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性,相關(guān)性可以從涉及到的變量數(shù)量、表現(xiàn)形式及變化方向進(jìn)行分類,如下圖所示:散點圖:散點圖是用于表示因變量隨自變量而變化的大致趨勢,是將變量相關(guān)性圖形化的工具,用于判斷的分析兩組變量之間是否存在某種關(guān)聯(lián)或總結(jié)坐標(biāo)點的分布模式,散點圖主要體現(xiàn)變量間的關(guān)系主要有:正線性相關(guān)、負(fù)線性相關(guān)、非線性(曲線)相關(guān)和不相關(guān)四種相關(guān)關(guān)系,其中線性相關(guān)又分強線性相關(guān)和一般線性相關(guān),
3、具體形態(tài)如以下圖例所示:1)強正(負(fù))線性相關(guān)2)正(負(fù))線性相關(guān)3)非線性(曲線)相關(guān)不相關(guān)二、線性回歸主要參數(shù)解釋:通過excel的數(shù)據(jù)分析”功能可以計算出線性回歸分析數(shù)據(jù),如下圖所示:我們主要關(guān)注【回歸統(tǒng)計】中可以反映變量間相關(guān)性的相關(guān)系數(shù)multipler'和判定系數(shù)rsquare'兩個指標(biāo):1.multipler(相關(guān)系數(shù)r):相關(guān)系數(shù)是建立在相關(guān)分析基礎(chǔ)上,用來分析衡量變量x和變量y之間相關(guān)程度的大小。通常用r表示,該值的范圍為:-Krw,l與值對應(yīng)的相關(guān)性的強弱關(guān)系如下圖所示:相關(guān)系數(shù)計算公式及案例:r?n?xy?n?x?(?x)22?x?yn?y?(?2y)現(xiàn)假
4、設(shè)在判斷10bszcw小區(qū)是否存互調(diào)干擾嫌疑時,通過話務(wù)量與干擾系數(shù)的相關(guān)性進(jìn)行定位,該小區(qū)24小時的綜合話務(wù)量及干擾系數(shù)如下表所示(灰x、干表中的時間段數(shù)量(24個)則為公式中的n,綜合話務(wù)量為擾系數(shù)為y,根據(jù)公式要求,先對數(shù)據(jù)進(jìn)行求和與匯總,匯總后的數(shù)據(jù)如下表所示:套入公式后計算結(jié)果如下:?=98.30%2.rsquare(判定系數(shù)r):判定系數(shù)(又稱擬臺優(yōu)度或決定系數(shù))是建立在回歸分析基礎(chǔ)之上的,用于研究一個隨機變量對另U一個隨機變量的解釋程度,該值的取值范圍為0<r,l值越接近1,說明自變量對因變量的解釋程度越高,自變量引起的因變量變動占總變動的百分比越高。判定系數(shù)算法及案例:r
5、?n?x(n?xy?n?y?x?y)?(?y)以相關(guān)系數(shù)中案例的數(shù)據(jù)為基礎(chǔ)計算10bszcw的判定系數(shù),如下:(24?1047.01?287.95?71.47)?=96.64%?案例說明:10bszcw小區(qū)的相關(guān)性系數(shù)為:98.30%,可以判斷該小區(qū)的話務(wù)量與干擾系數(shù)為正相關(guān)關(guān)系且接近絕對相關(guān)值1,說明小區(qū)話務(wù)量與干擾系數(shù)之間的關(guān)系密切;小區(qū)的判定系數(shù)為:96.64%,非常接近1,說明該小區(qū)的話務(wù)量變化導(dǎo)致干擾變化占總變化的96.64%,由此可以判斷出該小區(qū)存在互調(diào)干擾的機率非常大;如下圖10bszcw小區(qū)話務(wù)量與干擾系數(shù)趨勢圖及散點圖所示,小區(qū)話務(wù)量的曲線與干擾系數(shù)的典型形態(tài)幾乎是一模一樣的
6、,從散點圖的分布來看,兩組變量形成的點在同一直線上,說明兩組變量是存在較強的線性相關(guān);三、相關(guān)系數(shù)與判定系數(shù)函數(shù)的運用方法:在進(jìn)行質(zhì)差原因定位及規(guī)律性質(zhì)差分析等工作時,我們都需要對全網(wǎng)的小區(qū)進(jìn)行分析,所以在數(shù)據(jù)分析上必須要滿足批量計算的功能,才能更好的為我們提高工作效率,而在我們常軟件excel中也已經(jīng)包含了相關(guān)系數(shù)及判定系數(shù)的計算函數(shù),只要掌握使用方法,便可以迅速完成全網(wǎng)小區(qū)的相關(guān)系數(shù)計算工作:相關(guān)系數(shù)計算函數(shù):correl(array1,array2)arrayl第一組數(shù)值單元格區(qū)域array2第二組數(shù)值單元格區(qū)域函數(shù)說明:?如果數(shù)組或引用參數(shù)包含文本、邏輯值或空白單元格,則這些值將被忽略
7、;但包含零值的單元格將計算在內(nèi);?如果arrayl和array2的數(shù)據(jù)點的個數(shù)不同,函數(shù)correl返回錯誤值#n/a;?如果arrayl或array2為空,或者其數(shù)值的s(標(biāo)準(zhǔn)偏差)等于零,函數(shù)correl返回錯誤值#div/0!;應(yīng)用案例:known_xs為數(shù)組或數(shù)據(jù)點區(qū)域函數(shù)說明:?參數(shù)可以是數(shù)字或者是包含數(shù)字的名稱、數(shù)組或引用;?邏輯值和直接鍵入到參數(shù)列表中代表數(shù)字的文本被計算在內(nèi);?如果數(shù)組或引用參數(shù)包含文本、邏輯值或空白單元格,則這些值將被忽略;但包含零值的單元格將計算在內(nèi);?如果參數(shù)為錯誤值或為不能轉(zhuǎn)換成數(shù)字的文本,將會導(dǎo)致錯誤;?如果known_ys和known_xs為空或其數(shù)
8、據(jù)點個數(shù)不同,函數(shù)rsq返回錯【篇三:線性回歸方程中的相關(guān)系數(shù)r】線性回歸方程中的相關(guān)系數(shù)rr=E(xi-x的平均數(shù))(yi-y平均數(shù))/根號下E(x-x平均數(shù))A2*E(y-y平均數(shù))A2r2就是相關(guān)系數(shù)的平方,r在一元線性方程就直接是因變量自變量的相關(guān)系數(shù),多元則是復(fù)相關(guān)系數(shù)判定系數(shù)rA2也叫擬臺優(yōu)度、可決系數(shù)。表達(dá)式是rA2=ess/tss=1-rss/tss該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。問題:在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個解釋變量,r2往往增大這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可。但是,現(xiàn)實情況往往是,由增加解釋變量個數(shù)引起的r2的增大與擬合好壞
9、無關(guān),r2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度:r1A2=1-(rss/(n-k-1)/(tss/(n-1)在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。總是來說,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因為變量個數(shù)增加對判定結(jié)果的影響。r=r接近于1表明y與x1,x2,xk之間的線性關(guān)系程度密切;r接近于0表明y與x1,x2,,xk之間的線性關(guān)系程度不密切相關(guān)系數(shù)就是線性相關(guān)度的大小,1為(100%)絕對正相關(guān),0為0%,-1為(1
10、00%)絕對負(fù)相關(guān)相關(guān)系數(shù)絕對值越靠近1,線性相關(guān)性質(zhì)越好,根據(jù)數(shù)據(jù)描點畫出來的函數(shù)-自變量圖線越趨近于一條平直線,擬臺的直線與描點所得圖線也更相近。如果其絕對值越靠近0,那么就說明線性相關(guān)性越差,根據(jù)數(shù)據(jù)點描出的圖線和擬臺曲線相差越遠(yuǎn)(當(dāng)相關(guān)系數(shù)太小時,本來擬合就已經(jīng)沒有意義,如果強行擬合一條直線,再把數(shù)據(jù)點在同一坐標(biāo)紙上畫出來,可以發(fā)現(xiàn)大部分的點偏離這條直線很遠(yuǎn),所以用這個直線來擬臺是會出現(xiàn)很大誤差的或者說是根本錯誤的)。分為一元線性回歸和多元線性回歸線性回歸方程中,回歸系數(shù)的含義一元:yA=bx+ab表示x每變動(增加或減少)1個單位,y平均變動(增加或減少)b各單位多元:yA=b1x1
11、+b2x2+b3x3+a在其他變量不變的情況下,某變量變動1單位,引起y平均變動量以b2為例:b2表示在x1、x3(在其他變量不變的情況下)不變得情況下,x2每變動1單位,y平均變動b2單位就一個reg來說y=a+bx+ea+bx的誤差稱為explainedsumofsquaree的誤差是不能解釋的是residualsumofsquare總誤差就是tss所以tss=rss+ess判定系數(shù)也叫擬合優(yōu)度、可決系數(shù)。表達(dá)式是該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。問題:在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個解釋變量,r2往往增大這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可。但是,現(xiàn)實情
12、況往往是,由增加解釋變量個數(shù)引起的r2的增大與擬合好壞無關(guān),r2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。總是來說,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因為變量個數(shù)增加對判定結(jié)果的影響。順便補充一下:一般做回歸的時候要求擬合優(yōu)度(實際值與擬合值相關(guān)系數(shù)的平方)越高越好,可以通過增加解釋變量來實現(xiàn),可是解釋變量多了后很多解釋變量的系數(shù)t檢驗不顯著了,而且增加很多變量后模型的自由度就減少了,這些情況狂的存在往往使得模型預(yù)測不精確;修正擬合優(yōu)度就是將殘差平方和跟總離差平方和分別除以各自的自由度,這樣就剔除了變量個數(shù)對其影響了。首
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年北師大版選擇性必修1歷史上冊階段測試試卷含答案
- 2025年人教新課標(biāo)八年級地理下冊月考試卷
- 2025年粵教版選擇性必修1歷史下冊月考試卷
- 2025年浙科版高二化學(xué)下冊階段測試試卷
- 2025年蘇教新版九年級地理下冊月考試卷
- 2025年牛津上海版八年級地理下冊月考試卷含答案
- 二零二五版奶茶店顧客滿意度調(diào)查與改進(jìn)措施合同4篇
- 二零二五年度賭博引發(fā)婚姻破裂的財產(chǎn)分割與子女撫養(yǎng)合同2篇
- 2025年度影視后期制作與剪輯服務(wù)合同范本4篇
- 2025年度專業(yè)樹木種植與生態(tài)旅游開發(fā)合同4篇
- 《化工設(shè)備機械基礎(chǔ)(第8版)》全套教學(xué)課件
- 《帶一本書去讀研:研究生關(guān)鍵學(xué)術(shù)技能快速入門》筆記
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 初中數(shù)學(xué)要背誦記憶知識點(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險評估
- 農(nóng)村高中思想政治課時政教育研究的中期報告
- 20100927-宣化上人《愣嚴(yán)咒句偈疏解》(簡體全)
評論
0/150
提交評論