版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGE5PAGE授課題目(教學(xué)章、節(jié)或主題)7.1一元回歸分析需用學(xué)時(shí)2學(xué)時(shí)教學(xué)目標(biāo)(知識(shí)、能力、素養(yǎng))1、掌握一元回歸分析的基本原理和回歸方程顯著性檢驗(yàn)的方法及預(yù)測(cè)方法;2、了解MATLAB中回歸分析函數(shù)的用法和幫助系統(tǒng)等;3、學(xué)會(huì)應(yīng)用MATLAB軟件進(jìn)行一元回歸分析和建模的方法;4、培養(yǎng)學(xué)生借助計(jì)算機(jī)初步建立用回歸模型解決實(shí)際問題的能力。重點(diǎn)難點(diǎn)重點(diǎn):1、MATLAB回歸分析函數(shù)的用法;2、回歸分析建模方法。難點(diǎn):回歸分析中檢驗(yàn)課程思政元素1.通過回歸分析發(fā)展史的了解,引導(dǎo)學(xué)生樹立追求科學(xué)、精益求精的工匠精神;2.通過對(duì)回歸建模中各類案例的講解讓學(xué)生知道數(shù)學(xué)的重要性,激發(fā)學(xué)習(xí)動(dòng)力。教學(xué)內(nèi)容及過程一、一元線性回歸分析1.數(shù)學(xué)模型稱之為一元線性回歸模型.其中自變量x是可以控制的非隨機(jī)變量,稱為回歸變量,兩個(gè)未知參數(shù)a,b稱為回歸系數(shù),y稱為響應(yīng)變量或因變量.由于是隨機(jī)誤差,根據(jù)中心極限定理,通常假定,是未知參數(shù).因變量y的數(shù)學(xué)期望稱為回歸方程,它是一條直線,稱為回歸直線.一元線性回歸模型用到了以下假定:(1)因變量y與自變量x有線性關(guān)系;(2)隨機(jī)誤差項(xiàng),不同的x對(duì)應(yīng)誤差獨(dú)立.獨(dú)立性意味著一個(gè)特定的x對(duì)應(yīng)的誤差與其他的x對(duì)應(yīng)的誤差不相關(guān);方差相同意味著對(duì)于所有的x,y的方差都是,該值越小,意味著y的觀測(cè)值越靠近回歸直線.2.回歸系數(shù)的估計(jì)使用最廣泛的是最小二乘方法可求得參數(shù)估計(jì)值:.由此得到(樣本的)一元線性回歸方程.注意,這里得到的回歸方程,是由本次實(shí)驗(yàn)數(shù)據(jù)估計(jì)出來的,故也稱為經(jīng)驗(yàn)回歸方程.該方程的直線稱為回歸直線.代入觀測(cè)值,得到的值稱回歸預(yù)測(cè)值,它實(shí)際是E(y)預(yù)測(cè)值.3.回歸方程統(tǒng)計(jì)檢驗(yàn)擬合優(yōu)度檢驗(yàn)該檢驗(yàn)是檢驗(yàn)樣本觀測(cè)點(diǎn)與回歸直線的接近程度,擬合程度越高說明回歸方程對(duì)樣本的代表程度越高.回歸平方和在偏差平方和中所占的比重,記為()稱為決定系數(shù).用的大小來說明模型的擬合優(yōu)度.它測(cè)度了回歸直線對(duì)觀測(cè)數(shù)據(jù)的擬合程度.越大說明回歸平方和所占的比例越大,說明回歸直線與各觀測(cè)點(diǎn)越接近,用x的變化來解釋y的變差的部分就越多,回歸直線的擬合程度就越高。反之?dāng)M合程度就越差.在一元回歸分析中相關(guān)系數(shù)就是決定系數(shù)的算術(shù)平方根.(2)回歸方程的顯著性檢驗(yàn)當(dāng)時(shí),稱回歸方程高度顯著;當(dāng)時(shí),稱回歸方程顯著;當(dāng)時(shí),稱回歸方程不顯著.在一元回歸分析中,自變量只有一個(gè),回歸方程的顯著性檢驗(yàn)與回歸系數(shù)的顯著性檢驗(yàn)是等價(jià)的.4.利用回歸方程進(jìn)行預(yù)測(cè)把自變量的每一個(gè)給定值代入回歸方程,就可以求得一個(gè)對(duì)應(yīng)的回歸預(yù)測(cè)值,稱為模型的點(diǎn)估計(jì)值.利用方程對(duì)預(yù)測(cè)目標(biāo)進(jìn)行區(qū)間估計(jì).對(duì)給定的置信度,其預(yù)測(cè)區(qū)間為:二、回歸分析的MATLAB函數(shù)介紹按照軟件版本,分為兩類:1各個(gè)版本都有的函數(shù),2是較新版本才有函數(shù)。1.regress(y,x,alpha)、rcoplot(r,rint)2.fitlm(x,y,model)、plotDiagnostics、plotResiduals、predict三、應(yīng)用案例例1設(shè)x為該時(shí)期的家庭人均收入,y為該時(shí)期內(nèi)平均每十戶擁有照相機(jī)的數(shù)量.統(tǒng)計(jì)數(shù)據(jù)見表7.1.試分析擁有相機(jī)數(shù)量y與家庭收入x的關(guān)系,并求出關(guān)系式.表7.1家庭人均收入與需要照相機(jī)數(shù)的關(guān)系家庭人均收入(百元)1.51.82.43.03.53.94.44.85.0有照相機(jī)(臺(tái)/十戶)2.83.75.06.38.810.511.011.613.2詳見課件。四、一元非線性回歸分析1.可化為線性的非線性。常見的可化為一元線性回歸的非線性(即曲線型)問題,主要有以下幾種情形:雙曲線型。(2)冪函數(shù)型(3)指數(shù)函數(shù)()型對(duì)數(shù)函數(shù)型S曲線型2.相關(guān)函數(shù)介紹函數(shù)nlinfit(x,y,’model’beta0)nlintool(x,y,’model’,beta0,alpha)nlpredci(‘model’,x,beta,r,J)nlparci(beta,r,J)fitnlm(x,y,fun,beta0)plotDiagnostics(mdl,plottype)plotResiduals(mdl,plottype)predict(mdl,Xnew)3.應(yīng)用案例例2在彩色顯影中,根據(jù)經(jīng)驗(yàn),形成燃料光學(xué)密度y與析出銀的光學(xué)密度x由公式表示,測(cè)得實(shí)驗(yàn)數(shù)據(jù)如下:表7.3光學(xué)密度與析出銀的光學(xué)密度實(shí)驗(yàn)數(shù)據(jù)xi0.050.060.070.100.140.200.250.310.380.430.47yi0.100.140.230.370.590.791.001.121.191.251.29求y關(guān)于x的回歸方程.詳見課件。討論、思考、作業(yè)1.案例討論下表為1980~1991年間以1987年不變價(jià)計(jì)算的美國個(gè)人消費(fèi)支出Y與國內(nèi)生產(chǎn)支出X數(shù)據(jù)(單位:10億美元)表7.4年份YX年份YX19802447.13776.319862969.14404.519812476.93843.119873052.24539.919822503.73760.319883162.44718.619832619.43906.619893223.34838.019842746.14148.519903260.44877.519852865.84279.819913240.84821.0(1)在直角坐標(biāo)系下,作X與Y的散點(diǎn)圖,并判斷Y與X是否存在線性相關(guān)關(guān)系;(2)試求Y與X的一元線性回歸方程;(3)對(duì)所得回歸方程作顯著性檢驗(yàn)(=0.05);(4)若國內(nèi)生產(chǎn)支出為x0=4500,試求對(duì)應(yīng)的消費(fèi)支出y0的點(diǎn)預(yù)測(cè)和包含概率為的95%區(qū)間預(yù)測(cè).要求:用兩類函數(shù)分別求解上述問題。參考資料(含參考書、文獻(xiàn)等):《數(shù)學(xué)實(shí)驗(yàn)》,蕭樹鐵主編高等教育出版社《數(shù)學(xué)實(shí)驗(yàn)》,李尚志主編高等教育出版社教學(xué)過程設(shè)計(jì):復(fù)習(xí)0分鐘,授新課85分鐘,安排討論5分鐘,布置作業(yè)0分鐘授課類型:√理論課討論課實(shí)驗(yàn)課練習(xí)課其他教學(xué)方式:√講授討論指導(dǎo)其他教學(xué)資源:√課件√在線課程動(dòng)畫其他授課題目(教學(xué)章、節(jié)或主題)7.2多元回歸分析需用學(xué)時(shí)2學(xué)時(shí)教學(xué)目標(biāo)(知識(shí)、能力、素養(yǎng))1、掌握多元回歸分析的基本理論和建模方法;2、學(xué)會(huì)應(yīng)用MATLAB軟件進(jìn)行多元回歸分析和逐步回歸;3、培養(yǎng)學(xué)生借助計(jì)算機(jī)初步建立用回歸模型解決實(shí)際問題的能力和素養(yǎng)。重點(diǎn)難點(diǎn)重點(diǎn):1、MATLAB回歸分析中的檢驗(yàn)方法、逐步回歸;2、回歸建模中變量檢驗(yàn)和模型診斷。難點(diǎn):回歸分析中檢驗(yàn)和模型診斷課程思政元素1.通過回歸分析發(fā)展史的了解,引導(dǎo)學(xué)生樹立追求科學(xué)、精益求精的工匠精神;2.通過對(duì)回歸建模中的各類案例的講解讓學(xué)生知道數(shù)學(xué)的重要性,激發(fā)學(xué)習(xí)動(dòng)力。教學(xué)內(nèi)容及過程一、多元線性回歸分析的基本理論1.假設(shè)關(guān)注對(duì)象y與m個(gè)影響因素之間有以下線性關(guān)系(7.3)(),稱(7.3)為多元線性回歸模型,其中y稱為因變量(響應(yīng)變量),稱為回歸變量,是未知的待定系數(shù),稱為回歸系數(shù).是隨機(jī)誤差,一般假設(shè),是未知參數(shù).更一般地有,(7.4)其中是已知的函數(shù),因?yàn)閥對(duì)它們是線性的,故也稱為(廣義)多元線性回歸模型.(7.4)式經(jīng)過變量代換可化為(7.3).多元線性回歸分析的主要任務(wù)是:用試驗(yàn)值(樣本觀測(cè)值)對(duì)待定系數(shù)做出估計(jì);對(duì)建立的回歸方程和每個(gè)回歸變量進(jìn)行顯著性檢驗(yàn);給定回歸變量數(shù)據(jù)后,利用回歸方程對(duì)y作預(yù)測(cè).2.回歸系數(shù)的估計(jì)為了估計(jì)回歸系數(shù),做了n組實(shí)驗(yàn)得到數(shù)據(jù)代入多元線性回歸模型得到矩陣形式為其中,,,矩陣X為已知的樣本數(shù)據(jù)矩陣,稱為資料矩陣;B為未知的列向量(回歸系數(shù));服從獨(dú)立的同分布,即應(yīng)用最小二乘法估計(jì)可得到回歸系數(shù)的估計(jì)值,設(shè)為.因此可得(樣本)多元線性回歸方程:.代入一組觀測(cè)值,通過回歸方程可計(jì)算出,稱之為回歸預(yù)測(cè)值.3.回歸方程統(tǒng)計(jì)檢驗(yàn)(1)回歸方程的擬合優(yōu)度(檢驗(yàn))在這里被稱為復(fù)相關(guān)系數(shù)或全相關(guān)系數(shù),即多重判定系數(shù)的算術(shù)平方根.復(fù)相關(guān)系數(shù)用來解釋這一組影響因素與y的線性相關(guān)程度,用來評(píng)價(jià)模型的有效性.值越接近1,說明因變量y與回歸變量之間的函數(shù)關(guān)系越密切;反之,則說明因變量y與回歸變量之間的函數(shù)關(guān)系不密切或不存在線性函數(shù)關(guān)系.通常R大于0.8(或0.9)才認(rèn)為相關(guān)關(guān)系成立.多重判定系數(shù)R2在多元線性回歸分析是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映了在因變量y的變差中被估計(jì)的回歸方程所解釋的比例.使用時(shí)需要注意的是,如果增減變量的個(gè)數(shù),前后模型對(duì)比時(shí),一般使用調(diào)整的多重判定系數(shù)判定擬合優(yōu)度.調(diào)整的多重判定系數(shù)公式是.此外,剩余標(biāo)準(zhǔn)差(RMSE)表示觀測(cè)值偏離回歸直線的平均誤差,利用它也可以判斷回歸方程擬合的效果.顯然,s越接近0,說明回歸預(yù)測(cè)值與原始數(shù)據(jù)擬合的越好.(2)回歸方程的線性顯著性檢驗(yàn)(檢驗(yàn))檢驗(yàn)是定量地檢驗(yàn)因變量與回歸變量之間是否顯著地有線性關(guān)系.構(gòu)造統(tǒng)計(jì)量為:.F服從第一自由度為m,第二自由度為n-m-1的F分布,給定顯著水平,查F分布表得.如果,則認(rèn)為因變量與全體回歸變量之間顯著地有線性關(guān)系,可以利用所建立的多元線性回歸方程進(jìn)行預(yù)測(cè);否則認(rèn)為因變量與全體回歸變量之間不存在顯著的線性關(guān)系.常通過概率F的統(tǒng)計(jì)值對(duì)應(yīng)的概率P<來說明因變量y與全體回歸變量之間的線性相關(guān)性顯著.注意,這里是指因變量y與至少一個(gè)回歸變量有顯著的線性關(guān)系,而不是與每一個(gè)回歸變量都有顯著的線性關(guān)系.當(dāng)時(shí),稱回歸方程高度顯著;當(dāng)時(shí),稱回歸方程顯著;當(dāng)時(shí),稱回歸方程不顯著.4.回歸系數(shù)的顯著性檢驗(yàn)方法如下:如果某個(gè)回歸系數(shù)的置信區(qū)間包含0點(diǎn),則說明該回歸變量對(duì)因變量的影響不顯著.若存在不顯著的回歸變量,剔除后,再進(jìn)行其余變量的回歸,直至余下的變量全部顯著為止.如果同時(shí)有多個(gè)回歸變量沒有通過檢驗(yàn),剔除的原則是,先剔除t值最小的那個(gè)自變變量,一次只能剔除同一個(gè),剔除一次重新回歸計(jì)算一次.這里要注意的是,剔除一個(gè)變量時(shí),不能完全根據(jù)統(tǒng)計(jì)的數(shù)量指標(biāo)決定,還要考慮它對(duì)所研究問題的實(shí)際影響再最終確定其去留.殘差分析與模型診斷觀測(cè)值與回歸值之差稱為殘差.在回歸模型定義中,假設(shè)隨機(jī)誤差,如果殘差不服從正態(tài)分布,則說明建立回歸模型不夠好,需要進(jìn)一步改進(jìn)模型.對(duì)于通過檢驗(yàn)的模型,殘差圖中置信區(qū)間不經(jīng)過0直線的殘差所對(duì)應(yīng)的個(gè)別數(shù)據(jù),可從原數(shù)據(jù)中刪除后再重新進(jìn)行回歸,這一點(diǎn)有時(shí)候很重要,直接影響到模型的結(jié)構(gòu),如例5中建立的模型.在多元線性回歸模型中,一些回歸變量之間彼此相關(guān)時(shí),則稱回歸模型中存在多重共線性.如果出現(xiàn)下列情況,暗示存在多重共線性:模型中各對(duì)自變量之間顯著相關(guān).F檢驗(yàn)通過時(shí),幾乎所有的回歸系數(shù)檢驗(yàn)通不過.回歸系數(shù)的正負(fù)與實(shí)際預(yù)期相反.最后提醒一下,在建立多元線性回歸模型時(shí),不要試圖引入更多的自變量,除非必要。特別是社會(huì)科學(xué)研究中,很多數(shù)據(jù)是非實(shí)驗(yàn)數(shù)據(jù),質(zhì)量不好,即使結(jié)果不滿意,也不一定是模型不合適.建立的模型只有經(jīng)得起實(shí)踐的檢驗(yàn)才是好模型.用回歸方程預(yù)測(cè)當(dāng)我們獲得顯著的回歸方程,就可以運(yùn)用該回歸方程進(jìn)行分析預(yù)測(cè)了.給出自變量的一組觀測(cè)值,代入回歸方程即可得到的回歸預(yù)測(cè)值.給定置信度,我們還可以得y的的預(yù)測(cè)區(qū)間(置信區(qū)間).二、應(yīng)用案例例3某公司調(diào)查某種商品的兩種廣告費(fèi)用1和廣告費(fèi)用2對(duì)該產(chǎn)品銷售量的影響,得到如下數(shù)據(jù),試建立線性回歸模型并進(jìn)行檢驗(yàn),診斷是否有異常點(diǎn).表7.8數(shù)據(jù)表銷量Y9690959295959494廣告費(fèi)1(x1)1.52.01.52.53.32.34.22.5廣告費(fèi)2(x2)5.02.04.02.53.03.52.53.0詳見課件。三、逐步線性回歸分析1.逐步回歸的原理建立的回歸方程即使通過了回歸方程的顯著性檢驗(yàn),回歸方程是不是“最優(yōu)”的方程呢?實(shí)際問題中由于對(duì)因變量y的影響的因素較多,有的回歸變量對(duì)因變量的影響并不顯著,且多個(gè)回歸變量之間可能存在相互依賴性,相互影響,這就給回歸系數(shù)的估計(jì)帶來不可靠的解釋.為了得到“最優(yōu)”的回歸模型,我們要保留對(duì)因變量影響大的變量,剔除對(duì)因變量影響小的變量.這里最有效的方法是逐步回歸法:(1)從一個(gè)自變量開始,根據(jù)對(duì)因變量y的影響程度,從大到小地依次逐個(gè)引入回歸方程.但當(dāng)引入的自變量由于后面的自變量的引入而變得不明顯時(shí),要將其除掉.(2)每引入或剔除一個(gè)自變量,都要對(duì)y進(jìn)行一次檢驗(yàn),以確保每次引入新變量前回歸方程中只包含對(duì)y作用顯著的變量.(3)這個(gè)過程反復(fù)進(jìn)行,直至沒有顯著影響變量引入,也沒有不顯著影響變量剔除為止.引入或剔除變量是由一定數(shù)學(xué)依據(jù)這里就不一一列舉了.我們可以通過觀察調(diào)整后的決定系數(shù)R2、F統(tǒng)計(jì)量和剩余標(biāo)準(zhǔn)差(RMSE)、回歸系數(shù)的區(qū)間的變化來判斷該判定變量對(duì)模型的影響的顯著性.可用剩余標(biāo)準(zhǔn)差(RMSE)最小作為衡量變量選擇的一個(gè)數(shù)量標(biāo)準(zhǔn).逐步回歸的MATLAB函數(shù)stepwise命令使用說明:stepwise(x,y,inmodel,alpha)(1)x是自變量數(shù)據(jù)矩陣,y是因變量數(shù)據(jù)矩陣;alpha是顯著性水平(缺省時(shí)為0.05).(2)inmode是自變量初始集合的指標(biāo)(數(shù)據(jù)矩陣的X哪些列進(jìn)入初始集合),給出初始模型中包括的變量的子集,如取第2、3個(gè)變量時(shí)inmodel為[2,3](缺省時(shí)設(shè)定為全部自變量),alpha缺省為0.05.此外,Matlab2023還提供了如下逐步回歸命令:stepwiselm(x,y,modelspec)這里x和y的意義同stepwise,modelspec用來提供模型的類別,詳見軟件幫助.值得注意的是,軟件建立的“最優(yōu)”模型只是統(tǒng)計(jì)意義上的,不一定是因果事實(shí).模型的檢驗(yàn)和改進(jìn)還要結(jié)合所研究問題的專業(yè)知識(shí)來決定.應(yīng)用案例例5表中數(shù)據(jù)是某建筑公司去年20個(gè)地區(qū)是銷售量(Y千元),推銷開支、實(shí)際帳目數(shù)、同類商品競(jìng)爭(zhēng)數(shù)和地區(qū)潛力分別是影響建筑材料銷售量的因素,試分析哪些是主要的影響因素,并建立該因素的線性回歸模型.數(shù)據(jù)表7.10(見課件)操作詳
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)村個(gè)人地基使用權(quán)轉(zhuǎn)讓與農(nóng)村生態(tài)環(huán)境保護(hù)合作協(xié)議3篇
- 二零二五年度木工次結(jié)構(gòu)構(gòu)件加工與運(yùn)輸服務(wù)合同3篇
- 2025年度精密儀器制造工廠整體轉(zhuǎn)讓協(xié)議3篇
- 二零二五年度農(nóng)用房屋抵押農(nóng)村旅游發(fā)展貸款服務(wù)協(xié)議
- 二零二五年度企業(yè)研發(fā)成果保密協(xié)議2篇
- 二零二五年度公司管理人員員工持股計(jì)劃聘用合同3篇
- 二零二五年度農(nóng)村宅基地房屋出售與綠化維護(hù)合同2篇
- 二零二五年度老年人緊急救援服務(wù)合作協(xié)議3篇
- 二零二五年度綠色能源項(xiàng)目合作協(xié)議3篇
- 2025年度全新私人合同:私人美容師及美容服務(wù)合同3篇
- GB/T 45014-2024聚合物基復(fù)合材料層壓板緊固件拉脫阻抗試驗(yàn)方法
- 傳播學(xué)(東北林業(yè)大學(xué))知到智慧樹章節(jié)答案
- 2024年安全員之A證考試題庫及完整答案(網(wǎng)校專用)
- 統(tǒng)編版2024-2025學(xué)年三年級(jí)上冊(cè)語文期末情景測(cè)試卷 (無答案)
- 2024-2025學(xué)年人教新版九年級(jí)上冊(cè)數(shù)學(xué)期末復(fù)習(xí)試卷(含詳解)
- 績(jī)效考核辦法1
- 【MOOC】外科護(hù)理學(xué)-中山大學(xué) 中國大學(xué)慕課MOOC答案
- 年度學(xué)校辦公室工作總結(jié)
- 2025版國家開放大學(xué)法律事務(wù)??啤睹穹▽W(xué)(2)》期末紙質(zhì)考試總題庫
- 生物人教版(2024版)生物七年級(jí)上冊(cè)復(fù)習(xí)材料
- 企業(yè)地震應(yīng)急預(yù)案管理方案
評(píng)論
0/150
提交評(píng)論