版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
最小二乘法的方法來(lái)解決繁瑣的數(shù)據(jù)處理問(wèn)題研究摘要最小二乘法是一種普及廣泛,使用方便的數(shù)學(xué)優(yōu)化技術(shù)。是在藝數(shù)學(xué)為基礎(chǔ)的估計(jì)誤差、不確定度的預(yù)測(cè)、預(yù)測(cè)及辨識(shí)的系統(tǒng)化處理、數(shù)據(jù)化預(yù)報(bào)等諸多方面有著充分應(yīng)用發(fā)展前景以及實(shí)際意義的工具。在計(jì)算最佳匹配函數(shù)時(shí),它可以充分通過(guò)運(yùn)算求得最小化平方和在誤差中的對(duì)應(yīng)值,進(jìn)而為對(duì)應(yīng)函數(shù)提供數(shù)據(jù)支撐。我們可以利用最小二乘法進(jìn)行計(jì)算十分方便的算出想要的數(shù)據(jù),并在以平方和誤差最小為指導(dǎo)要求的前提下對(duì)相關(guān)的計(jì)算數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行對(duì)比。曲線擬合的應(yīng)用中也充分運(yùn)用了最小二乘法,在進(jìn)行優(yōu)化處置的操作時(shí)也可以通過(guò)最小二乘法計(jì)算所需的最小化能量或最大化熵對(duì)目標(biāo)進(jìn)行優(yōu)化改造。
針對(duì)解決數(shù)據(jù)處理應(yīng)用中的各種問(wèn)題,引用了最小二乘法的方法來(lái)解決繁瑣的數(shù)據(jù)處理問(wèn)題。在這篇文章中我們首先介紹了最小二乘法原理,接著分析了國(guó)內(nèi)和國(guó)外的研究情況,同時(shí)介紹了數(shù)種方法對(duì)所要測(cè)量的數(shù)據(jù)進(jìn)行最小二乘法的計(jì)算和對(duì)所測(cè)數(shù)據(jù)的曲線擬合,包括了一元線性擬合,多元線性擬合,多項(xiàng)式擬合。并通過(guò)MATLAB軟件實(shí)現(xiàn)對(duì)數(shù)據(jù)的擬合。最后我們將目光發(fā)到了未來(lái)數(shù)據(jù)應(yīng)用中可能對(duì)最小二乘法的應(yīng)用上,譬如圖像數(shù)據(jù)在高光譜領(lǐng)域的運(yùn)用、預(yù)測(cè)未來(lái)經(jīng)濟(jì)發(fā)展、農(nóng)業(yè)栽培養(yǎng)育實(shí)驗(yàn)分析等。由于單一的數(shù)學(xué)方法往往受到其特性的制約具有局限性,因此最小二乘法也并非適用所用情況。對(duì)最小二乘法而言,其缺點(diǎn)如下:異常值會(huì)產(chǎn)生巨大的影響;缺少誤差在自變量情況下存在的考慮;不可求解的情況時(shí)有發(fā)生。由于其缺點(diǎn)的影響,對(duì)于其方法改進(jìn)的步伐也一直沒(méi)有停止,學(xué)界也一直試圖為其提供更為廣闊的使用區(qū)間,也正因如此,諸多脫胎于最小二乘法的改進(jìn)研究也就大量產(chǎn)生。譬如廣義最小二乘法以及加權(quán)最小二乘法均是這一背景下的產(chǎn)物。而這些方法的誕生也使得相應(yīng)領(lǐng)域的問(wèn)題獲得了更多可能的解決方案,對(duì)未來(lái)數(shù)據(jù)處理應(yīng)用有著重要的幫助。關(guān)鍵詞:最小二乘法;一元線性擬合;多元線性擬合;多項(xiàng)式擬合;MATLAB1.導(dǎo)論1.1選題背景和意義:1.1.1選題背景:19世紀(jì),第一顆小行星“谷神星”被天文學(xué)家朱賽普·皮亞齊發(fā)現(xiàn)。由于當(dāng)時(shí)科技水平落后,雖然觀測(cè)到谷神星運(yùn)行到太陽(yáng)的另一面,使得皮亞齊觀測(cè)不到了它的運(yùn)行軌道,這使得全世界的科學(xué)家的都對(duì)這顆小行星關(guān)注了起來(lái),他們開(kāi)始計(jì)算皮亞齊所得到的觀測(cè)數(shù)據(jù)開(kāi)始尋找這顆離奇消失的谷神星,但是大多數(shù)人使用皮亞齊觀測(cè)到的數(shù)據(jù)計(jì)算出來(lái)的結(jié)果來(lái)尋找這顆離奇消失的谷神星但是最后都沒(méi)有找到這顆離奇消失的谷神星。只有數(shù)學(xué)家高斯突發(fā)奇想對(duì)谷神星的軌道進(jìn)行觀測(cè)并進(jìn)行結(jié)算,而且若干年后天文學(xué)家海因里?!W爾伯斯通過(guò)觀察谷神星的軌道也證實(shí)了高斯的觀點(diǎn),從而使得我們能夠通過(guò)計(jì)算而預(yù)測(cè)到谷神星所處的精確位置。運(yùn)用同樣的方法我們也發(fā)現(xiàn)了類似谷神星的天文學(xué)成果。其中高斯觀察谷神星軌道從而預(yù)測(cè)到谷神星精確位置所使用的方法就是最小二乘法。19世紀(jì)初。他的著作《天體運(yùn)動(dòng)論》發(fā)表了這個(gè)方法。但是著名科學(xué)家勒讓德也于19世紀(jì)初發(fā)現(xiàn)了最小二乘法,但是因?yàn)闆](méi)有威望而不被世人關(guān)注,所以他發(fā)現(xiàn)的最小二乘法并不被人們所熟知。到了1829年,高斯更近一步對(duì)最小二乘法進(jìn)行優(yōu)化,它的優(yōu)化效果很好并且通過(guò)對(duì)比發(fā)現(xiàn)它的優(yōu)化效果強(qiáng)于其他人提供的優(yōu)化效果
1.1.2選題意義:最小二乘法是一種應(yīng)用很廣泛,操作很簡(jiǎn)單的數(shù)學(xué)優(yōu)化技術(shù)。是在估計(jì)誤差、不確定度的預(yù)測(cè)、預(yù)測(cè)及辨識(shí)的系統(tǒng)化處理、數(shù)據(jù)化預(yù)報(bào)等諸多方面有著充分應(yīng)用發(fā)展前景以及實(shí)際意義的工具。是一種數(shù)學(xué)優(yōu)化技術(shù)。然后來(lái)尋找數(shù)據(jù)的最佳匹配函數(shù)。使用最小二乘法我們可以通過(guò)分析已知的一些數(shù)據(jù)得到一些我們想知道但無(wú)法確定的數(shù)據(jù)部分,并在誤差上將實(shí)際數(shù)據(jù)與想求得的數(shù)據(jù)進(jìn)行誤差區(qū)間的縮小,而且使得它們的誤差平方和變?yōu)樽钚?,然后就可以預(yù)測(cè)一些未來(lái)的數(shù)據(jù)。最小二乘法還可用于對(duì)曲線進(jìn)行擬合,擬合的曲線可以幫助我們更加直觀的觀察預(yù)測(cè)數(shù)據(jù),并且對(duì)于一些優(yōu)化問(wèn)題或者數(shù)據(jù)處理問(wèn)題更是可以使用最小二乘法進(jìn)行最大化熵用或最小化能量來(lái)表述
最小二乘法定義:在對(duì)某一特定對(duì)象進(jìn)行研究處置時(shí),當(dāng)確定使用部分理論或假設(shè)時(shí),即可得到一個(gè)數(shù)據(jù)模型.按照這個(gè)數(shù)據(jù)模型
,我們對(duì)想要獲得的數(shù)據(jù)需要得到它的理論值
,并對(duì)這個(gè)值進(jìn)行實(shí)際化觀測(cè)處理
,從而得出一個(gè)觀測(cè)值.但是因?yàn)楦鞣N不可控原因——比方說(shuō)模型并不準(zhǔn)確或者我們的觀測(cè)有誤差等,所以會(huì)導(dǎo)致我們獲得的處于相對(duì)理想化的數(shù)值在數(shù)值上與通過(guò)嚴(yán)謹(jǐn)計(jì)算后獲得的觀測(cè)值存在較為顯著的不同,而這兩者的平方和,即,該模型作為一種度量可以將之運(yùn)用于實(shí)際與理論之間數(shù)值不同情況條件下兩者相符程度的鑒別。在較多次數(shù)的實(shí)驗(yàn)測(cè)量中,該式的求和能夠使我們獲得含有未知的參數(shù)θ.最小二乘法中往往選擇這樣的θ值,從而使H的預(yù)測(cè)值到達(dá)最小值.
1.2國(guó)外研究狀況:(1)勒讓德研究狀況:我們現(xiàn)在所熟知的LES概念是19世紀(jì)初勒讓德在《計(jì)算慧星軌道的新方法》這本書(shū)中提出的。對(duì)該方法進(jìn)行溯源分析則不難發(fā)現(xiàn),勒讓德能夠有相關(guān)想法的出現(xiàn)與其突破了前人思想有很大的關(guān)聯(lián),他通過(guò)大量構(gòu)筑方程(簡(jiǎn)稱為k個(gè)方程)并對(duì)這k個(gè)方程進(jìn)行求解。而是他發(fā)現(xiàn)最重要的地方不在于使某一方程嚴(yán)格符合某種事實(shí),而是能夠讓最后的誤差以一種合理的辦法將這些誤差平均分配到各個(gè)方程.準(zhǔn)確的說(shuō),他需要得到這個(gè)θ值
,使
,1≤
i
≤
n。而且還要使計(jì)算出來(lái)的各誤差的平方和
,即,這個(gè)方程的值達(dá)到最小
至于為什么不選擇其他的函數(shù)去減少這個(gè)方程的誤差,可能使因?yàn)樵诋?dāng)時(shí)選擇其他的方程計(jì)算會(huì)很困難—
—并不清楚統(tǒng)計(jì)學(xué)原理,所以不清楚為什么要選擇平方以及選擇平方有什么好處。
(2)辛普森研究狀況:1755年,辛普森在探究一次觀測(cè)與多次算術(shù)平均的優(yōu)劣性時(shí),依托了三角形曲線中的誤差曲線進(jìn)行探究。并依托在n數(shù)值處于6時(shí)的特例,用計(jì)算證明了d>0這里X1,…,X6分別是六次誤差在其中的體現(xiàn).而這一不等式無(wú)疑證明了在算術(shù)平均與一次觀察的對(duì)比中,無(wú)疑是前者更可能實(shí)現(xiàn)誤差的最小化,這也表明出在優(yōu)越性領(lǐng)域,平均算法的優(yōu)越性。(3)拉格朗日研究狀況:在其研究中將f函數(shù)設(shè)置為與應(yīng)當(dāng)被滿足條件相關(guān)的函數(shù),并通過(guò)這類條件能夠準(zhǔn)確定位相應(yīng)的數(shù)值。例如,他曾經(jīng)思考過(guò)的一個(gè)想法是
,當(dāng)
X>
0時(shí)
,
f
(X)下降
,
f′(X)也會(huì)出現(xiàn)對(duì)應(yīng)的數(shù)值下降情形.在常數(shù)比例上也會(huì)保持兩者間的相對(duì)穩(wěn)定從而從形式上為f做出了如下的定式.m>0。該分布模型正是注明的拉普拉斯分布,是目前概率論的重要構(gòu)成部分。但是其卻并不適用與誤差分布,在相關(guān)的實(shí)驗(yàn)中,拉格朗日多次利用其進(jìn)行算術(shù)平均領(lǐng)域的誤差計(jì)算,得到的結(jié)果卻難以完成簡(jiǎn)易分析的需求,一般的狀況就更不必多說(shuō)。(4)高斯研究狀況:在定義上,高斯突破了過(guò)往對(duì)于f的函數(shù)確定思維,對(duì)其進(jìn)行了公理層次上的設(shè)計(jì),具體為對(duì)于同一目標(biāo)的多次觀測(cè)所得數(shù)據(jù)進(jìn)行恰當(dāng)?shù)钠骄?jì)算能夠獲得正確的目標(biāo)結(jié)論。如果將該思路與他在極大似然理論中的研究相結(jié)合(如后文所敘述,從概念層次上對(duì)極大似然進(jìn)行追根溯源即起源與此,但如果將估計(jì)參數(shù)的一般方法作為起源,則應(yīng)當(dāng)將其與1912年費(fèi)歇爾的工作想結(jié)合在這一背景下,f從形式角度出發(fā)是十分容易獲得的存在,這一公式也被成為高斯分布或正態(tài)分布,其在目前的概率論體系中承擔(dān)著重要的發(fā)展引導(dǎo)角色。在這一理論的指引下,依托式,與(X1,…,Xn)的聯(lián)合密度,如果此時(shí)要讓L呈現(xiàn)出極大似然的表達(dá),那么久應(yīng)當(dāng)使達(dá)到最小,從而引出LSE.1.3國(guó)內(nèi)研究狀況:孫彥清是《最小二乘法線性擬合應(yīng)注意的兩個(gè)問(wèn)題》的作者,在該書(shū)中他以兩個(gè)問(wèn)題為切入點(diǎn)對(duì)最小二乘法在擬合上面需要關(guān)注的地方進(jìn)行了研究,從理論原理上為最小二乘法進(jìn)行了解讀,并從應(yīng)用及產(chǎn)生的問(wèn)題方面對(duì)實(shí)際曲線擬合進(jìn)行了探求。其研究出的相關(guān)問(wèn)題涉及到了在條件上擬合進(jìn)行應(yīng)用所需的框架以及對(duì)應(yīng)的誤差比較。而代錦輝則在其著作《最小二乘法處理自變量誤差實(shí)驗(yàn)數(shù)據(jù)的方法》中從實(shí)驗(yàn)數(shù)據(jù)與數(shù)學(xué)研究的層面對(duì)最小二乘法進(jìn)行了探究與介紹,向人們闡述了在數(shù)據(jù)處理領(lǐng)域,最小二乘法可以卓有成效地降低在自變量誤差情況下實(shí)驗(yàn)數(shù)據(jù)的誤差水平,進(jìn)而增強(qiáng)實(shí)驗(yàn)的科學(xué)與嚴(yán)謹(jǐn)性。程玉民等人在《移動(dòng)最小二乘法研究進(jìn)展與評(píng)述》中對(duì)于最小二乘法的研究則從移動(dòng)端進(jìn)行了深入的探索,其通過(guò)深層改進(jìn)移動(dòng)最小二乘法,從優(yōu)缺點(diǎn)出發(fā)對(duì)其進(jìn)行了評(píng)述,并推動(dòng)了在無(wú)方格理論框架下,最小二乘法的移動(dòng)研究成果。使得動(dòng)態(tài)與靜態(tài)的斷裂力學(xué)與彈塑性求解能夠依托移動(dòng)最小二乘法得以解決。1.4論文研究方法:在這篇論文中我主要運(yùn)用了三種方法:文獻(xiàn)分析法,信息研究法,和實(shí)證研究法我們通過(guò)各種文獻(xiàn)來(lái)獲得所需要的資料,從而更加全面地,正確地學(xué)習(xí)最小二乘法的國(guó)內(nèi)外研究?jī)?nèi)容,運(yùn)用這些最小二乘法的應(yīng)用方法。同時(shí)對(duì)最小二乘法及其應(yīng)用進(jìn)行信息的收集加工和整理,對(duì)最小二乘法在擬合中的問(wèn)題進(jìn)行分析,探索在擬合中的問(wèn)題。最后我們依據(jù)現(xiàn)有的科學(xué)理論和實(shí)踐的需要,運(yùn)用多種辦法對(duì)各種線性擬合中出現(xiàn)的問(wèn)題進(jìn)行解決,我們也要運(yùn)用matlab軟件對(duì)最小二乘法所測(cè)得的預(yù)測(cè)數(shù)據(jù)進(jìn)行線性擬合。2.一元線性擬合2.1一元線性擬合;一元線性擬合是指只涉及到兩個(gè)變量的回歸分析,即自變量x和因變量y之間的關(guān)系,它的主要任務(wù)是用其中一個(gè)變量去估計(jì)另外一個(gè)變量,而被估計(jì)的變量,我們稱為因變量并且把它設(shè)為Y,用來(lái)估計(jì)其他變量的變量,我們把它稱為自變量并且設(shè)為X。一元線性擬合就是要我們找到一個(gè)數(shù)學(xué)模型Y=f(X),能夠讓我們用自變量x去估計(jì)因變量y并且能夠用一種函數(shù)表達(dá)式去表達(dá)計(jì)算,并且當(dāng)Y=f(X)這個(gè)數(shù)學(xué)模型的形式是一個(gè)直線方程時(shí),我們稱為一元線性擬合。并且用Y=A+BX來(lái)表示一元線性擬合方程。根據(jù)最小平方法或其他方法,可以從所統(tǒng)計(jì)的樣本數(shù)據(jù)得到所需要的常數(shù)項(xiàng)A與回歸系數(shù)B的值,當(dāng)我們確定常數(shù)項(xiàng)A和回歸系數(shù)B的具體數(shù)值后,當(dāng)自變量X呈現(xiàn)出顯得觀測(cè)值時(shí),對(duì)應(yīng)的因變量Y就會(huì)誕生一個(gè)估計(jì)值。但值得注意的是,在可靠性上回歸方程無(wú)法實(shí)現(xiàn)計(jì)算后的可靠性,估計(jì)在誤差上的表達(dá)以及回歸方長(zhǎng)的可靠性都有賴于對(duì)應(yīng)的檢驗(yàn)和計(jì)算去驗(yàn)證。而且影響回歸方程可靠性的因素有很多,比如說(shuō)樣本是否充分以及相關(guān)關(guān)系是否顯著等等。2.2一元線性擬合模型:研究變量間的隨機(jī)性關(guān)系也是研究線性擬合方程所需要的,通常我們所使用的線性關(guān)系是y=a+bx+ε,其中y和x分別是因變量和自變量,a和b都是需要待估的回歸參數(shù),ε是隨機(jī)誤差,我們假設(shè)隨機(jī)誤差ε服從正態(tài)分布,然后運(yùn)用最小二乘法原理求得需要待估的回歸參數(shù)a和b的數(shù)值,最后通過(guò)計(jì)算得到所需要的一元線性擬合模型。,其中2.3一元二次函數(shù)回歸模型:在線性回歸分析中,我們假設(shè)一個(gè)未知參量t=x2,則式y(tǒng)=a+bx2+ε就變?yōu)閥=a+bt+ε在這個(gè)變形的式中,y依舊是原式中的因變量,t代替了原來(lái)式子的x2成為了現(xiàn)在式子的自變量,a和b還是原來(lái)式子中模型待估的回歸參數(shù),ε為隨機(jī)誤差。我們需要假設(shè)隨機(jī)誤差ε服從正態(tài)分布,然后運(yùn)用最小二乘法求得待估的回歸參數(shù)a和b的數(shù)值,最后通過(guò)計(jì)算獲得所需要的一元二次線性擬合模型其中所以,關(guān)于y與x經(jīng)驗(yàn)回歸方程為2.4一元線性擬合方程評(píng)價(jià):我我們要判斷一元線性擬合方程擬合的程度,而且我們需要表達(dá)出一元線性擬合方程的擬合效果,所以引用了確定系數(shù)R2來(lái)評(píng)價(jià)一元線性擬合方程的擬合效果,其取值范圍為[0,1]。R2→1時(shí),說(shuō)明回歸效果好;在R2→0時(shí),說(shuō)明回歸效果差。確定系數(shù)2.5一元線性擬合舉例:我們以北京某蔬菜批發(fā)市場(chǎng)為數(shù)據(jù)樣本收集地,并且采集了2017年4月15日至2017年7月10日期間的北京黃瓜的每日平均價(jià)格,然后對(duì)每周的價(jià)格進(jìn)行統(tǒng)計(jì),計(jì)算出周平均值。然后我們假設(shè)第1周的時(shí)間周期是4月15日到4月22日為,第2周的時(shí)間周期是4月23日到4月30日,后面的時(shí)間周期按照七天的規(guī)律類推。具體數(shù)據(jù)見(jiàn)表1和圖1。表1黃瓜均價(jià)與日期對(duì)照表(元/斤)周次12345678910111213均碼4.004.003.923.803.843.633.203.944.004.304.445.005.00由表1和圖1可以看出,黃瓜的每周平均價(jià)格從2017年4月15日已經(jīng)開(kāi)始有下降的趨勢(shì),在2017年5月26日一直到2017年5月29日的第7周黃瓜每周平均價(jià)格達(dá)到最低3,2元/斤,隨后黃瓜的價(jià)格開(kāi)始一直上升。主要原因是因?yàn)樾路N植的黃瓜在4月份開(kāi)始上市,市場(chǎng)上的黃瓜很多而且買(mǎi)黃瓜的人變少導(dǎo)致了黃瓜的價(jià)格一直出現(xiàn)下滑,并且在2017年5月26日一直到2017年5月29日黃瓜供給大于需求的狀態(tài)出現(xiàn)一定的緩解;從2017年5月15日一直到2017年5月22日的第12周,供給大于需求的現(xiàn)象基本得到緩解,并開(kāi)始向供需平衡發(fā)展。(1)線性模型R2=0.4167(2)二次函數(shù)模型R2=0.9995(3)指數(shù)函數(shù)模型R2=0.3761最后我們通過(guò)數(shù)據(jù)計(jì)算所得到的數(shù)據(jù)結(jié)果發(fā)現(xiàn),上述三個(gè)模型中第二個(gè)模型:二次函數(shù)模型的確定系數(shù)R2=0,9995,說(shuō)明這個(gè)二次函數(shù)模型對(duì)黃瓜每周平均價(jià)格的線性擬合效果較好,我們上述得到的這個(gè)數(shù)據(jù)模型可以用于對(duì)黃瓜價(jià)格的預(yù)測(cè),并且能夠?qū)S瓜市場(chǎng)的價(jià)格控制起著十分精確的預(yù)測(cè)控制。由以上的結(jié)論分析可知,我們通過(guò)計(jì)算數(shù)據(jù)模型發(fā)現(xiàn)我們采用二次函數(shù)模型從而預(yù)測(cè)黃瓜的每周平均價(jià)格是比較合理的方法。二次函數(shù)模型:代表黃瓜周次與每周平均價(jià)格的關(guān)系,參考圖2。由圖2可知,黃瓜的價(jià)格在未來(lái)幾周有上升的趨勢(shì),但是上升的趨勢(shì)并不會(huì)太快。我們利用二次函數(shù)模型,即,圖二顯示的是未來(lái)兩周預(yù)測(cè)的黃瓜價(jià)格。其中實(shí)際價(jià)格是由北京某蔬菜批發(fā)市場(chǎng)在2017年5月15日一直到2017年5月22日的每日價(jià)格計(jì)算出的每周平均價(jià)格。圖2黃瓜均價(jià)與周次回歸擬合曲線周次預(yù)測(cè)價(jià)格實(shí)際價(jià)格誤差145.01150.22155.21454.28表2預(yù)測(cè)價(jià)格(元/斤)我們由表2的預(yù)測(cè)價(jià)格可以知道,使用一元二次函數(shù)模型,并且通過(guò)計(jì)算所得到的第十四周和第十五周的預(yù)測(cè)價(jià)格發(fā)現(xiàn)我們通過(guò)計(jì)算所得到的黃瓜的平均價(jià)格和實(shí)際的每周平均價(jià)格相比較是差不多符合的,說(shuō)明了可以用一元二次模型來(lái)預(yù)測(cè)黃瓜的每周平均價(jià)格。3.多元線性擬合3.1多元線性擬合;我們將擁有兩個(gè)或兩個(gè)以上的自變量的回歸方程把它叫做多元回歸方程。眾所周知,我們生活中每一個(gè)常見(jiàn)的現(xiàn)象都是由一些方方面面的事情來(lái)決定的,所以我們使用兩個(gè)或兩個(gè)以上的自變量通過(guò)計(jì)算來(lái)獲得出最優(yōu)的函數(shù)方程解然后用計(jì)算得來(lái)的數(shù)據(jù)解以此預(yù)測(cè)結(jié)果或者估計(jì)因變量,對(duì)比如果我們只使用一個(gè)自變量來(lái)進(jìn)行數(shù)據(jù)結(jié)果的預(yù)測(cè)會(huì)更加切合現(xiàn)實(shí)。因此相比較一元線性擬合,多元線性擬合更加符合我們的實(shí)際生活,更加具有實(shí)用意義。3.2多元線性擬合模型:多元回歸方程研究的是兩個(gè)或兩個(gè)以上自變量或者自變量組與因變量Y之間有何關(guān)系的回歸方程。通常自變量組(m≥2)和因變量y構(gòu)成隨機(jī)樣本數(shù)據(jù)集,并存在一種如下的線性關(guān)系:(1)式中θ0,θ1,θ2…,θm———求解系數(shù);ε———?dú)埐?。式?)就是多元線性回歸方程(2)式(2)就是最小二乘法估計(jì),進(jìn)行最優(yōu)解的尋獲就是其在多元線性回歸方程下的目的,而這也使得在該模型中對(duì)應(yīng)的實(shí)際值能夠被預(yù)測(cè)值更好的反應(yīng)。3.3多元線性擬合舉例:通過(guò)觀察氣化的各個(gè)流程,我們用6個(gè)輔助變量來(lái)進(jìn)行描述,其分別是“氣化爐的氧煤比”、“中心氧”,“有效氣”、“甲烷”、“二氧化碳的含量”,“煤質(zhì)”。
依托工藝數(shù)據(jù)運(yùn)行情況在氣化爐正常工況時(shí)的表現(xiàn),將250組樣本數(shù)據(jù)從相應(yīng)的“DCS系統(tǒng)”進(jìn)行實(shí)時(shí)剝離,并運(yùn)用拉依達(dá)準(zhǔn)則對(duì)其進(jìn)行處理,使異常數(shù)據(jù)被剔除,從準(zhǔn)確性與可靠性對(duì)數(shù)據(jù)進(jìn)行兜底,在確定了主導(dǎo)變量和輔助變量后,我們假設(shè)因變量y為該變量組的主導(dǎo)變量,把自變量組為該變量組的輔助變量,我們運(yùn)用多元線性回歸方程進(jìn)行計(jì)算并且運(yùn)用最小二乘法進(jìn)行回歸分析。得到所需的多元線性回歸方程組。在相關(guān)的樣本訓(xùn)練中,依托氣化爐6負(fù)荷的情況進(jìn)行200組數(shù)據(jù)的建模處置,并摘取其中的140組設(shè)定為訓(xùn)練樣本,另外的60組訓(xùn)練樣本進(jìn)行模擬測(cè)試然后我們對(duì)將要獲得的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理并且進(jìn)行最小二乘法的線性擬合分析主要步驟如下:①我們使用Origin軟件對(duì)這140組數(shù)據(jù)在6負(fù)荷的情況下出現(xiàn)的各種數(shù)據(jù)導(dǎo)入到我們建立的工作表中;
②根據(jù)主導(dǎo)變量和輔助變量對(duì)所需的變量名稱進(jìn)行處理;③利用系統(tǒng)工具欄的分析功能,開(kāi)展擬合工作完成多元線性回歸;④在擬合條件下設(shè)置對(duì)應(yīng)的參數(shù)并運(yùn)行擬合程序;⑤根據(jù)最后我們通過(guò)數(shù)據(jù)處理得到的擬合數(shù)據(jù)進(jìn)行計(jì)算,然后運(yùn)用計(jì)算得出的數(shù)據(jù)找出我們所需要的6負(fù)荷情況下多元線性回歸方程的系數(shù);各種數(shù)據(jù)詳見(jiàn)下表輔助變量氧煤比中心氧有效氣含量甲烷含量二氧化碳含量煤質(zhì)系數(shù)+0.0714+5.8393-2.3723-1.0861+12.8708+1.9583我們將表中通過(guò)計(jì)算所得到的各種系數(shù)代入到以下的線性回歸方程中,并且運(yùn)用最小二乘法并進(jìn)行計(jì)算,我們就可得到所需要的多元線性回歸模型數(shù)學(xué)表達(dá)式:我們?cè)?負(fù)荷下計(jì)算得到60組數(shù)據(jù),并且把這些數(shù)據(jù)輸入到我們建立的模型當(dāng)中,得到以下的擬合圖。由下圖我們發(fā)現(xiàn)運(yùn)用最小二乘法計(jì)算并基于此建立的模型擬合效果很好,計(jì)算所得到的擬合值比我們實(shí)際測(cè)量的值差距不算多大。所以能很好的表達(dá)預(yù)測(cè)溫度變化的趨勢(shì)。6.0MPa負(fù)荷下模型的擬合效果圖所以我們通過(guò)使用最小二乘法進(jìn)行計(jì)算并對(duì)這些數(shù)據(jù)進(jìn)行線性擬合并建立模型從而使得它的擬合效果很好。所以我們通過(guò)最小二乘法線性擬合方程所算得的數(shù)據(jù)對(duì)工業(yè)生產(chǎn)有一定的指導(dǎo)作用。4.MATLAB4.1Matlab軟件介紹Matlab是矩陣實(shí)驗(yàn)室的簡(jiǎn)稱。是美國(guó)的Mathworks公司在1984年發(fā)布的一款商業(yè)數(shù)學(xué)軟件。并且這款軟件經(jīng)過(guò)數(shù)十年的創(chuàng)新,到目前為止已經(jīng)發(fā)布了眾多有著各種應(yīng)用的版本,成為了我們現(xiàn)在所熟知的Matlab,功能強(qiáng)大含有許多很重要的功能。算法開(kāi)發(fā),數(shù)據(jù)可視化等等都是MATLAB的使用很方便的功能,MATLAB經(jīng)受多年的考驗(yàn),目前已經(jīng)成為各種高等數(shù)學(xué)課程的基本教學(xué)工具,比如說(shuō)線性代數(shù)等等,它有著很旺盛的生命力,優(yōu)點(diǎn)眾多。比如說(shuō)它的語(yǔ)言簡(jiǎn)潔緊湊,使用方便。運(yùn)算符豐富,使其將程序變得靈活簡(jiǎn)單。既有結(jié)構(gòu)化語(yǔ)句也有編程的特性。語(yǔ)法限制很少,程序設(shè)計(jì)自由。程序的可移植性很好。圖形功能強(qiáng)大,數(shù)據(jù)可視化簡(jiǎn)單等等。不過(guò)缺也是很明顯就是他的運(yùn)行速度很慢。4.2最小二乘法MATLAB實(shí)現(xiàn)Matlab中存在多種曲線擬合方法。利用函數(shù)進(jìn)行曲線擬合的一些方法中最常見(jiàn)的是用Polifit函數(shù)進(jìn)行擬合,利用圖形界面擬合的方法中最常見(jiàn)的是用cftool進(jìn)行擬合。Cftool擬合:中國(guó)年人均GDP上表是從1952年一直至2015年之間中國(guó)人均國(guó)內(nèi)生產(chǎn)總值。我們假設(shè)它的界定年份為x,中國(guó)人均國(guó)內(nèi)生產(chǎn)總值為y。我們接下來(lái)使用cftool擬合將假設(shè)的界定年份X與中國(guó)人均國(guó)內(nèi)生產(chǎn)總值y進(jìn)行曲線擬合,對(duì)已有的數(shù)據(jù)進(jìn)行多次計(jì)算并且計(jì)算出多項(xiàng)式。我們根據(jù)已有的數(shù)據(jù),橫坐標(biāo)為x,代表年份??v坐標(biāo)為y,代表中國(guó)人均國(guó)內(nèi)生產(chǎn)總值。并在Matlab上畫(huà)出所知的數(shù)據(jù)點(diǎn)示意圖。Matlab代碼為運(yùn)行Matlab軟件,在工具欄中找對(duì)對(duì)應(yīng)的擬合項(xiàng)目Matlab擬合工具箱打開(kāi)Data并前往數(shù)據(jù)選擇的頁(yè)面內(nèi)進(jìn)行如下圖所示的操作。分別點(diǎn)擊X與Y的Data,并從數(shù)據(jù)上對(duì)其樣本進(jìn)行確認(rèn)。隨后運(yùn)行Createdataset完成對(duì)應(yīng)的數(shù)據(jù)確認(rèn)與數(shù)據(jù)點(diǎn)展示工作。選擇數(shù)據(jù)頁(yè)面打開(kāi)Matlab擬合工具箱,運(yùn)行Fitting并創(chuàng)建新的模型。隨后利用Typeoffit選項(xiàng),進(jìn)行CustomEquations的操作,并在此基礎(chǔ)上通過(guò)Newequation實(shí)現(xiàn)自定義函數(shù)的操作。并利用addaterm進(jìn)行解釋變量項(xiàng)的添加,見(jiàn)下圖。自定義多項(xiàng)式三次函數(shù)對(duì)應(yīng)獲得的擬合圖如圖所示。相應(yīng)函數(shù)為同時(shí)得到誤差平方和,均方差,相關(guān)指數(shù),調(diào)整的可決系數(shù)。多項(xiàng)式三次擬合Polyfit擬合:下方表格是我國(guó)統(tǒng)計(jì)的2006年一直到2015年小麥年產(chǎn)量(萬(wàn)噸)數(shù)據(jù)表。在這組數(shù)據(jù)中,自變量是統(tǒng)計(jì)的年份區(qū)間,因變量是我國(guó)每年統(tǒng)計(jì)的小麥產(chǎn)量,然后通過(guò)這些數(shù)據(jù),運(yùn)用Polyfit擬合對(duì)這些數(shù)據(jù)進(jìn)行線性擬合。年份2006200720082009201020112012201320142015小麥產(chǎn)量45099456324784748156496375193953934552695574057225根據(jù)我國(guó)每年所統(tǒng)計(jì)的小麥年產(chǎn)量進(jìn)行分析,我們把橫坐標(biāo)假設(shè)為統(tǒng)計(jì)的年份,縱坐標(biāo)為我國(guó)每年統(tǒng)計(jì)的小麥年產(chǎn)量,在Matlab中輸入已經(jīng)得知的代碼和數(shù)據(jù),并且構(gòu)造如下的數(shù)據(jù)點(diǎn)示意圖。如下圖所示Matlab代碼如下:數(shù)據(jù)點(diǎn)示意圖通過(guò)收集而尋得的的數(shù)據(jù)進(jìn)行polyfit的曲線擬合,然后對(duì)所得的數(shù)據(jù)點(diǎn)進(jìn)行多次的線性擬合求解Matlab代碼如下:按照這個(gè)代碼開(kāi)始多次的計(jì)算,得到下面這個(gè)我們所需要的擬合函數(shù),,y=-0.0192x3+0.6079x2-4.7076x+55.6263。誤差平方和為e=1.6042。并且得到擬合圖,如下圖所示擬合圖綜上所述擬合效果很好,因此年份和小麥年產(chǎn)量的擬合函數(shù)是y=-0.0192x3+0.6079x2-4.7076x+55.6263。并且能夠很好的預(yù)測(cè)未來(lái)幾年的小麥年產(chǎn)量,對(duì)農(nóng)業(yè)發(fā)展有著前所未有的好處。Matlab對(duì)于我們進(jìn)行數(shù)學(xué)計(jì)算有很大的幫助,它有著強(qiáng)大的計(jì)算能力與繪圖能力,可以幫助我們能夠更加精確的計(jì)算或者預(yù)測(cè)各種數(shù)據(jù)。我們?cè)谏厦嬲故镜膬蓚€(gè)常見(jiàn)的函數(shù)(cftool擬合函數(shù)和polyfit擬合函數(shù))操作可以得知,能夠簡(jiǎn)便化、快捷化地實(shí)現(xiàn)操作計(jì)算功能。如果只是利用擬合函數(shù)求解的單一功能,則polyfit較cftool擬合函數(shù)而言,好的地方在于只需要輸入polyfit函數(shù)就可以進(jìn)行操作。但是如果需要進(jìn)行線性分析,cftool擬合函數(shù)就更加適用,相比較polyfit擬合函數(shù)需要進(jìn)行人工交互,但是使用cftool擬合函數(shù)能夠更加清晰直觀的觀察想要的數(shù)據(jù)。而polyfit擬合函數(shù)需要進(jìn)行大量的計(jì)算分析處理,更加復(fù)雜。因此,如何選擇cftool函數(shù)或者polyfit函數(shù)需要知道是否需要擬合函數(shù)求解,是否需要線性分析。5.最小二乘法對(duì)未來(lái)數(shù)據(jù)處理應(yīng)用展望:5.1在傳感器中的應(yīng)用:傳感器是一種我們生活中很常見(jiàn)的檢測(cè)裝置,它能夠?qū)⒃谕饨缢@得到的信息按照我們的想法所設(shè)定的規(guī)律變成能夠被人類所感知的信息輸出。它有著很多特點(diǎn),比如說(shuō)數(shù)字化,智能化,網(wǎng)絡(luò)化等特點(diǎn),能夠使我們的世界變得豐富多彩。由于外界的復(fù)雜信息會(huì)對(duì)感受器的輸入到輸出過(guò)程進(jìn)項(xiàng)干擾,進(jìn)而影響其接受目標(biāo)信息而產(chǎn)生對(duì)結(jié)果的影響,干擾結(jié)果的準(zhǔn)確度。所以大量的誤差分析就被應(yīng)用于精度較高的傳感器制作過(guò)程當(dāng)中。因此我介紹的是一款精度很高的傳感器:依托于壓阻的壓力傳感器,其工作機(jī)理依托半導(dǎo)體實(shí)現(xiàn),由于半導(dǎo)體在電阻率的變化端會(huì)展現(xiàn)出敏感性,因此當(dāng)外界的壓力出現(xiàn)時(shí)必然會(huì)導(dǎo)致對(duì)應(yīng)比率發(fā)生變化,進(jìn)而出現(xiàn)電流的產(chǎn)生,在壓力恒定的條件下,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電工電子技術(shù)(第3版) 課件 5.1.2 二極管
- 2024年新型貴金屬催化劑項(xiàng)目資金籌措計(jì)劃書(shū)代可行性研究報(bào)告
- 2024年觸控產(chǎn)品項(xiàng)目資金需求報(bào)告
- 《信息檢索綜合復(fù)習(xí)》課件
- 銀行風(fēng)險(xiǎn)監(jiān)控預(yù)警制度
- 采購(gòu)價(jià)格談判與成本控制制度
- 《教育學(xué)原理》課件
- 連鎖超市門(mén)面轉(zhuǎn)讓協(xié)議書(shū)(32篇)
- 有關(guān)敬業(yè)演講稿
- 濃情端午感恩父母演講稿(30篇)
- 42煤東翼大巷綜采工作面過(guò)空巷專項(xiàng)辨識(shí)
- 圓管鋼立柱柱吊裝施工方案
- 新滬教牛津版九年級(jí)上冊(cè)英語(yǔ)全冊(cè)教案
- 醫(yī)療器械經(jīng)營(yíng)質(zhì)量管理體系文件(全套)
- GB∕T 16422.2-2022 塑料 實(shí)驗(yàn)室光源暴露試驗(yàn)方法 第2部分:氙弧燈
- 1-義務(wù)教育道德與法治課程標(biāo)準(zhǔn)(2022年版)
- 母排搭接要求
- 售后維修服務(wù)單模板
- HB 4-1-2020 擴(kuò)口管路連接件通用規(guī)范
- 001不銹鋼水箱安裝技術(shù)交底0705
- 佛教基礎(chǔ)教義苦集滅道ppt模版課件
評(píng)論
0/150
提交評(píng)論