回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述_第1頁
回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述_第2頁
回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述_第3頁
回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述_第4頁
回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、回歸方程與神經(jīng)網(wǎng)絡(luò)在數(shù)值預(yù)測方面的對比研究綜述【關(guān)鍵詞】神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)實(shí)踐中往往需要對尚未發(fā)生的事件特征進(jìn)行數(shù)據(jù)預(yù)測,在這一過程中都剩是從以往獲得的數(shù)據(jù)作為預(yù)測的根據(jù)。但避是,回歸方程的預(yù)測的實(shí)質(zhì)是從已知數(shù)據(jù)雕中計(jì)算出回歸方程,再從回歸方程線的走醍向趨勢來獲得未知的數(shù)據(jù)。而神經(jīng)網(wǎng)絡(luò)預(yù)碓測的實(shí)質(zhì)是從已知的數(shù)據(jù)空間,根據(jù)某種紆原則向未知數(shù)據(jù)空間進(jìn)行映射,從而得到投未知數(shù)據(jù)。雖然這兩種預(yù)測原理根本不同歃,但其預(yù)測值的結(jié)果在有些時(shí)候卻驚人的一致。那末,在具體數(shù)值預(yù)測實(shí)踐中到底秘選用哪種方法則需要根據(jù)具體情況而定。費(fèi)筆者得出的結(jié)論是:若已知數(shù)據(jù)因果之間倭能形成某種函數(shù)趨勢,則使用回歸方程方期法;若已知數(shù)

2、據(jù)因果之間僅能找到某種較砂為穩(wěn)定規(guī)律,但不能形成函數(shù)趨勢時(shí),則昀使用神經(jīng)網(wǎng)絡(luò)方法。下面對這兩種方法分廢別進(jìn)行敘述。1回歸方程在中學(xué)階段我們大家都學(xué)過直角坐標(biāo)下的直線方程珧y=kx+b。其中x是自變量,y是因變量,k是斜率,b是截距。當(dāng)直線有斜率時(shí)(即k0),直線方程可用平面上咎的兩個(gè)點(diǎn)式表示:y-y1y2-y1贊=x-x1x2-x1,這說明兩個(gè)點(diǎn)檻可以確定一條直線。如點(diǎn)與點(diǎn)便可確定一蜾條直線。直線回歸方程中存在著許多點(diǎn)(揶x1,y1),(x2,y2),(xn,yn),而求回歸線,實(shí)質(zhì)上是算出所有這些點(diǎn)的平均值所確定的一條直線。那么怎樣求這些點(diǎn)的平均值呢?我們看瘠下圖:從圖中我們可以看出,每一個(gè)

3、點(diǎn)慰到直線距離的代數(shù)和是最小的,即直線上的點(diǎn)是這些點(diǎn)的平均值。這條直線就稱為催這些點(diǎn)的回歸線。下面我們來討論回歸線儐的求法。假設(shè)平面上有n個(gè)點(diǎn),(x1,y1),(x2,y2),(xn,yn),它們的趨勢是一致的,那么,這些點(diǎn)便可構(gòu)成一條回歸線y=kx+b,這些點(diǎn)的所有x坐標(biāo)的均值和y坐標(biāo)的均值與每一個(gè)具體點(diǎn)xi,yi之差的平方萋和就是ni=1(Xi-)2與ni=1(Yi-)2這兩個(gè)數(shù)代表所有掉點(diǎn)到中心點(diǎn)的距離。在中學(xué)階段我們便知應(yīng)道了求直線的斜率k=yx,我們看一牿看式子ni=1(Xi-)(Yi-英)ni=1(Xi-)(Xi-)阱如果分子分母同時(shí)約去(Xi-),式子丹就變成了ni=1(Yi-)

4、n掎i=1(Xi-),這不也是一種很合理的比率嗎,它與求直線斜率是多么相象窕,實(shí)際上,回歸線的斜率k就是ni茅=1(Xi-)(Yi-)ni=薔1(Xi-)2,它能夠通過最小二乘法盅求證的。知道了如何求回歸線的斜率,再網(wǎng)求回歸線的截距b就非常容易了,b=-熨k。有了回歸線的斜率k和截距b便可確悶立了一條回歸線,這樣對于給定任意點(diǎn)的傷x坐標(biāo),就可確定y坐標(biāo)了。與中學(xué)時(shí)不憩同的是所確定的點(diǎn)可能不在直線上,而是分布在直線兩側(cè)?;貧w線的意義非常大,淙其中一個(gè)重要作用是用它來進(jìn)行預(yù)測,如飪:y=+7(x為體重,y為身長),那步么稱得體重為9kg,便可估計(jì)嬰兒的身匐長大約為+7=(cm)。當(dāng)然嚴(yán)格地說灝來回

5、歸方程還應(yīng)該包含隨機(jī)項(xiàng)i,且隨部機(jī)項(xiàng)必須服從正態(tài)分布。在實(shí)際應(yīng)用中,我們用統(tǒng)計(jì)軟件SPSS來計(jì)算。如果在平面上這兩組數(shù)據(jù)之間關(guān)系不是線性的,鬻而呈曲線,則用曲線擬合,數(shù)據(jù)之間關(guān)系寂如下圖所示:從圖中看出,用二次曲線擬合,便可得到曲線回歸方程:y=-+佻當(dāng)回歸方程中自變量數(shù)目x2,就稱此方程為多元回歸方程,多元回歸方程也分傖為多元線性回歸方程與多元非線性回歸方湛程。多元線性回歸方程形如:y1=a11x11+a12x12+a1nx嗒1n+1y2=a21x21+a22x22+a2nx2n+2y朗m=am1xm1+am2xm2+琦amnxmn+m這里yi是第i個(gè)方橋程的因變量,ai1ai2ain為第生

6、i個(gè)方程的回歸系數(shù),xi1xi2x迸in為第i個(gè)方程的自變量,i為第i岢個(gè)方程的隨機(jī)項(xiàng)(1im)??梢姸圜粼€性回歸方程是方程組,多元線性回歸方程可寫成矩陣形式:Y=A1X1+A包2X2+AnXn+E。多元線性回歸方程組可以被看作是N維歐氏空間中的一簇直線族。如同一元線性回歸方程與一毯元非線性回歸方程一樣,多元回歸方程組也有多元非線性方程組,它們可以被看作磷是N維歐氏空間中的一簇曲線族,在進(jìn)行泣多元方程組計(jì)算時(shí)可使用SPSS軟件。浴回歸模型是研究變量間關(guān)系的一種方法,戈通過回歸方程來表達(dá)因變量與自變量在數(shù)晌值上的共同變化關(guān)系。當(dāng)研究兩個(gè)變量的吶線性關(guān)系時(shí),就是直線回歸,也稱一元線鷯性回歸,這是

7、回歸分析中最簡單的一種。錸線性回歸可將直線衍變成多種函數(shù)曲線,這樣線性回歸就改變成非線性回歸。如果樣自變量與因變量之間毫無規(guī)律可循,或隨忒機(jī)項(xiàng)不服從正態(tài)分布,此時(shí)再使用回歸方程,得出的結(jié)果將無任何意義。2神紿經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ARTIFIC四IALNEURALNETWORK,簡祗稱)是在對人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)蘑識理解基礎(chǔ)之上模擬其結(jié)構(gòu)和功能行為的壺一種方法。神經(jīng)系統(tǒng)的基本構(gòu)造是神經(jīng)元愀(神經(jīng)細(xì)胞),它是處理人體內(nèi)各部分之糅間相互信息傳遞的基本單元。據(jù)神經(jīng)生物學(xué)家研究的結(jié)果表明,人的大腦一般有101011個(gè)神經(jīng)元。每個(gè)神經(jīng)元都由洗一個(gè)細(xì)胞體,一個(gè)向其它神經(jīng)元傳輸信息的軸突和一些接收其它神

8、經(jīng)元發(fā)出信息的瀣樹突組成。神經(jīng)元胞體將接收到的所有信莩號進(jìn)行簡單地處理,如加權(quán)求和,即對所有的輸入信號都加以考慮且對每個(gè)信號的篾重視程度體現(xiàn)在權(quán)值上的不同,后由軸突輸出。由此可以很容易的建立起神經(jīng)哲元的模型,如下圖所示。大腦之所以能夠處理極其復(fù)雜的分析、推理工作,一方面是因?yàn)槠渖窠?jīng)元個(gè)數(shù)的龐大,另一方面舀還在于神經(jīng)元能夠?qū)斎胄盘栠M(jìn)行非線性費(fèi)并行處理。它是一個(gè)多輸入單輸出的非線軛性器件。其中的權(quán)值W即代表神經(jīng)元之間戍的連接強(qiáng)度。3人工神經(jīng)網(wǎng)絡(luò)的工作原嫠理人工神經(jīng)網(wǎng)絡(luò)首先要以一定的學(xué)習(xí)準(zhǔn)苗則進(jìn)行學(xué)習(xí),然后才能工作。現(xiàn)以人工神巨經(jīng)網(wǎng)絡(luò)對手寫“A”、“B”兩個(gè)字母的抱識別為例進(jìn)行說明。規(guī)定當(dāng)“A”輸

9、入網(wǎng)絡(luò)時(shí),應(yīng)該輸出“1”,而當(dāng)輸入為“B”時(shí),輸出為“0”。所以網(wǎng)絡(luò)學(xué)習(xí)的準(zhǔn)飫則應(yīng)該是:如果網(wǎng)絡(luò)作出錯(cuò)誤的的判決,則通過網(wǎng)絡(luò)的學(xué)習(xí),應(yīng)使得網(wǎng)絡(luò)減少下次蓄犯同樣錯(cuò)誤的可能性。首先,給網(wǎng)絡(luò)的各業(yè)連接權(quán)值賦予(0,1)區(qū)間內(nèi)的隨機(jī)值緞,將“A”所對應(yīng)的圖象模式輸入給網(wǎng)絡(luò)橥,網(wǎng)絡(luò)將輸入模式加權(quán)求和、與輸出閾值倘比較、再進(jìn)行非線性運(yùn)算,得到網(wǎng)絡(luò)的輸胚出。在此情況下,網(wǎng)絡(luò)輸出為“1”和“菅0”的概率各為50%,也就是說是完全芹隨機(jī)的。這時(shí)如果輸出為“1”(結(jié)果正大確),則使連接權(quán)值增大,以便使網(wǎng)絡(luò)再銼次遇到“A”模式輸入時(shí),仍然能作出正廟確的判斷。如果輸出為“0”(即結(jié)果錯(cuò)誤),則把網(wǎng)絡(luò)連接權(quán)值朝著減小綜

10、合輸鉅入加權(quán)值的方向調(diào)整,其目的在于使網(wǎng)絡(luò)攤下次再遇到“A”模式輸入時(shí),減小犯同樣錯(cuò)誤的可能性。如此操作調(diào)整,當(dāng)給網(wǎng)拮絡(luò)輪番輸入若干個(gè)手寫字母“A”、“B”后,經(jīng)過網(wǎng)絡(luò)按以上學(xué)習(xí)方法進(jìn)行若干浦次學(xué)習(xí)后,網(wǎng)絡(luò)判斷的正確率將大大提高北。這說明網(wǎng)絡(luò)對這兩個(gè)模式的學(xué)習(xí)已經(jīng)獲楞得了成功,它已將這兩個(gè)模式分布地記憶吁在網(wǎng)絡(luò)的各個(gè)連接權(quán)值上。當(dāng)網(wǎng)絡(luò)再次遇身到其中任何一個(gè)模式時(shí),能夠做出迅速、虍準(zhǔn)確的判斷和識別。一般說來,網(wǎng)絡(luò)中所芊含的神經(jīng)元個(gè)數(shù)越多,則它能記憶、識別愧的模式也就越多。4人工神經(jīng)網(wǎng)絡(luò)的欄特點(diǎn)人工神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元廣迪泛互連而成的系統(tǒng),它的這一結(jié)構(gòu)特點(diǎn)決耗定著人工神經(jīng)網(wǎng)絡(luò)具有高速信息處理的

11、能簟力。人腦的每個(gè)神經(jīng)元大約有1034戳個(gè)樹突及相應(yīng)的突觸,一個(gè)人的大腦總計(jì)約形成101415個(gè)突觸。用神經(jīng)網(wǎng)鯢絡(luò)的術(shù)語來說,即是人腦具有1014尼15個(gè)互相連接的存儲(chǔ)潛力。雖然每個(gè)神賾經(jīng)元的運(yùn)算功能十分簡單,且信號傳輸速寬率也較低(大約100次/秒),但由于各神經(jīng)元之間的極度并行互連功能,最終真使得一個(gè)普通人的大腦在約1秒內(nèi)就能完罕成現(xiàn)行計(jì)算機(jī)至少需要數(shù)10億次處理步頻驟才能完成的任務(wù)。人工神經(jīng)網(wǎng)絡(luò)的知識翱存儲(chǔ)容量很大。在神經(jīng)網(wǎng)絡(luò)中,知識與信筏息的存儲(chǔ)表現(xiàn)為神經(jīng)元之間分布式的物理貓聯(lián)系,它分散地表示和存儲(chǔ)于整個(gè)網(wǎng)絡(luò)內(nèi)纖的各神經(jīng)元及其連線上。每個(gè)神經(jīng)元及其買連線只表示一部分信息,而不是一個(gè)完整

12、鈍具體概念。只有通過各神經(jīng)元的分布式綜嬪合效果才能表達(dá)出特定的概念和知識。由于人工神經(jīng)網(wǎng)絡(luò)中神經(jīng)元個(gè)數(shù)眾多以及整簣個(gè)網(wǎng)絡(luò)存儲(chǔ)信息容量的巨大,使得它具有摹很強(qiáng)的不確定性信息處理能力。即使輸入破信息不完全、不準(zhǔn)確或模糊不清,神經(jīng)網(wǎng)噻絡(luò)仍然能夠聯(lián)想思維持在于記憶中事物的骱完整圖象。只要輸入的模式接近于訓(xùn)練樣本,系統(tǒng)就能給出正確的推理結(jié)論。正是霞因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和其信息存吏儲(chǔ)的分布式特點(diǎn),使得它相對于其它的判蟪斷識別系統(tǒng),如:專家系統(tǒng)等,具有另一暫個(gè)顯著的優(yōu)點(diǎn):健壯性。生物神經(jīng)網(wǎng)絡(luò)不悶會(huì)因?yàn)閭€(gè)別神經(jīng)元的損失而失去對原有模罔式的記憶。最有力的證明是,當(dāng)一個(gè)人的紡大腦因意外事故受輕微損傷之后,并

13、不會(huì)袤失去原有事物的全部記憶。人工神經(jīng)網(wǎng)絡(luò)也有類似的情況。因某些原因,無論是網(wǎng)溥絡(luò)的硬件實(shí)現(xiàn)還是軟件實(shí)現(xiàn)中的某個(gè)或某些神經(jīng)元失效,整個(gè)網(wǎng)絡(luò)仍然能繼續(xù)工作琥。人工神經(jīng)網(wǎng)絡(luò)同現(xiàn)行的計(jì)算機(jī)不同,是一種非線性的處理單元。只有當(dāng)神經(jīng)元對戔所有的輸入信號的綜合處理結(jié)果超過某一損閾值后才輸出一個(gè)信號。因此神經(jīng)網(wǎng)絡(luò)是镅一種具有高度非線性的超大規(guī)模連續(xù)時(shí)間動(dòng)力學(xué)系統(tǒng)。它突破了傳統(tǒng)的以線性處理為基礎(chǔ)的數(shù)字電子計(jì)算機(jī)的局限,標(biāo)志著奩人們智能信息處理能力和模擬人腦智能行為能力的一大飛躍。下面舉一腦梗塞事例栲,其數(shù)據(jù)分別用多元回歸方程與Elma搠n神經(jīng)網(wǎng)絡(luò)進(jìn)行處理,看一看處理的結(jié)果框:取50例天津大港醫(yī)院XXXX兩年噔

14、內(nèi)6065歲男性腦梗塞患者報(bào)病卡的回顧性調(diào)查病例,與50例天津市大港中醫(yī)醫(yī)院XXXX兩年內(nèi)體檢的606劓5歲男性非腦梗塞患者作對照,選?。河袩o一過性腦缺血病史;漿纖維蛋白酶虍原水平;血糖水平;總膽固醇水平;趔舒張壓。這5種指標(biāo)進(jìn)行歸一化處理,作為回歸方程的自變量,與神經(jīng)網(wǎng)絡(luò)的輸姚入向量。歸一化處理過程為:取有一過性腦缺血病史者為1,否則為0;取血漿纖維蛋白酶原4g為1,否則取實(shí)際測得值4g;取血糖為1,否則取猥實(shí)際測得值;取總膽固醇30mg蛭/L為1,否則取實(shí)際測得值30mg部/L;取舒張壓95mmHg為1,萃否則取實(shí)際測得值95mmHg。其結(jié)【果列表如下:腦梗塞患者一過性腦缺血擂史血漿蛋白酶

15、原血糖總膽固醇舒張壓1111111戌11111娘11611111哦0111浞111101濘111110111111女11111藺2011111仟1111111呋1101011111蟠1111111111虧1351111莨13711111111111侄11111111111姘11111紊1111非腦梗塞1000000卯0111瞥100昝0000011111澆11111鑄24100000污000鯽13300蜓000000緬010000桕010娌0在SPSS12環(huán)境下進(jìn)函行多元回歸分析,得到回歸方程:Y=-齲+。將一位64歲男性,非腦梗冬塞體檢者的數(shù)據(jù):01進(jìn)行測試結(jié)嬪果為。在MathLab環(huán)境下調(diào)

16、用神經(jīng)網(wǎng)絡(luò)工具箱函數(shù)進(jìn)行數(shù)據(jù)處理,經(jīng)Elm遞an神經(jīng)網(wǎng)絡(luò)對同一數(shù)據(jù)處理后結(jié)果為:慰y=。前者得到的回歸數(shù)值說明體檢者的蘇檢查數(shù)據(jù)很接近健康指標(biāo),但從實(shí)際健康卑指標(biāo)可知,這組輸入數(shù)值已遠(yuǎn)離健康指標(biāo)倏。后者得到的神經(jīng)網(wǎng)絡(luò)結(jié)果值說明體檢者的兩側(cè)指標(biāo)均已向靠攏,說明體檢者的狀搦況正在向腦梗塞的指標(biāo)過渡。從現(xiàn)有腦梗駭塞患者的檢查數(shù)值來看,后者得到的數(shù)據(jù)鋏更可靠。上述計(jì)算結(jié)果表明Elman神喱經(jīng)網(wǎng)絡(luò)數(shù)值預(yù)測效果優(yōu)于回歸方程。分析辟其原因:腦梗塞患者與非腦梗塞體檢者的這5項(xiàng)臨床檢測指標(biāo)雖然在臨床上被認(rèn)為馴有決定性意義,但實(shí)際上患者與非患者間存在著數(shù)值交叉,這就為使用多元回歸方戊程帶來了干擾,而Elman神經(jīng)網(wǎng)絡(luò)方泔法卻正好發(fā)揮了它非線性映射能力的特長吠。由此它作為一種新型數(shù)值預(yù)測工具將發(fā)魅揮出卓越的功能。參考文獻(xiàn)1唁張堯庭概率統(tǒng)計(jì)第1版中央廣播電視大詮學(xué)出版社,19842陳峰醫(yī)用多元統(tǒng)計(jì)分析方法第1版中國統(tǒng)計(jì)出版社,2傭0003金丕煥醫(yī)用統(tǒng)計(jì)方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論