版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1/1畢業(yè)論文:基于Fisher判別準則的胃病分類模型基于Fisher判別準則的胃病分類模型摘要本文就胃癌患者、萎縮性胃炎患者以及非胃病患者的分類問題,綜合運用系統(tǒng)聚類和Fisher判別的方法建立了基于四個指標的分類判別模型。
針對問題一,模型采用系統(tǒng)聚類和Fisher判別的方法,根據(jù)題中已知類型的三個樣本13,14,15,將混淆的12個樣本1~12區(qū)別開來,并且使得樣本13,14,15在三個類別中。
使用SPSS軟件求得分類結(jié)果,胃癌患者:
1,2,4,5,13;萎縮性胃炎患者:
3,7,10,11,12,14;非胃病患者:
6,8,9,15。
針對問題二,本題基于問題一的分類情況,采用Fisher判別的方法,確定三個樣本16,17,18的類別。
使用SPSS軟件求得判別結(jié)果,第16號樣本和第18號樣本屬于第二類,即萎縮性胃病患者;第17號樣本屬于第三類,即非胃病患者。
最后對模型的優(yōu)缺點進行分析,提出了改進方案。
關(guān)鍵詞系統(tǒng)聚類;Fisher判別;SPSS軟件;判別模型1.問題的重述胃癌患者易誤診為萎縮性胃炎患者以及非胃病患者。
進行胃癌的鑒別主要是通過化驗4項生化指標:
血清銅藍蛋白(X1)、藍色反應(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)。
本來從胃癌患者、萎縮性胃炎患者以及非胃病患者中一共抽取了12人進行指標化驗,但是由于醫(yī)護人員的疏忽,將化驗結(jié)果搞混了。
現(xiàn)有以前對胃癌患者、萎縮性胃炎患者以及非胃病患者化驗的結(jié)果各一例,依次為(228,134,0.20,0.11)、(150,117,0.07,0.06)、(135,108,0.02,0.12),混淆的化驗結(jié)果見附件表十。
醫(yī)學上一般根據(jù)臨床的經(jīng)驗認為,患同一種病的人所表現(xiàn)出來的特征往往是相似的,現(xiàn)需建立一種判別準則,把上述混淆的結(jié)果區(qū)分開來,再將三個病人的化驗指標如下:
(210,142,0.10,0.08)、(180,120,0.08,0.21)、(150,130,0.05,0.14),區(qū)分他們各屬于哪一類人群。
2.模型假設(shè)和符號說明2.1.模型的假設(shè)(1)患同一種病的人所表現(xiàn)出來的特征往往是相似的;(2)被檢測的人員沒有其它任何疾??;(3)四項生化指標無關(guān)聯(lián)。
2.2符號使用說明(不打編號)(1)1X:
血清銅藍蛋白;(2)2X:
藍色反應;(3)3X:
尿吲哚乙酸;(4)4X:
中性硫化物(5)1~12:
表示未知分類樣本,即被混淆的樣本;(6)13~15:
表示已知分類樣本;(7)16~18:
表示待判的樣本;(8)1a、2a、3a:
分別表示使用特征值1時胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(9)1b、2b、3b:
分別表示使用特征值2時胃癌患者、萎縮性胃炎患者以及非胃病患者的重心;(10)12c、23c:
分別表示用特征值1時第一類與第二類,第二類與第三類之間的分界點。
(11)12d、23d:
分別表示用特征值2時第一類與第二類,第二類與第三類之間的分界點。
(13)1n、2n、3n:
分別表示第一類、第二類和第三類的個數(shù);(16))(ijx、)(ijx:
分別表示第i個指標第j個樣本的數(shù)據(jù)和標準化后的數(shù)據(jù);(17))(ix:
表示15個樣本值的第i個指標的樣本均值;(18))(is:
表示15個樣本值的第i個指標的樣本標準差;(19)jj、:
分別表示Fisher判別時使用1、2為標準化的函數(shù)系數(shù);3.問題的分析2.1問題一的分析本問題要求解的是將混淆的12組樣本判別其類型。
由于患同一種病的人所表現(xiàn)出來的特征往往是相似的,首先想到的是運用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進行判別。
但是此時卻無法將已知類別的三組樣本分開。
所以最重要的是將已知類別的樣本分開。
于是將12組未知類別的樣本和3組已知類別的樣本一起運用系統(tǒng)聚類,將與13號樣本為一類的作為第一類,與14號樣本為一類的作為第二類,與15號樣本為一類的作為第三類。
第一步,先將其聚成兩類。
若未將三類中的一類分開,重復第一步操作,直至有一個樣本分開。
第二步,對剩下的兩個樣本所在類聚成兩類,若未將這兩個樣本分開。
重復第二步,直至將這兩個樣本分開。
第三步,此時將還未知類別的樣本進行Fisher判別。
2.2問題二的分析本問題基于問題一的聚類結(jié)果,運用Fisher判別的方法,利用SPSS軟件得到其判別結(jié)果。
4.模型的建立與求解4.1問題一的解決方案及模型(多用幾種方法)(模型要有名字)本問題要求的是將混淆的12組未知類別的樣本區(qū)別開來。
由于患同一種病的人所表現(xiàn)出來的特征往往是相似的,首先想到的是運用系統(tǒng)聚類的方法,將未知類別的樣本分為三類,再將已知類別的樣本代入進行判別。
但是此時卻無法將已知類別的三組樣本分開。
于是將已知類別的三組樣本看成三類,再聚類得到與其類似的樣本。
第一階段:
標準化。
分析數(shù)據(jù)的量級和量綱,知該15個樣本的數(shù)據(jù)最大相差510,則說明相差較大,則需要對其進行標準化:
(可寫在模型的準備里面,我們用什么對其進行標準化))()()(jiiijisxxx=(1)第二階段:
系統(tǒng)聚類。
利用標準化后的數(shù)據(jù),用歐式距離求得兩點間的距離,再找最小的距離,將其聚類為一組:
=i==412)(),(minikijjkxxdkiD15,...,2,1=,kj且kj(2)第三階段:
Fisher判別。
將給定的指標代入式(3)進行求解,將得到的y與式(4)、式(5)進行比較,判別出其類型;若不能判別,再用2的系數(shù)進行判別。
(凡是公式都要提行)4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)(流程圖)4.1.1問題一的求解(表格的兩端不封口,居中,美觀,再表達一下)(1)第一步,標準化(見下表)。
表一:
標準化表人X1X2X3X4ZX1ZX2ZX3ZX412451340.10.41.598070.2407060.2681562.51490322001670.120.270.6697591.8084660.6512371.26386731701500.070.080.0508851.000832-0.30646-0.5645741001670.20.14-1.393151.8084662.1835580.01283152551250.070.141.804362-0.18686-0.306460.01283161301000.060.12-0.77428-1.37456-0.498-0.1796471201330.10.26-0.980570.1931990.2681561.16763481601000.050.1-0.15541-1.37456-0.68954-0.372191851150.050.190.360322-0.66194-0.689540.493999101701250.060.040.050885-0.18686-0.498-0.9495111651420.050.03-0.052260.620769-0.68954-1.04574121001170.070.02-1.39315-0.56693-0.30646-1.14197132281340.20.111.2473750.2407062.183558-0.27587141501170.070.06-0.3617-0.56693-0.30646-0.75704151351080.020.12-0.67113-0.9945-1.26417-0.17964(2)第二步,聚類。
對標準化后的數(shù)據(jù)進行系統(tǒng)聚類,在SPSS中將其分為兩類。
表二:
第一次系統(tǒng)聚類人X1X2X3X4ZX1ZX2ZX3ZX4CLU2_112451340.10.41.598070.2407060.2681562.514903122001670.120.270.6697591.8084660.6512371.263867131701500.070.080.0508851.000832-0.30646-0.56457241001670.20.14-1.393151.8084662.1835580.012831152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964271201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94952111651420.050.03-0.052260.620769-0.68954-1.045742121001170.070.02-1.39315-0.56693-0.30646-1.141972132281340.20.111.2473750.2407062.183558-0.275871141501170.070.06-0.3617-0.56693-0.30646-0.757042151351080.020.12-0.67113-0.9945-1.26417-0.179642(3)第三步,將表二中屬于第一類的樣本移出,再進行系統(tǒng)聚類。
表三:
第二次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(4)第四步,將表三中的第五個樣本移出,再進行系統(tǒng)聚類。
表四:
第三次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964171201330.10.26-0.980570.1931990.2681561.167634281601000.050.1-0.15541-1.37456-0.68954-0.3721191851150.050.190.360322-0.66194-0.689540.4939991101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179641(5)將表四中的第七個樣本移出,再進行系統(tǒng)聚類。
表五:
第四次系統(tǒng)聚類31701500.070.080.0508851.000832-0.30646-0.56457161301000.060.12-0.77428-1.37456-0.498-0.17964281601000.050.1-0.15541-1.37456-0.68954-0.3721291851150.050.190.360322-0.66194-0.689540.4939992101701250.060.040.050885-0.18686-0.498-0.94951111651420.050.03-0.052260.620769-0.68954-1.045741121001170.070.02-1.39315-0.56693-0.30646-1.141971141501170.070.06-0.3617-0.56693-0.30646-0.757041151351080.020.12-0.67113-0.9945-1.26417-0.179642(6)此時已將13、14、15號樣本完全分開,但是在分開過程中,將5、7號樣本移出,最后再對5、7號樣本進行Fisher判別:
表六:
第五次系統(tǒng)聚類12451340.10.41.598070.2407060.2681562.5149031122001670.120.270.6697591.8084660.6512371.2638671131701500.070.080.0508851.000832-0.30646-0.564572241001670.20.14-1.393151.8084662.1835580.0128311152551250.070.141.804362-0.18686-0.306460.012831261301000.060.12-0.77428-1.37456-0.498-0.179643371201330.10.26-0.980570.1931990.2681561.167634181601000.050.1-0.15541-1.37456-0.68954-0.37213391851150.050.190.360322-0.66194-0.689540.49399933101701250.060.040.050885-0.18686-0.498-0.949522111651420.050.03-0.052260.620769-0.68954-1.0457422121001170.070.02-1.39315-0.56693-0.30646-1.1419722132281340.20.111.2473750.2407062.183558-0.2758711141501170.070.06-0.3617-0.56693-0.30646-0.7570422151351080.020.12-0.67113-0.9945-1.26417-0.179643所以屬于胃癌患者的有1,2,4,7,13;屬于萎縮性胃炎患者的有:
3,5,10,11,12,14;屬于非胃病患者的有:
6,8,9,15。
問題二的解決方案及模型第三階段:
Fisher判別。
將給定的指標代入式(3)進行求解,將得到的y與式(4)、式(5)進行比較,判別出其類型;若不能判別,再用2的系數(shù)進行判別。
4j43j32j21j1xxxxy+++=(3)21221112nnananc++=(4)32332223nnananc++=(5)4j43j32j21j1xxxxy+++=(6)21221112nnbnbnd++=(7)32332223nnbnbnd++=(8)問題二的求解表七:
未標準化的函數(shù)系數(shù)(可以不要)CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035CanonicalDiscriminantFunctionCoefficientsFunction12X1-.012.011X2.008.061X346.378-4.449X421.842-8.949(Constant)-6.043-8.035Unstandardizedcoefficients
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 管理人員崗前安全培訓試題【培優(yōu)】
- 口服片藥物生產(chǎn)課程設(shè)計
- 廠里安全培訓試題高清
- 如何進行幼兒課程設(shè)計
- 醋酸丁酯行業(yè)相關(guān)投資計劃提議范本
- 穿水冷卻裝置相關(guān)行業(yè)投資規(guī)劃報告范本
- 宮斗片相關(guān)行業(yè)投資方案
- 動物主題游戲課程設(shè)計
- 重讀試從建設(shè)工程施工合同糾紛司法解釋視角探尋缺陷責任期規(guī)定之額外用意
- 2024年氣體放電燈:氙氣燈項目立項申請報告模范
- ST語言編程手冊
- 基層綜合治理法律培訓課件
- 寺頭中學中考成績分析報告
- 房地產(chǎn)市場報告 -2023年第四季度佛山寫字樓市場報告
- 郭繼承人生課:中華經(jīng)典十三講
- 草銨膦中毒護理查房課件
- 強化預算管理盤活財政存量資金的路徑演示稿件
- 肛瘺護理查房范文
- 秋季少先隊活動教研記錄表
- 科技倫理課件
- 腎內(nèi)科血液透析患者體外凝血發(fā)生原因分析魚骨圖柏拉圖對策擬定
評論
0/150
提交評論