美賽-蠓蟲識別數(shù)模六組_第1頁
美賽-蠓蟲識別數(shù)模六組_第2頁
美賽-蠓蟲識別數(shù)模六組_第3頁
美賽-蠓蟲識別數(shù)模六組_第4頁
美賽-蠓蟲識別數(shù)模六組_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

蠓蟲識別問題第六組:鄭星宇、王子豪、李葦青-----------------------------------------------------------------------------------------------------------------------------------------------------------------------題目大意對兩類蠓蟲(Af與Apf)進行鑒別依據(jù)資料是:蠓蟲的觸角和翅膀長度,已測得9只Af和6只Apf的數(shù)據(jù)。問題介紹Af類觸角長翅膀長1.241.721.361.741.381.641.381.821.381.901.401.701.481.821.541.821.562.08Apf類觸角長翅膀長1.141.781.181.961.201.861.262.001.282.001.301.96------------------------------------------------------------------------------------------------------------------問題介紹解決問題憑借原始資料(9只Af和6只Apf,以下稱學習樣本)制定一種方法,以正確區(qū)分兩種。以此方法識別題目所提供的三個樣本:(1.24,1.80)、(1.28,1.84)、(1.40,2.04)。設Af是寶貴傳粉益蟲,Apf是疾病載體,是否應該修改分類方法?------------------------------------------------------------------------------------------------------------------問題介紹------------------------------------------------------------------------------------------------------------------識別問題神經(jīng)網(wǎng)絡模型概率統(tǒng)計Fisher方法問題分析由所給翅長和觸角長確定判別依據(jù),進行歸類。由一方法對三組待分類樣本進行歸類??紤]錯判損失之后,進行模型改進,再次歸類。問題分析------------------------------------------------------------------------------------------------------------------方法一神經(jīng)網(wǎng)絡NeuralNetwork------------------------------------------------------------------------------------------------------------------神經(jīng)元模型------------------------------------------------------------------------------------------------------------------神經(jīng)網(wǎng)絡模型1.241.361.381.381.381.41.481.541.561.141.181.21.261.281.31.721.741.641.821.91.71.821.822.081.781.961.86221.96111111000000000000000111111111------------------------------------------------------------------------------------------------------------------神經(jīng)網(wǎng)絡模型Apf10.99990.000020.99990.000030.99980.000040.99990.000050.99990.000060.99270.0020Af10.00040.997620.00000.999930.00000.999940.00000.999950.00010.999960.00000.999970.00011.000080.00011.000090.00001.0000A?10.27140.295420.01620.920330.02080.9797------------------------------------------------------------------------------------------------------------------神經(jīng)網(wǎng)絡模型------------------------------------------------------------------------------------------------------------------模型優(yōu)缺點非線性映射容錯:個別樣本誤差對總體無影響需要的樣本數(shù)較多隱含層節(jié)點個數(shù)的確定方法不唯一------------------------------------------------------------------------------------------------------------------方法二概率統(tǒng)計ProbabilityStatistics------------------------------------------------------------------------------------------------------------------模型摘要

------------------------------------------------------------------------------------------------------------------為使問題明確及確保模型精度做一下,特作如下假設上述兩類蠓蟲的觸角與翅膀的總體均值、標準差和相關系數(shù),與學習樣本所能反映的值是相符的;如果以X(觸角長度)和Y(翅膀長度)為隨機變量,則隨機變量(X,Y)服從二維正態(tài)分布;Af類群體與與Apf類群體的自然總值比率為r,不妨設定為1(兩蠓蟲種群數(shù)量相等)或1.5(根據(jù)所給數(shù)據(jù)量9:6)每個給定的數(shù)據(jù)點所對應的種類是確定的。模型假設------------------------------------------------------------------------------------------------------------------幾點說明

------------------------------------------------------------------------------------------------------------------可能性一

可能性一無太大意義------------------------------------------------------------------------------------------------------------------可能性二忽略比率效應,生物體大小在小范圍內變化,可不優(yōu)先考慮比率問題,將翅膀長和觸角長X、Y當做兩個隨機變量來考慮其中相關關系.------------------------------------------------------------------------------------------------------------------模型設計

------------------------------------------------------------------------------------------------------------------模型設計求得參數(shù)表:Apf1.2271.9270.06280.08820.653Af1.4131.8040.9900.1300.559(0.593)注:這里與書上有出入,之后計算全以我們自己算的為主------------------------------------------------------------------------------------------------------------------模型設計

------------------------------------------------------------------------------------------------------------------模型設計

------------------------------------------------------------------------------------------------------------------模型設計

------------------------------------------------------------------------------------------------------------------誤差分析

------------------------------------------------------------------------------------------------------------------誤差分析負謬誤正謬誤r=1r=1.5r=1r=1.50.010.00030.00040.12390.11260.050.00140.00200.08120.07230.10.00260.00370.06520.05730.50.0160.0220.0300.0250.90.0780.1020.0100.0080.570.0200.0270.0260.022圖表,顯示不同閾值和兩個不同群體總值比率下,正負謬誤的幾率選擇自然閾值0.5,總值比率r=1或1.5時,正負謬誤識別幾率都低于3%!表明我們所建立的二元分布能夠在很小誤差下把兩類蠓蟲分開!圖表中最優(yōu)值在0.57處------------------------------------------------------------------------------------------------------------------識別樣本

------------------------------------------------------------------------------------------------------------------解決問題二

------------------------------------------------------------------------------------------------------------------模型檢驗(X,Y)r=1r=1.5(1.24,1.80).7169(Apf).6280(Apf)(1.28,1.84).5459(Apf).4449(Af)(1.40,2.04).3759(Af).2865(Af)

用閾值0.5判斷的時候,一個蟲體在監(jiān)測點(1.28,1.84)會隨r從1變1.5而從Apf轉變?yōu)锳f,r的變化對蠓蟲分類有較大影響,但是我們發(fā)現(xiàn)樣本點位于f,g尾部,而一般來說,使p變化迅速區(qū)域在f,g的尾部,所以p在靠近其最大值最小值部分看上去平坦,僅在小區(qū)域內變化迅速,r在100或0.01處也是如此,所以對于一個隨機的選擇,這種p函數(shù)閾值選擇法很可能非常穩(wěn)定------------------------------------------------------------------------------------------------------------------模型分析(優(yōu)點與不足)

------------------------------------------------------------------------------------------------------------------方法三費舍方法Fisher’sMethod------------------------------------------------------------------------------------------------------------------問題回顧解決問題蠓蟲有p個特征,p=2。(即翅膀長和觸角長)令:Apf為群體1,樣本數(shù)為s=6;Af為群體2,樣本數(shù)為t=9用代數(shù)語言描述蠓蟲特征,獲得劃分的判別式將三個未知點歸類考慮錯誤分類,修改判別式------------------------------------------------------------------------------------------------------------------

模型假設------------------------------------------------------------------------------------------------------------------

模型假設ApfAf12.77763.401222.94520.331230.64391.950240.72860.294850.79171.596362.11260.873370.605882.411694.5352------------------------------------------------------------------------------------------------------------------問題介紹如何尋找?------------------------------------------------------------------------------------------------------------------

模型設計Fisher方法------------------------------------------------------------------------------------------------------------------

模型設計Fisher方法------------------------------------------------------------------------------------------------------------------

模型設計Fisher方法

------------------------------------------------------------------------------------------------------------------

具體步驟------------------------------------------------------------------------------------------------------------------

具體步驟------------------------------------------------------------------------------------------------------------------文中協(xié)方差陣模型結果

------------------------------------------------------------------------------------------------------------------協(xié)方差陣模型結果

------------------------------------------------------------------------------------------------------------------

模型方法分析文中協(xié)方差陣協(xié)方差陣------------------------------------------------------------------------------------------------------------------

模型方法分析和改進

------------------------------------------------------------------------------------------------------------------

模型分析和改進二次分類法則--------------------------------

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論