費(fèi)歇爾判別第三節(jié)_第1頁(yè)
費(fèi)歇爾判別第三節(jié)_第2頁(yè)
費(fèi)歇爾判別第三節(jié)_第3頁(yè)
費(fèi)歇爾判別第三節(jié)_第4頁(yè)
費(fèi)歇爾判別第三節(jié)_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、3 費(fèi)歇爾判別法兩個(gè)總體的費(fèi)歇(Fisher)判別法 X 不能使總體盡可能分開的方向能使總體單位盡可能分開的方向旋轉(zhuǎn)坐標(biāo)軸至總體單位盡可能分開的方向,此時(shí)分類變量被簡(jiǎn)化為一個(gè) 費(fèi)歇判別的基本思想是投影,將k組p維數(shù)據(jù)投影到某一個(gè)方向,使其投影的組與組之間盡可能地分開。 u費(fèi)歇判別的基本思想 Fisher判別法由Fisher在1936年提出,是根據(jù)方差分析的思想建立起來(lái)的一種能較好區(qū)分各個(gè)總體的線性判別法,該判別方法對(duì)總體的分布不做任何要求。 從兩個(gè)總體中抽取具有p個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助于方差分析的思想構(gòu)造一個(gè)線性判別函數(shù): 系數(shù) 確定的原則假設(shè)我們可以得到一個(gè)線性判別函數(shù):我們把兩個(gè)總體的

2、樣品數(shù)據(jù)代入上面的判別式使組間離差平方和最大,而組內(nèi)離差平方和最小。 為了使判別函數(shù)能夠很好地區(qū)分來(lái)自不同總體G1和G2的樣品,自然希望:(2)來(lái)自同一總體的各個(gè)樣品之間的差異越小越好。即 的離差平方和 越小越好 即 的離差平方和 越小越好 (1) 和 的差異越大越好 令 由于 故 其中即為兩類總體的樣本均值差 其中 令 是常數(shù)因子,不依賴于它對(duì)方程組只起共同擴(kuò)大倍數(shù)的作用,不影響判別結(jié)果,不妨取 于是得到 用矩陣表示: 因此得到 稱 為判別函數(shù).兩總體的 積差陣之和兩總體的 積差陣之和判別臨界值其中判別準(zhǔn)則 ,則判別準(zhǔn)則為: (二)Fisher兩類判別的計(jì)算步驟:1、輸入歷史數(shù)據(jù),計(jì)算 和

3、2、計(jì)算3、解方程組 ,求出 ,建立判別函數(shù)4、對(duì)新樣本作判別 (1)將新樣本p個(gè)觀測(cè)值帶入判別函數(shù),求出y值 (2)確定臨界值 分別將兩類總體樣本的判別函數(shù)之均值 求加權(quán)平均值 作為臨界值。5、作出判別 (1) (2)例 某外貿(mào)公司為推銷某一新產(chǎn)品,為保險(xiǎn)起見,在新產(chǎn)品大量上市前將該產(chǎn)品的樣品寄往12個(gè)國(guó)家的進(jìn)口代理商,并附意見調(diào)查表,要求對(duì)該產(chǎn)品給予評(píng)估,評(píng)估的因素有式樣、包裝及耐久性三項(xiàng)。評(píng)分表用10分制,最后要求說(shuō)明是否愿意購(gòu)買,調(diào)查結(jié)果如下: 購(gòu)買組12345679 8 77 6 610 7 88 4 59 9 38 6 77 5 6非購(gòu)買組123454 4 43 6 66 3 32

4、 4 51 2 2第13個(gè)國(guó)家的進(jìn)口代理商評(píng)分(9,5,8),問該代理商是否愿意購(gòu)買此產(chǎn)品。 求兩總體的樣本均值2. 求兩總體樣本均值之差3. 求兩總體的樣本離差平方和矩陣E先求各4. 求判別系數(shù)5. 得判別函數(shù) =6.=0.216928.29+0.01826.43+0.056046=2.251533 =0.0987464 判別的臨界值 則判別準(zhǔn)則為:7. 對(duì)已知類別的樣品判別分類對(duì)已知類別的樣品(通常成為訓(xùn)練樣品)用線性判別函數(shù)進(jìn)行判別歸類,結(jié)果如下表:樣品原類號(hào)判歸類別12345672.491.962.742.092.282.241.9511111111111111123451.161.1

5、01.520.790.372222222222回代率為百之百,全部判對(duì)。對(duì)判別類別的樣品判別歸類 =(9,5,8),0.216929+0.01825+0.056048=2.4916Yc屬購(gòu)買組故多個(gè)總體的Fisher判別法 (一) 判別函數(shù)Fisher判別法實(shí)際上是致力于尋找一個(gè)最能反映組和組之間差異的投影方向,即尋找線性判別函數(shù) ,設(shè)有 個(gè)總體 ,分別有均值向量 , , 和協(xié)方差陣 , 分別從各總體中得到樣品:第i個(gè)總體的樣本均值向量 綜合的樣本均值向量 第i個(gè)總體樣本組內(nèi)離差平方和 綜合的組內(nèi)離差平方和組間離差平方和如果判別分析是有效的,則所有的樣品的線性組合 滿足組內(nèi)離差平方和小,而組間

6、離差平方和大。則而 所對(duì)應(yīng)的特征向量即 。Fisher樣品判別函數(shù)是 然而,如果組數(shù)k太大,討論的指標(biāo)太多,則一個(gè)判別函數(shù)是不夠的,這時(shí)需要尋找第二個(gè),甚至第三個(gè)線性判別函數(shù)其特征向量構(gòu)成第二個(gè)判別函數(shù)的系數(shù)。類推得到m(mk)個(gè)線性函數(shù)。關(guān)于需要幾個(gè)判別函數(shù)得問題,需要累計(jì)判別效率達(dá)到85以上,即有設(shè) 為B相對(duì)于E的特征根,則 以m個(gè)線性判別函數(shù)得到的函數(shù)值為新的變量,再進(jìn)行距離判別。 判別規(guī)則:設(shè)Yi(X)為第i個(gè)線性判別函數(shù), ,則試用各種判別方法對(duì)待判樣本進(jìn)行判類。 (1)1990聯(lián)合國(guó)開發(fā)計(jì)劃署公布的人類發(fā)展報(bào)告,用出生時(shí)的預(yù)期壽命(x1)、成人識(shí)字率(x2)、實(shí)際的人均GDP(x3)等三個(gè)變量衡量人類發(fā)展?fàn)顩r,現(xiàn)從高發(fā)展水平國(guó)家和中等發(fā)展水平國(guó)家中各選了5個(gè)樣本,另選中國(guó)、希臘作為待判樣本。要求: A、作距離判別分析(假定兩總體協(xié)方差陣相等) B、作Fisher判別分析距離判別:(a)計(jì)算兩類樣本均值:(b)計(jì)算樣本協(xié)方差和總

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論