雜貨店分類與聚類_第1頁
雜貨店分類與聚類_第2頁
雜貨店分類與聚類_第3頁
雜貨店分類與聚類_第4頁
雜貨店分類與聚類_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1/92第2/92第3/92第4/92X,值域是C第5/92很多分類體系Reuters第6/92法A類馬列主義 TB類一般工業(yè)技B類哲 TD類礦業(yè)工C類社會科學總 TE類石油、天然氣工D類政治、法 TF類冶金工E類軍 TG類金屬學、金屬工F類經(jīng) TH類機械、儀表工GHI類文學J類藝術(shù)KNO類數(shù)理科學和化學PQ類生物科學 S類農(nóng)業(yè)科學U類交通V類

TK類動力工業(yè)TL類原子能技術(shù)TM類電工技術(shù)TNTP類自動化技術(shù)、計算技術(shù)TQ類化學工業(yè)TSTU類建筑科學TV類水利工程第7/92

X類環(huán)境科學、勞動保護科學(安全科學

分類工分類工 類第8/92“nning

第9/92 第10/92 表(ContingencyABCD準確率(precision)aa率(recall)aafallout=b/(b+第11/92BEP(BEP(break-even當準確率 率相等時的值即為Fp,r2 2p

F

2pr prr時),因此BEP小于或等于F1第12/92 第13/92 第14/92 第15/92 ·第16/92第17/92

第18/92·第19/92P(H|E)P(H

P(E|H)P(HP(HP(HE)P(E|H)P(H得到:P(H|E)P(E|H)P(H第20/92P(ci|E)

n

|E)n

nn

P(ci)P(E|ci)P(E)P(E)P(ci)P(E|ci第21/92先驗概率條件概率P(E|P(ci則 P(ci)=ni/Ee1e2…第22/92mmP(E|ci)P(e1e2.em|ci)P(ej|ci第23/92ciCP(ci)=|Di|/P(wi|ci)=(nij+1)/(ni+|V第24/92n為XnargmaxP(ci)P(wi|cin

第25/92第26/92

C={allergy,cold,e1=sneeze;e2=cough;e3=當前實例是:E{sneezecoughNa?veBayesP(well|E)=P(cold|E)=P(allergy|E)=最大概率類P(E)=0.089+0.01+0.019=P(well|E)=P(cold|E)=P(allergy|E)=第27/92y-tennisy-tennis例子TemperatureHumidityTemperatureHumidityWindyNNPPPNPNPPPPPNP(n)=P(p)=第28/92P(false|n)=P(false|p)=P(true|n)=P(true|p)=P(normal|n)=P(normal|p)=P(high|n)=P(high|p)=P(cool|n)=P(cool|p)=P(mild|n)=P(mild|p)=P(hot|n)=P(hot|p)=P(rain|n)=P(rain|p)=P(overcast|n)=P(overcast|p)=P(sunny|n)=P(sunny|p)=第29/92X<rain,hot,·P(X|p)P(p)=P(rain|p)P(hot|p)P(high|p)P(false|p)P(p) 3/92/93/96/99/14 =0.010582·P(X|n)P(n)=P(rain|n)P(hot|n)P(high|n)P(false|n)P(n) 2/52/54/52/55/14 =0.018286第30/92 20 第31/92樸素的假定在一個位置上出現(xiàn)的詞的概幸運的是,在實踐中樸素學習器在許多第32/92第33/92·對于測試樣本點x,在集合中距離它最近的的x1。最近鄰分類就是把x分為x1所屬的類別最近鄰規(guī)則的推廣第34/92simMAX(y)MAXxNsim(x,A{xN|sim(x,y)simmax(p(c1|y)

n1

p(c2|y)

第35/92·k=1,A類第36/92第37/92··第38/92 第39/92 第40/92第41/92第42/92 第43/92第44/92第45/92

(OutlookSunnyHumidity(Outlook(OutlookRainWind第46/92第47/92第48/92第49/92第50/92Gain(S,A)Entropy(S)

SS

Entropy(Sv第51/92HumidityNNPPPNPNPPPPPN第52/92S[9,5]

SS

0.949(8/14)0.811(60.048第53/92

第54/92第55/92??

??Gain(Ssunny,Wind)=0.970-(2/5)1.0-(3/5)0.918=0.019第56/92第57/92

第58/92第59/92向前剪枝(forward向后剪枝(backward第60/92第61/92第62/92第63/92TextText第64/92頁第頁第66/92·率第67/92..........第68/92 worminsect第69/92 第70/92第71/92 第72/92SingleLinkCompleteLinkGroupAverage第73/92SingleComplete第74/92第75/92第76/92第77/92第78/92第79/92_ sim(ci,cj_

sim(x,cicj(cic

x(cicj)y(cicj):y1)1) _第80/92s(cj)

__ sim(c,c)(s(ci)s(cj))(s(ci)s(cj))(|ci| (|ci||cj|)(|ci||cj|第81/92第82/92-

1x|c|x第83/92m(L2mL(x,y)(xyi)22L1L1(x,

mm

xi1 x 第84/92選擇k個隨機樣例{s1,s2,…sk}作 對每個樣例xi:將xicjd(xisj是最小的(Updatetheseedstothecentroidofeachsj=第85/92KMeans舉例

Pick

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論